基于 LLM 语义分析的买卖家对话阶段划分与话题提炼
使用大语言模型对每段对话进行语义理解,自动划分销售阶段并提取买家高频话题,全程无需人工标注。
附真实买家语录,帮助理解每个话题的具体含义
每条对话经历了哪些阶段?(● = 经历 ○ = 跳过)
20,442 条对话中:32.2%(6,591条)经历完整四阶段旅程,37.0%(7,567条)跳过协商完成下单。这 37% 由三种主要路径构成:
• 1→2→4 看价即买(16.5%)—— 了解产品+看完报价即下单
• 仅4 直接下单(9.5%)—— 可能是回头客或已在其他渠道沟通好
• 1→4 问即买(9.1%)—— 只问产品就直接下单
| 特征维度 | 跳过协商组 (7,567条) | 正常协商组 (10,003条) | 差异 |
|---|---|---|---|
| 平均对话长度 | 25.6 条消息 | 47.4 条消息 | 短 46% |
| 报价阶段提及价格密度 | 0.53次/对话 | 1.23次/对话 | ↓ 57% |
| 报价阶段提及物流密度 | 0.63次/对话 | 1.36次/对话 | ↓ 54% |
| 包含“直接接受”关键词 | 14.9% | 27.9% | ↓ 47% |
| 包含“老客户”关键词 | 9.9% | 16.7% | ↓ 41% |
“样品”“价格”“数量”等话题在多个阶段重复出现,是买家决策路径的真实映射。
“样品请求”在阶段1 = 探索产品质量;在阶段3 = 条件谈妥后的最终确认。
买家常反复跳跃:问价格→确认规格→又回来问价格。同一行为在不同时机反复出现是常态。
| 行为 | 阶段1 | 阶段2 | 阶段3 | 阶段4 |
|---|---|---|---|---|
| 价格 | 价格询问 17.4% | 含运费总价 30.0% | 讨价还价 32.9% | — |
| 地址 | — | 提供地址 10.0% | 地址确认 3.4% | 确认地址 34.6% |
| 样品 | 样品请求 9.3% | 样品 2.1% | 样品请求 11.4% | — |
| 付款 | — | — | 付款方式 15.6% | 确认付款 23.1% |
| 发货 | — | 发货时间 1.0% | — | 发货时间 10.1% |
① 有效分类覆盖率 97.7%:20,442条对话中,有 19,972条被 LLM 成功分配到至少一个阶段,仅 2.3% 因内容过短或无实质交易信息而未能分类。
② 跨语言翻译 = 0:分析全程保留买家原文(主要为英文),未做任何翻译处理,避免语义失真,确保话题提取基于买家真实表达。
③ 跨阶段重复率 ≤ 9%:经验证,同一消息被分配到多个阶段的情况仅占 9.3%,且其中 90.7% 为系统卡片/短文本(≤ 20字符),真实长文本重复可忽略不计。