Tradestack 是一家总部位于英国的初创公司,其使命是提高贸易企业的效率。凭借一支由建筑和房地产专家组成的团队,他们发现了一个关键痛点:贸易企业的后台任务非常耗时。他们的解决方案是什么?一个由人工智能驱动的助手,可以将创建项目报价所需的时间从几小时缩短到几分钟。
在 LangGraph Cloud 的帮助下,Tradestack
- 在 6 周内为 28,000 多名用户社区构建并推出了 MVP(最小可行产品)
- 获得了首批付费客户
- 通过快速迭代和新的多模态输入及自动化工具,将端到端性能从 36% 提高到 85%
问题:为贸易企业创建报价
贸易企业面临许多复杂性,Tradestack 选择专注于减轻为建筑和房地产项目创建报价的管理负担。例如,为油漆和装饰项目创建报价是一个详尽的过程——这可能包括分析平面图、审查项目图像、估算工作量、计算材料价格以及撰写专业的客户演示文档。
这个过程通常需要 3.5 到 10 小时才能完成一份项目报价。Tradestack 的愿景是将这个时间缩短到 15 分钟以内。
MVP:WhatsApp 助手,用于自动化油漆和装饰项目的报价
Tradestack 的首要任务是通过试验不同级别的认知架构指导来测试其价值主张。LangGraph 使他们能够使用图、节点和边来设计这些架构,同时管理每个节点都可以写入的共享状态。这种设置保持了输入的灵活性(语音、文本、图像、文档),同时生成准确、个性化的客户报价。
鉴于 WhatsApp 的普及,尤其是在非技术用户群体中,Tradestack 选择其作为主要界面。为了产生有意义的业务影响,他们需要可靠地处理通过 WhatsApp 发送的各种输入。这需要识别每个任务所需的技能,并在需要时向用户或专家寻求澄清。
然而,要让 AI 代理系统在具有多样化输入的场景下始终保持高质量的性能并非易事。设计这样的系统存在多个失败点,包括
- 用户输入的类型多样或含糊不清
- 不同用户有不同的起始点和结束点
- LLM 节点进行的规划或路由部分不一致或不准确
Tradestack 的目标是构建一个在能力、多功能性和可靠性之间取得适当平衡的 MVP。
LangGraph 是显而易见的解决方案。Tradestack 团队已经熟悉 LangChain 生态系统,他们重视 LCEL 的抽象和 LangSmith 的跟踪功能,以便快速迭代和性能评估。LangGraph 直观的框架为他们提供了所需的控制,可以设计定制化的推理和内存流程,以满足用户的需求。通过 LangGraph Cloud,他们进一步规模化地改进了代理工作流程,快速迭代并添加了多模态输入,以提供高质量的输出。
通过 LangGraph Studio 快速迭代
借助 LangGraph,Tradestack 尝试了个性化推理,这意味着根据用户偏好定制推理过程,而不仅仅是内容生成。通过利用配置变量,Tradestack 自定义了其认知架构中的指令和路径,并根据特定用例选择子图。这种灵活性使他们能够平衡输入模式(无论是语音、文本还是图像)与最终输出的可靠性。
Tradestack 最初以LangGraph Templates 作为起点,采用了一个分层的多代理系统,其中一个主管节点负责扩展用户查询并根据任务目标创建计划。通过让内部利益相关者访问LangGraph Studio(一个用于代理交互的可视化工作室),他们能够快速识别缺陷,迭代设计并提高性能。他们的团队可以与助手进行对话并并行记录反馈,节省了两周的内部测试时间。
使用 LangGraph Cloud 进行部署
一旦他们的 MVP 准备就绪,Tradestack 就使用LangGraph Cloud 无缝部署了它。作为一个精简的团队,他们需要一个能够轻松处理部署、监控和提交修订的平台。LangGraph Cloud 正是提供了这些功能,使他们能够专注于优化其 AI 代理,而不是基础设施的担忧。
为了确保 WhatsApp 助手界面上用户交互的顺畅,他们利用了 LangGraph 的“中断”功能,并构建了一个自定义中间件来智能地管理双重文本和消息队列。LangSmith 跟踪直接集成到他们的工作流程中,方便审查和评估每一次运行。
LangSmith 还通过强大的测试帮助 Tradestack 团队识别性能差距。通过在 LangSmith 中设置节点级和端到端的评估,Tradestack 可以尝试不同的模型用于规划节点,并查看哪些模型表现最好。例如,他们发现对于规划节点,gpt-4-0125-preview 比 gpt-4o 表现更好,这有助于他们在节点级别进行优化。
通过流式传输模式进行 UX 考量
为了在 WhatsApp 上创造用户友好的体验,Tradestack 精心控制了流式传输给用户的信息量。他们不希望用户因不必要的中介步骤而感到不知所措,因此他们使用了 LangGraph 灵活的流式传输选项,仅显示选定节点的关键消息。添加了一个聚合节点来合并来自各种中介步骤的输出,确保所有通信都保持一致的语气。
人工干预在 Tradestack 的用户体验中也发挥了至关重要的作用。当出现边缘情况时——例如用户请求在英国不可用的材料——系统会触发人工干预。然后,Tradestack 的团队可以通过 Slack 或直接在 LangGraph Studio 中介入来调整对话。 这有助于确保用户的需求得到满足,而不会损害用户体验。
结论
展望未来,Tradestack 计划深化与 LangSmith 的集成,用于微调数据集,并扩展其代理的功能。他们旨在探索语音代理 UX、代理训练模式以及与外部工具的进一步集成,以确保其 AI 解决方案不断发展并为用户提供价值。
您可以了解更多关于Tradestack 的使命,并在此阅读有关如何开始使用 LangGraph Cloud 的信息。有关更多 LangChain 新闻,请在 X 上关注我们,并在我们的更新日志上获取最新的产品更新。