3 月份在 Sequoia 的 AI Ascent 会议上,我讨论了代理的三个局限性:规划、用户体验和记忆。您可以在此处观看该讲座。由于代理的用户体验是一个涉及范围非常广泛的话题,我们将讨论分为三部分。请参阅关于聊天用户体验的第一篇博客文章和关于环境用户体验的第二篇文章。这是我们关于代理用户体验的第三篇文章,重点关注电子表格、生成式和协作式 UI/UX。
这是我关于代理用户体验的第三篇文章,但我可能还会写十篇——随着我们共同探索构建和与代理交互的最佳方式,有很多内容值得探索。代理的 UI/UX 领域是我最感兴趣的领域之一,在接下来的几个月里,我将密切关注其中的创新。
为了总结关于代理 UI/UX 的讨论,我将重点介绍三种鲜为人知但最近越来越受欢迎的用户体验。
电子表格用户体验
在过去大约 2 个月里,我看到的一种用户体验模式是电子表格用户体验。今年早些时候,我第一次看到这款产品是在Matrices(一款原生 AI 电子表格)发布时。

我很高兴看到这一点。最重要的是,电子表格用户体验是一种超级直观且用户友好的方式,可以支持批量工作负载。每个单元格都成为自己的代理,可以离线研究特定事物。这种批量处理使用户能够同时扩展和与多个代理交互。
这种用户体验还有其他好处。电子表格格式是一种非常常见的用户体验,大多数用户都熟悉它,因此它能很好地融入现有工作流程。这种用户体验对于数据丰富化(一种常见的 LLM 用例,其中每一列都可以代表需要丰富化的不同属性)来说是完美的。
从那时起,我看到这种用户体验在几个地方出现(Clay 和Otto 是其中的两个绝佳例子)。
生成式 UI
“生成式 UI”这个概念可能有几种不同的含义。
一种解释是真正的生成式 UI,其中模型生成要显示的原始组件。这类似于WebSim等应用程序。在后台,代理大部分时间都在编写原始 HTML,从而使其能够完全控制显示的内容。然而,这种方法在生成的 HTML 质量方面可能存在很大的变异性,因此最终结果可能看起来有点混乱或不完善。

另一种更受约束的生成式 UI 方法涉及以编程方式将 LLM 响应映射到不同的预定义 UI 组件。这通常通过工具调用来完成。例如,如果 LLM 调用天气 API,它就会触发天气地图 UI 组件的呈现。由于渲染的组件并非真正地被生成(而是被选择),因此生成的 UI 会更加完善,但能生成的内容灵活性较低。
您可以在我们这里的视频系列中了解更多关于生成式 UI 的信息。
协作式用户体验
一种较少被探索的用户体验:当代理和人类一起工作时会发生什么?可以想象一下 Google Docs,您可以在其中与团队成员协作编写或编辑文档——但其中一位协作者是代理。
我认为该领域的主要思想家是Geoffrey Litt和Ink & Switch,他们的Patchwork 项目是人类-代理协作的一个绝佳示例。

协作式用户体验与前面讨论的环境用户体验相比如何?我们的创始工程师 Nuno 重点介绍了两者之间的关键区别。
环境用户体验和协作式用户体验之间的主要区别在于并发性。
- 在协作式用户体验中,您和 LLM 通常同时工作,“互相借鉴”彼此的工作。
- 在环境用户体验中,LLM 在后台持续工作,而您(用户)则专注于其他事情。
这些差异也转化为构建这些应用程序时不同的要求。
- 对于协作式用户体验,您可能需要显示 LLM 所做的零散工作。 (这介于单个 token 和较大的、特定于应用程序的工作(例如文本编辑器中的段落)之间。)一个常见的要求可能是拥有一个自动化的方法来合并并发更改,类似于 Google Docs 管理实时协作的方式。
- 对于环境用户体验,您可能需要总结 LLM 所做的工作或突出任何更改。一个常见的要求可能是触发来自其他系统中的事件的运行,例如通过 webhook。
我们为什么会考虑这个问题?
LangChain 并非以 UI/UX 为重点的公司而闻名。但我们花了很多时间思考这个问题。为什么?
我们的目标是尽可能轻松地构建代理应用程序。人类与这些应用程序的交互方式极大地影响了我们需要构建的基础设施的类型。
例如,我们最近推出了LangGraph Cloud,这是我们用于大规模部署代理应用程序的基础设施。它具有多种流模式,支持“双重文本”用例,以及异步后台运行。所有这些都直接受到我们看到的不断出现的 UI/UX 趋势的影响。
如果您正在构建具有新颖或有趣 UI/UX(例如非流式聊天)的应用程序,我们非常乐意在hello@langchain.dev 听取您的意见!