Outshift 是思科的孵化引擎,致力于推动“智能体互联网”、量子计算和下一代基础设施等新兴技术的创新。Outshift 的平台工程团队提供基础平台服务,以加速各种孵化项目。
平台工程师管理着复杂的、分布式的云原生 SaaS 环境,其中涉及多个异构系统。在这些系统中监控和诊断问题通常需要快速地在这些运行时环境、遥测系统和文档站点之间定位信息。
Outshift 那个小而强大的平台工程师团队,在开发新功能以推动平台发展的同时,还要处理频繁出现且从访问管理到基础设施配置的开发者请求,这导致了
- 漫长的等待时间:简单且频繁的请求处理耗时数天才能完成。
- 认知负荷增加:由于在工具和工作流程之间不断切换上下文。
- 运营效率低下:高价值的工程任务被日常平台维护所优先。
JARVIS:AI 平台工程师
为了实现 **10 倍的生产力提升**,思科 Outshift 平台工程团队开发了 JARVIS,这是一个 AI 平台工程师,被设计为一个 **分布式多智能体系统 (MAS)**。
JARVIS 使用 LangGraph 进行可扩展且确定的智能体工作流编排,并通过开源标准协议 AGNTCY Agent Connect Protocol (ACP) 进行连接,以实现跨系统无缝的智能体间协作。
JARVIS 的主要功能
知识管理
JARVIS 集成了平台知识库——包括文档、策略、Jira 和代码仓库——使用 **检索增强生成 (RAG)** 处理非结构化数据,使用 **GraphRAG** 处理结构化数据,从而从平台信息中提取可操作的见解。
自助服务能力
JARVIS 自动化了许多常用的开发者任务,例如 CI/CD 上线、云资源配置和开发者沙箱环境设置——极大地缩短了周转时间。
代码生成
JARVIS 通过混合机器学习方法,将自然语言输入转换为 K8s manifest 和基础设施模板,从而简化了 Kubernetes 的部署。
无缝的用户体验集成
JARVIS 将智能体 AI 能力直接暴露在熟悉的开发者界面中——包括 Jira、Backstage、Webex 和 CLI——允许开发者在不改变现有工具或习惯的情况下与自主工作流进行交互。
JARVIS 背后的智能体蓝图
JARVIS 的开发是基于 AGNTCY 构建面向“智能体互联网”的弹性多智能体应用的四阶段方法,这是一个开放、可互操作的智能体间协作平台。
1. 发现
我们利用专门的第一方和第三方智能体映射了关键平台工作流,为多智能体系统奠定了基础。
2. 组合
利用 LangGraph 和 AGNTCY Agent Connect Protocol,我们设计了灵活、模块化的工作流,让智能体能够跨分布式环境无缝协作。
3. 部署
JARVIS 在我们的云原生生态系统中运行,由 AGNTCY Workflow Server 提供可扩展的执行和协调能力。
4. 评估
通过 LangSmith 和 agentevals 的持续跟踪、基准测试和反馈循环,我们优化了智能体的行为,以实现持续的改进。
这种方法使得 JARVIS 模块化、可扩展,并能随着我们不断增长的平台需求而发展。
开发者如何使用 JARVIS:真实界面实操
为了最大化可访问性和采用率,JARVIS 已集成到多个开发者界面中
- Jira:开发者可以通过 Jira 工单直接将任务分配给 JARVIS AI 平台工程师。JARVIS 会自主执行请求,并在需要时寻求更多输入。
- Backstage:嵌入我们内部开发者门户的一个聊天助手,允许开发者无缝触发工作流并检索平台服务。
- Webex:一个安全的、对话式的界面,提供实时通知、任务更新以及与 JARVIS 的直接消息交互。
- CLI:开发者可以通过命令行与 JARVIS 交互,以轻松配置沙箱应用程序、部署基础设施和自动化重复性任务。
通过在开发者已有的工作环境中提供服务,JARVIS 推动了采用,同时提高了平台可用性和响应能力。
以下是 JARVIS 在实际应用中的一些示例
将 Jira 任务分配给 JARVIS AI 工程师
内部开发者门户聊天界面:用户通过 JARVIS 请求 LLM 密钥
LangGraph Studio 展示多智能体工具调用
JARVIS 在 Outshift 的影响
JARVIS 正在为 Outshift 的平台工程带来显著的生产力提升。
- 过去需要一周才能完成的任务,例如设置 CI/CD 流水线,现在可以在 **不到一小时** 内完成。
- 资源配置(例如 S3 存储桶、EC2 实例、LLM 访问密钥)现在是 **即时** 的,将过去需要半天才能完成的任务缩短到 **几秒钟**。
- 得益于 JARVIS 自主引导开发者和检索所需信息的能力,开发者与平台工程之间的日常任务往返沟通已被 **消除**。
- 组织现在能够以相同团队规模处理显著更高数量的请求,同时减轻了倦怠感并提高了整体效率。
构建 JARVIS AI 平台工程师的关键学习
- **“智能体互联网”** (IoA) 释放了多智能体系统的真正潜力:平台工程的未来在于多智能体系统,其中第一方和第三方分布式智能体的无缝集成能够自动化复杂平台工作流。
- 像 **AGNTCY Agent Connect Protocol (ACP)** 这样的开放标准,能够实现跨异构系统的可靠的智能体间通信,而 **LangGraph** 等框架则提供可扩展、确定的工作流编排。
- 围绕 **四阶段**——发现、组合、部署和评估——构建多智能体系统,可以实现智能体的可发现性,促进智能体间的协作,推动重用,并简化复杂、确定的多智能体系统的创建。
- **无缝的用户体验集成对智能体工作流至关重要。** 将智能体能力直接嵌入现有开发者工具——Jira、CLI、开发者门户——对于采用至关重要。将 GenAI 驱动的智能体输出与传统界面相结合,可以确保用户直观地与复杂工作流进行交互,而无需改变日常习惯。
- **持续评估和基准测试可确保可靠性。** 要交付值得信赖的智能体系统,需要持续的跟踪、监控和性能评估。使用 LangSmith 等跟踪解决方案和 agentevals 等评估框架,使团队能够分析智能体推理模式、检测不一致性,并优化系统性能,以确保大规模的高准确性。
平台工程中智能体 AI 的未来
Outshift 正在开创将智能体 AI 融入平台工程的先河——构建 AI 智能体能够放大人类潜力、增强协作并加速创新的生态系统。他们与 **JARVIS** 的合作只是一个开始。他们正在突破 AI 驱动平台可能性的界限,为“智能体互联网”创造新的基础。
要了解更广泛的生态系统如何发展,请访问 agntcy.org——Outshift 团队正在那里帮助构建协作层,使 AI 智能体能够无缝协同工作。