谷歌在Google Cloud Next 25大会上,开源了首个Agent开发套件—ADK。这也是OpenAI之后第二家大厂发布的标准化智能体SDK。
ADK能帮助开发人员极大简化开发超复杂流程的智能体,从大模型选择、自动化流程编排、测试到应用部署可一站式完成,并且支持双向音频、视频、MCP和最新的A2A协议。
例如,通过ADK开发一个跨平台的语音客服智能体,大概只需要100多行甚至更少的代码就能全部完成。再也不用像以前那样,切换不同平台API,模型选择或交互逻辑编写复杂代码,极大提升了开发效率。

开源地址:https://github.com/google/adk-python
ADK简单介绍
ADK架构以Python为主,在参数定义、模型集成、工具整合和指令驱动方面非常好用。
例如,下面这个案例只用了6行代码,就完成了一个简单的问答智能体开发。咱们只设置了使用的模型、智能体名称、功能描述、指令驱动和工具实例。其他的管理状态、协调工具调用以及和底层大模型的交互全部由ADK完成。
简单来说,用ADK开发就有点像拼乐高积木一样,喜欢哪块就拼哪个完全释放你的天马行空想法,再也不用为工具和底层技术发愁了。

虽然ADK是谷歌开源的,但在大模型兼容方面还是非常灵活的,除了谷歌的Gemini系列模型之外,还支持Anthropic、Meta、Mistral AI、AI21 Labs、CAMB.AI、Qodo等200多个第三方开闭源模型。
ADK的亮点之一便是轻松开发复杂智能体,支持多层级结构组合的智能体实现复杂的协调和委派。开发者可以构建一个主智能体来处理主要任务,并将特定子任务委派给其他专业智能体。

简单来说,就是让主智能体指挥其他智能体来执行具体的任务。例如,你是一家电商公司需要开发客服智能体。希望能自动处理订单查询、商品推荐、售后服务等多种服务。
传统的方法会非常繁琐,你需要为不同的业务编写不同的逻辑代码并,且优化、重构也很麻烦。通过ADK你可以直接定义4个智能体,主体负责接收用户问题,并根据问题类型委派给相应的子智能体;订单查询智能体,专门处理与订单相关的问题,如订单状态、物流信息等。
商品推荐智能体,根据用户的历史购买记录和浏览行为,推荐相关商品;售后服务智能体,处理退换货、退款等售后服务问题。
上面这些只是为大家简单讲解,其实实际用ADK开发更简单高效,因为它还集成了搜索、地图、代码执行、服务等很多实用工具,也支持LangChain、CrewAI、MCP等第三方服务。
更详细的示例开源地址:https://github.com/google/adk-samples
谷歌ADK详细文档:https://google.github.io/adk-docs/get-started/tutorial/#step-1-your-first-agent-basic-weather-lookup
Agent Engine
为了帮助开发者更快地将智能体部署到实际应用中,谷歌还发布了Agent Engine。
Agent Engine可以处理智能体上下文、基础设施管理、扩展复杂性、安全性、评估、测试和监控等一系列任务,并且与ADK结合使用时,支持使用任何框架构建的智能体的部署,无论使用的是ADK、LangGraph、Crew.ai还是其他Agent框架。

Agent Engine还支持短期记忆和长期记忆,而不是每次从空白开始。可以更好的管理会话,智能体能够回忆起过去的对话和偏好,从而提供更加个性化和连贯的用户体验。
此外,Agent Engine还提供了使用Vertex AI的全面评估工具来衡量和改进智能体质量。通过Vertex AI的Example Store或根据实际使用情况微调模型,可以优化智能体性能,确保它们在现实世界中的有效性和可靠性。
电商价格优化公司Revionics通过ADK开发了一个多智能体,旨在助力零售商依据自身业务逻辑制定价格策略,既保证价格具备竞争力,又能维持利润空间,同时精确预测价格变动带来的影响。
ADK简化了多智能体间的转换与规划流程,例如,能够精准判断何时在专业智能体和工具之间进行切换,从而将Revionics的定价AI与智能体相结合,实现整个定价工作流程的自动化。

雷诺集团首席数据官和人工智能负责人Laurent Giraud表示,他们通过ADK开发了一款智能体,该智能体能够确保在电动汽车驾驶者最需要的地方安装充电桩。
能协助数据分析师充分利用地理、分区和交通数据,为关键的电动汽车基础设施投资提供参考并确定优先级,在最大程度方便驾驶者的同时,减轻团队的工作负担。
目前,谷歌刚开源ADK几天在Github已经超过5000颗星,非常受开发者的欢迎。
(文:AIGC开放社区)