在AI原生浪潮推动下,阿里巴巴集团旗下高德地图与通义实验室宣布达成深度合作,并在近日发布的高德地图2025版本中落地多项共建成果。双方围绕语音交互、大模型能力以及Agent等核心方向展开全面协同。
全链路语音共建:更精准、更自然的交互体验
高德地图2025的核心亮点之一是推出业内首个专精出行生活的智能体“小高老师”,它可基于音频、文本输入等多模态方式,与用户直观交互。
在语音能力上,高德与通义实验室语音团队联合打造了覆盖唤醒、识别、理解、播报等环节的全链路能力,助力“小高老师”实现了识别精度和交互流畅度。
双方构建的新一代语音语义感知系统,由高德导航专用ASR(语音识别)模型、通用领域大模型ASR、高德大模型综合理解能力等模型组成,全面覆盖导航、本地生活、日常闲聊三大场景。
大模型底座加持:通义Qwen赋能空间理解
在用户使用过程中,“小高老师”能高效调度高德内部近百种工具,将内外部数据资源整合分析,生成最佳回答反馈和地图交互动作。
支撑这一能力的,是高德和通义共建的大模型簇——该模型簇由多模态空间感知、行为认知、时空意图理解、总结输出交互和反馈观测评估等多个专业模型构成。
通义大模型具备全球领先的预训练规模与语义理解能力。凭借强大的底座能力,通义大模型已成为全球主流的基座模型之一。基于通义Qwen模型的底座能力,高德通过SFT(指令微调)训练,显著提升了其在出行生活场景中的语义理解、上下文感知与响应能力。
智能Agent登场:出行决策化繁为简
在Agent领域,基于高德自研的DeepResearch框架,通义实验室和高德联合开发了地图领域的复杂POI推理Agent,可通过理解多重约束条件、有效使用地图和搜索工具以及整合实时联网信息,为用户提供精准的POI推荐与导航服务。
基于此框架开发的推理Agent具备三大能力:地图领域领先的多维POI推理能力,可实现复杂时空需求的理解以及复杂 POI的解析及处理,支持对事件、地理、参与者、时间、交通、POI属性等多重约束的综合判断;为高德预置了专属地图API、实时天气查询、交通状况监测、POI数据查询API等工具,并能基于POI理解自主调度相关工具,轻松集成新的工具和数据源,以适应不断变化的场景需求;可实现复杂场景下的POI任务处理等。
“模型+场景”深度融合:AI能力落地的行业范式
此次合作,不仅是高德与通义实验室技术能力的叠加,更是生态协同共建的深度实践。
一方面,高德以通义大模型为AI底座,构建了具备理解真实世界能力的空间智能,这不仅赋能高德地图App迭代升级,未来还能驱动智能汽车、智能眼镜、低空飞行等领域的变革。另一方面,通义实验室则通过高德地图这一海量用户场景,推动大模型能力的真实落地与验证,加速其在C端产品中的规模化应用。(高德)