自动驾驶领域正迎来新的技术融合趋势。近日,独立技术研究员简·曼春·王(Jane Manchun Wong)在深度解析Waymo移动应用代码时,发现其正在测试一项尚未公开的功能——将谷歌旗下Gemini人工智能聊天机器人集成至无人驾驶出租车服务中。这项发现源于对应用内部文档的逆向工程,其中包含长达1200余行的系统指令文件,详细定义了人工智能助手在车内场景中的交互逻辑。
根据披露的文档内容,这款名为"Waymo出行助手"的系统被设计为具备多重功能的智能伙伴。其核心能力不仅限于常规问答,还能直接控制车内环境系统——包括调节空调温度、切换照明模式以及播放音乐列表。但值得注意的是,音量调节、路线修改、座椅调整等涉及车辆核心控制的功能被明确排除在权限范围之外。当乘客提出超出能力范围的需求时,助手会采用预设的委婉话术回应:"这项功能我目前还无法实现哦"。
在交互设计层面,开发团队制定了严格的身份界定准则。当被问及自动驾驶技术原理时,助手必须将回答主体明确指向"Waymo Driver系统",而非自身。例如面对"如何感知路况"的提问,正确回应应为:"Waymo Driver采用多传感器融合的方式来感知路况..."这种设计旨在避免用户产生技术主体混淆的认知偏差。
针对敏感话题的应对策略同样值得关注。系统指令明确要求助手不得对实时驾驶事件进行任何主观评价,当遇到交通事故相关询问时,需转移话题而非直接回应。在涉及竞争对手特斯拉或已停运的Cruise公司时,文档规定了特定的回应框架,同时设置了触发关键词自动终止对话的机制。这种严谨的交互设计,反映出企业对技术传播边界的审慎把控。
从功能定位来看,Gemini与Waymo的整合呈现出鲜明的实用导向。除了提供天气查询、地标信息等基础服务,系统还能调用乘客历史乘坐数据实现个性化交互——例如根据累计乘车次数调整问候语。但与消费级聊天机器人不同,其被严格限制在信息提供层面,禁止执行订餐、预约等现实操作,更不具备处理紧急情况的权限。
Waymo官方在回应媒体询问时保持谨慎态度,发言人朱莉娅·伊莉娜(Julia Ilina)表示:"团队持续优化各项功能以提升用户体验,但具体功能的落地仍存在不确定性。"这种表述与特斯拉形成鲜明对比——后者与xAI合作的Grok聊天机器人已明确定位为"车载对话伙伴",支持长时记忆和上下文关联的深度交互。
技术文档显示,Gemini的语音交互被要求使用简洁口语,避免专业术语,单次回应需控制在1-3句话内。这种设计哲学与自动驾驶系统的安全理念一脉相承——在确保功能可靠性的前提下,追求最小化干预的用户体验。随着测试的深入推进,这种人工智能与自动驾驶的技术融合,或将重新定义未来出行场景中的人机交互范式。










