汽车语音交互还有多大可能?-天天速看料
记者 | 甘文嘉
(资料图)
图片来源 | 企业官方
看似普通的语音交互,却是汽车交互中应用得最多的方式,市场渗透率超过86%;看似简单的技术,含金量却很高,涉及大数据、云计算、人工智能等多项前沿技术。在完全自动驾驶来临之前,语音交互仍是车内最便捷、最安全,最受用户欢迎的交互方式。
作为“软件定义汽车”的先驱和典型,目前,语音交互有哪些良好体验?还有多大可能?近日,国际车载智能语音巨头cerence赛轮思首席执行官stefan ortmanns博士来到上海拜访客户,stefan在接受记者采访时表示:“我们将持续创新,将语音能力高举高打并引领未来,打造一种完全多模态、多传感器、基于人工智能的最直观的体验。通过更智能的语音助理,不仅提升舒适性和便捷性,还通过主动和被动功能提高驾驶安全。”
语音交互更接近真人
stefan表示,语音交互能力的提升将对座舱交互生态发展起到核心作用。当前,已经有量产车型可以实现语音连续对话等功能,不过在语音识别和语义理解方面还有很大的提升空间。
语音按钮和唤醒词长期以来都是用户与语音助手开启对话的激活方式。cerence just talk全时免唤醒让人和座舱的语音交互更接近人与人之间的自然对话,使交互变得自然、流畅、愉悦和高效率。
启动cerence icc多座椅跨区通讯系统后,开车不用回头就可以轻松地和第二、第三排乘客对话聊天。新一代语音增强技术采用了新型超定向波束,不但增强了自适应控制噪音分离,还优化了三排座位的语音交互质量。
cerence tour guide助力梅赛德斯-奔驰直观的mbux智能人机交互系统接入互动旅游内容,将专业导游内容直接、无缝地带进车内,并结合 cerence look多模视觉语音交互技术,实现车内外视线所及的多模态交互。比如,当你开车经过上海大厦时,你不知道这个建筑物的确切名称,你可以说“告诉我更多关于这个建筑物的信息”。
cerence evd警铃侦测系统可以感知到来自车辆后部的紧急车辆,并提示驾驶者重新接管驾驶任务,做出安全的避让动作。
多模态融合
智能座舱是汽车智能化的标志之一,也是各家车企争夺消费者的主战场。超大中控屏幕、零重力座椅、巨幕观影、环绕立体声、卡拉ok、游戏等各种功能应有尽有。随之而来的问题是:一是消费者学习成本上升,功能使用不方便。二是驾驶员操作中控屏,手眼并用存在安全隐患。智能座舱的核心在于交互形式。业内人士认为,智能座舱应该从“堆配置、堆功能”中做“减法”,同时改变目前以触控为主,语音为辅的交互方式。
在stefan看来,通过智能语音助理结合传感器数据,将实现更多车辆控制功能,大幅提升车载体验。
用户拿着大包小包离开汽车时,可以直接使用语音指令关闭后备箱或车门。上车前调整座舱温度,夏天车内先降温,冬天车内先加热。如果你在车里想和车外的人说话,但基于太冷、太热、不安全,或不方便降下车窗、走出车外等原因,你可以通过 cerence exterior vehicle interaction车内外通讯功能一一实现。
作为一个虚拟副驾驶,cerence co-pilot可以分析语音、视线、手势和触摸输入,以及汽车传感器信息,利用实时数据、内置智能、用户偏好和车辆传感器信息实现一系列创新功能,并在他们提出请求前主动发起交互,让语音助理从被动的出行伙伴变成主动的副驾驶。例如,它能够实现车上购物和支付、汽车维护提醒等功能,满足出行过程中的基本需求等。从车载助理到副驾驶,从以驾驶者为中心的智能座舱延伸到沉浸式数字座舱,意味着从对话式ai扩展到多模态al交互。
chatgpt引入座舱
眼下,有越来越多的车企正在将chatgpt概念引入座舱。stefan表示,一个真正的数字座舱智能语音助理,不仅可以提升安全和生产力,还能为驾驶者带来更多乐趣。
今年4月,cerence car knowledge进行了全面升级。car knowledge利用与chatgpt类似的生成式ai和大型语言模型(llms),为驾驶者提出的问题提供上下文感知和个性化的答案。例如,驾驶者可以询问:“我可以远程启动我的车吗?”“我忘带了钥匙,想远程启动我的车。”……所有这些问题都会从用户手册中的相同信息获得一致的答案;但是,每个答案都会根据驾驶者提出的具体问题使用生成式ai回答。由于答案只从oem提供的数据中生成,并根据特定汽车的型号及配置定制,因此排除了在网上搜索类似问题的不确定性,这让驾驶者对答案的准确度和可信性十分放心。
驾驶者和乘客的客户体验,以及为oem厂商实现轻松整合和差异化是赛轮思秉持的两个开发重点。car knowledge还可以将oem数据直接导入大型语言模型以实时更新内容,为驾驶者提供可控的、定制的、个性化的体验。目前,已有一家大型北美oem厂商和一家大型德国oem厂商采用了car knowledge。
cerence browse则是一种崭新的搜索引擎级知识问答体验,通过车载语音助理智能回答,如poi(兴趣点)、特定领域的信息、名人或重要人物知识点等。
上观号作者:上海汽车报
标签: