文/周雄飞大财配资
情绪价值,目前已成为车圈追逐的热词。
这不仅因为通过在场景或者产品中提供情绪价值,可以激发消费者下定购车的欲望,而且还能让自身的智能汽车产品具备“活人感”,从而体现产品和技术等领域的优势,可谓是一箭双雕。
相比于智能驾驶,在很多人看来智能座舱更适于让情绪价值这个概念具象化。就像地平线CEO余凯说的那样:“智能辅助驾驶提供功能价值,智能座舱提供情绪价值。”
那么,这样的智能座舱会是什么样的?对于这个问题,腾讯智慧出行副总裁、腾讯智慧出行负责人钟学丹认为需要提供一些基础功能之外也希望在使用的过程中,让用户更愉悦,有更好的人性化的体验。
为此,他们推出了一个名为“随行chat”的产品,简言之是一个形式类似于陪伴聊天的智能体,具备简单的情绪感知和长期记忆的能力,支持车企定义陪伴聊天的角色需求,消费者也可以选择自己喜欢的角色。
飞说智行在前段时间举办的腾讯全球数字生态大会上,体验了随行chat,其中大财配资有很多个角色供选择,可以选偏严肃的角色为我解读新闻,也可以与偏娱乐的角色一起吃瓜,甚至还可以让这个智能体来陪伴小朋友等等,满足不同场景需求。
包括随行chat全能陪伴智能体,腾讯发布的新一代智能座舱解决方案TAI 6.0还包括本地生活智能体、出行探索智能体、出行连接智能体和AI地图导航智能体。
基于端云协同能力,消费者在车上就可以体验买咖啡、点餐、订旅游门票,手车互联制定旅游线路以及全方位智能陪伴等功能,从而做到钟学丹口中的“就像拥有了‘有趣贴心的助理’和‘聪明的领航员’一样。”
就像很多科技大厂“不造车,帮助车企造好车”一样,腾讯他们在帮车企打造好产品的同时,也想要帮助车企们用好AI的能力来降本提效。
通过建立汽车行业大模型,腾讯他们已经在研发、制造和销服等造车全流程,给予车企们助力。以营销服务环节为例,飞说智行就在腾讯全球数字生态大会智慧出行展台上,看到了AI工具链帮助一线销售服务购车用户的实际场景,涵盖前期沟通、解答用户问题、跟踪购车服务流程等全场景。
在这次大会上,腾讯也展示了他们在具身智能领域的探索进展。
今年6月,腾讯的Robotics X实验室和福田实验室联合发布了具身智能工具链——Tairos平台,它以模块化的方式提供大模型、开发工具和数据服务的具身智能软件平台,通过即插即用的方式,面向具身智能行业开放。
换句话说,腾讯也要帮助具身智能行业“造好机器人”。按照腾讯介绍,截至目前,Tairos已经与越疆科技、乐聚机器人、帕西尼感知科技、擎朗智能、众擎机器人科技、宇树科技等多家具身智能企业探索合作。
在飞说智行看来,腾讯布局具身智能领域,也是顺水推舟的事情,因为他们在智能辅助驾驶和自动驾驶领域有着多年的积累和迭代。
“腾讯现在基于过去十多年在自动驾驶对应的算力也好、数据闭环能力,包括仿真积累的一些技术和经验,在和科技公司、OEM一起在做对应的具身智能领域的探索和转型。”腾讯智慧出行副总裁李博这样对飞说智行表示。
在今年腾讯全球数字生态大会举办前夕,包括飞说智行在内的小规模媒体受邀与腾讯智慧出行副总裁、腾讯智慧出行负责人钟学丹,腾讯智慧出行副总裁李博进行了深度的对话交流,以下是对话内容,略有删减和修改:
1、座舱、智驾和运营管理,车企该如何用好AI?Q:腾讯的座舱Agent是基于端云协同能力,那么对于用户的一个需求,如何判定是需要车端处理的简单问题大财配资,还是需要协同云端处理的复杂问题,这背后有明确的规则或者标准吗?
钟学丹:现在用端侧来讲不可能是去满足所有的场景服务,需要云端辅助一些能力,今天在参数量2B的模型下,对大部分的服务都是可以很好地理解和完成的,同时我们在端侧也会有一个模块,去负责处理一些复杂意图和复杂的场景,需要云端模型作为支持。
比如说我们需要一些实时云端、联网搜索的时候,就会调动到两端的能力来去完成,不是说用一个简单规则来区分,在端侧做哪一些,而是在端侧云端相互协同起来。
Q:相比于之前的TAI, 升级后的TAI 6.0更加具备多模态感知的能力,这意味着会收集更多车内乘客的一些信息,再加上咱们有端云协同的机制,在数据安全TAI6.0做到了哪些升级或者说一些创新?
钟学丹:首先我们高度重视用户的隐私和数据安全,也有很多数据手段来保证用户的隐私以及数据安全,我觉得这是我们对用户的基本保障和基础体验的底线。
多模态感知,更多的是对外部世界的一些感知数据,包括对场景的感知,对位置的感知以及车身的一些信号的感知,对于这些信息,并不会被收集,也不会被提取,它本质上是一个提示词的输入而已,帮助座舱Agent解决用户的问题。
Q:现在汽车行业都聚焦“情绪价值”这个词,对于车企布局的这个方向,腾讯是如何帮助车企,来打造他们各家有特点的情绪价值的功能?
钟学丹:今天大家对消费者在体验上的关注度越来越高,除了提供一些基础功能之外也希望在使用的过程中,让用户更愉悦,有更好的人性化的体验。可能每家都会有不同的表达和理解,所以我们认为主要是要让用户感到好用,以及针对这里的一些产品体验,如何体现我们自身的一些价值。
比如说我们推出的随行chat的产品,它就是基于角色扮演模型的一个支持打电话、车上陪聊拟人化的一个产品,能够支持用户对不同技能,解决用户在车上不同话题的聊天,同时能够体察一些情绪,长期记忆的保持,去个性化做到一种“活人感”的陪伴体验。
车企也可以自己定义它自己需要的陪聊角色,可以更灵活按照车企的需求定义它的角色需求。在这个方面,这种角色并不是简单的聊天,就像我们刚才讲的一个体贴助理的角色,帮消费者解决实际的驾车过程中间遇到的各种问题。
Q:现在大家布局座舱都讲Agent上车,这其中就包括腾讯,那么Agent上车给智能座舱带来的最核心的价值是什么?以及腾讯AI Agent跟其他家的Agent有怎样的不同?
钟学丹:Agent概念随着大模型运用得越来越深入,应该各个领域都在展开。对于座舱来说,Agent本身也在改变座舱体验,毕竟在驾驶的过程中,还是会有很多是要专注在驾驶的场景上,传统的手机App应用形态在座舱内的体验上还是有很多的不足。
相对来说,Agent新的形态对座舱的体验会有一个比较大的改变,就像我们说智驾是多了一个聪明的司机,那么Agent的意义就在于说多了一个有趣以及聪明的助理。
当用户可以与车进行更充分的互动,这种互动的浅层次表现为轻松的对话和良好的应答,也可以与用户交流,感觉毫无障碍。更深层次可以帮助用户提供各种知识和帮助用户解决一些切实的需求,这是最大的不一样的地方。
在座舱Agent上,一方面会借助一些在端侧的能力,使Agent的驱动能及时响应和效率方面更好;另一方面,Agent会变成一些具体的服务应用以及内容的关联,不管是结合腾讯的生态资源、内容资源等组合,可以很好地打破原有用户的服务边界,打造一些跨应用以及满足复杂需求,这可能是腾讯座舱Agent的一些特色。
Q:端云协同这块,对于智驾行业都已经谈到了一些像VLA、世界模型等等,这些技术路线对于云端大模型会有一个什么新的要求吗?
李博:腾讯的端云协同,一方面是端侧,可能是一个2B的,可能是2.5B,可能是一个7B的以及以后可能是一个14B的;云端上来讲,可能是一个更大的,需要趋近于类似于满血DeepSeek几百B的大模型,它们是一个协同的关系。
其中,云端模型其实刚才说了可以几百B的大模型,接近对应的无限算力和超大模型的算力,可以训练复杂对应的计算信息,这样和车端相协同就具备及时响应的端侧的模型,又有很复杂场景的需要复杂计算能力的云端的能力。
那端云结合,无论是在座舱还是我们在讲的VLA基于智驾场景的复杂场景下,都能够形成比较好的一个对应的协同的场景。
Q:今年4月腾讯推出座舱端侧大模型,几个月下来车企(客户)对于这个模型的反馈怎么样?接下来这个模型会朝着更大的参数规模演化,还是说完善其他方面的能力?
钟学丹:推出端侧大模型后,有很多主机厂对此非常感兴趣,之前在端侧相对来说能跑的模型还是会比较少一些,所以大家依赖云端模型的能力,对于算力以及端侧的响应和数据安全都还有比较大的挑战,对于车企来讲,应该还是一个非常有需求的场景。
另一方面,我们也在持续地更新我们的端侧模型,这次我们更新到1.8B带推理能力的一个端侧模型,也会在更小的参数以及更强的能力上去增强这种能力。
我们看到端侧不只是语言模型,未来它也会驱动像VLM多模态的一些视觉模型,帮助我们理解一些感知的数据跟座舱的服务之间,以及车内数据之间的一些关系和能力。
同时,也包括像未来语音测试也可以在端侧做端到端的语言能力,这些可能都是我们在端侧模型上持续去加强和提升模型方面的一个能力。
除了模型以外也会涉及到数据的能力的增强,如何把一些跟出行场景和服务相关的数据,也去对模型进行优化和训练,使得模型在一开始就比较适应在汽车和出行场景的这样一些需求,这是我们在做的一些事情。
Q:现在都讲说智能座舱Agent上车,未来它会有一些什么新的趋势,或者会向什么样的新的功能特点转变?
钟学丹:大家今天看到的还是一些早期的阶段,我相信未来还会有很多新的变化,核心的本质最终都是要回归服务于人的,这些交互和完成,首先是一种跨应用、跨服务的场景,它打破了我们传统的服务和边界,更多的去关注用户希望去解决的一些更具体的问题,我觉得这是一方面。
另一方面,Agent确实需要更多的懂场景,懂用户,不仅是本地快速的响应基础需求,还需要在云端调用更丰富的知识,生态和服务,实现跨应用、跨场景的无缝的结合,我们也可以想象一下,在感知用户情绪后的一些变化之后,我们可以主动在车的氛围灯以及音乐、LBS和生活能力的一些提前形成的规划等等,我觉得这些都是大家会想到的一些会相对美好的应用场景。
但这些应用场景真正落地会依赖于很多方面,包括我们车身的能力以及传感器的能力,以及如何把这些能力通过新的服务和协议的方式无缝连接起来,我觉得这里可能要做的事情还会有很多。
Q:现在世界模型还有VLA的发展看起来大家对地图的依赖会更小一些,那在腾讯看来,现在智驾普遍需要什么样的地图,现在新技术的发展对于地图产生了什么样的影响,或者大家对地图有什么新的要求?
李博:无论是端到端、VLA,从技术手段上来说没有一定说谁胜谁劣,对于有图和无图也是一样的,很多时候我们会发现很多时候是在炒概念,是无图会显得更有优势,有图的怎么样,说到底通过对应的训练数据也好,算法也好,怎么样让对应的自动驾驶的能力达到最优,用户体验达到最优这才是关键。
地图其实是作为能力对应的一个补充,数据的一个补充,我们要看的是在这个过程之中怎么让这里面产生的成本更低,训练出来更好的对应的模型,用更少的数据采集或者是怎么样,成本更低的数据采集也好,能形成对应的算法,其实反而不用纠结到底有图好,无图好或者是怎么样的。
比如车的端侧算力没有这么强,是不是需要在云端还有一个图层的概念,去跟自动驾驶算法相辅相成,能够解决一些Bad case的一些问题,能够提升自动驾驶的安全性的一些问题等等,这些都是图对于自动驾驶领域的一个帮助性的点。
2、开放生态,是做好具身智能的基础?Q:相比于自动驾驶,具身智能难度会有更多维度,比如一个挑战就是缺少更多的一些高质量或者多场景的数据,进行算法训练,无论说是真机或者是仿真训练,对于腾讯来说如何解决行业的问题,或者说是像帮助车企造好车一样,怎么样帮助机器人企业去造好机器人?
李博:具身智能要比自动驾驶难得多,无论是对于数据的要求还是对于算力的要求,还有对应的算法的能力,都是一个几何性的提升。
腾讯现在也是基于过去十多年我们在自动驾驶对应的算力也好,数据闭环能力,包括仿真积累的一些技术和经验,再和科技公司、OEM一起在做对应的探索和转型。
包括大规模数据管理和更加规模大的并行计算,场景重构,包括我们说缺数据,我还要去做更多的仿真数据,实际上对于具身智能场景来讲,很多场景是远远不够的,所以我们要造更多的类真实数据来使对应的算法有对应的数据可训练。
今年6月份腾讯也发布了对应的Tairos开放平台,这是我们在下一段面向具身智能公司做的开放平台,它也有对应自动驾驶团队对于具身智能的一些要求融入其中,比如说多模态的交互,室内外一体化的导航的能力,还有4D的空间的重建仿真的能力。
这些其实都融合到了Tairos平台,现在也是对合作伙伴进行开源开放,同时我们也是联络了行业内的多家的生态公司去完善具身智能的整个体系,还有一些跟行业的合作伙伴在具体的具身智能的场景在做基础能力的一些打磨,让更广泛的场景进行高效的落地。
Q:目前具身智能行业中有很多玩家也在做开源的工具链,那么在这样的一个行业的竞争态势下,腾讯有哪些优势或者是一些独特的生态位呢?
李博:腾讯首先可以基于自动驾驶领域积累的端云一体化的闭环工具链的能力,包括去覆盖对应的从数据采集,数据合成,数据标注,数据挖掘,模型训练到仿真的全流程的这些能力,这是能够作为具身智能开发的一个基础。
就比如我们的4DGS、时序建模这些技术本身就是我们的一些技术优势点,同时我们来讲也完成了对物理世界完全的重建编辑生成,通过视觉点云激光雷达等区域,去重构网格融合的多层次的数据融合能力。
可以构建包括动态交通、天气变化、光线条件等多种变量的可编辑的虚拟环境原来对应的能力,这不仅是支持L2到L4自动驾驶端到端的训练,本质上也是我们For具身智能潜质化积累的能力。
我们对于数据的高质量要求,腾讯其实是原先在做地图的时候,我们也积累了大量的地图的数据,本质上也是真实世界对应的映射,我们的数据平台也把这些数据进行了统一的接入、标注,那它也可以解决我们很多现实世界在具身智能的一些问题。
以及,腾讯跟合作伙伴的合作也是打造了一个比较好的基础,比如说我们跟文远知行已经在做从数据采集到模型部署,再到全栈的AI数据闭环的对应能力,我们在这里面也都在做对应的一些解决。
我们做的多样化的数据采集的服务也满足了很多不同场景算法的需求,可以说是为具身智能提供了比较准确和丰富的适配性的数据,其实这样的话也打通了我们原来所说的具身智能数据上云对应的通路,我觉得这也是其中腾讯做这块的优势点。
Q:现在关于具身智能的数据好像海外的人形具身行业更多的是依靠遥操来收集数据,国内是逐渐倾向于仿真,腾讯认为现在哪种数据采集方案更加可行?
李博:我们依然认为具身智能处于一个初级阶段,数据是远远不够的,哪怕说灵巧手的操控已经比自动驾驶的复杂度要高很多,你左手有五个手指,你右手有五个手指,我们来算算对应的维度,这个复杂度已经是超高了,他们为什么会去遥感的控制,本质上是在收集数据,他没有对应的数据。
其实对于国内来讲,大家也都在做对应的数据收集,如果我们到达一个更复杂场景,那可能是说单一场景或者工厂制造的场景,便利做得越多,便利的可能性覆盖度越高。
但实际上毕竟它的维度是远远超于自动驾驶场景,更多的来讲在这里面采集数据的成本是陡然向上的,我们更期待这里面通过仿真合成一些数据,然后不断的自我学习,来减少我们采集数据的成本,这才是未来真正造具身智能大的覆盖场景的时候,能够现实落地的一个点,否则采集成本太大。
一定是走到仿真数据的,否则的话,大家成本谁也花不起,最后出来机器人的成本也没有办法使用到我们日常场景,因为要把价格打下来。
Q:目前做具身智能供应链的一些公司,他们会选择和市场化已经很成熟的伙伴合作,比如说割草机、扫地机等等,大家会觉得这个变现能力更快一些,腾讯也会走商业和前沿并行的方案,还是说更着重于做更加前瞻性或者前沿的人形机器人?
李博:腾讯是不做具体的硬件的,你会发现其实我们一定是和科技公司也好,原来的自动驾驶公司像具身智能转行的自动驾驶公司也好,还是车厂做具身智能也好,我们其实是跟这些公司合作的,腾讯知道自己擅长的点是什么。
腾讯原来在自动驾驶积累的工具,以及一些数据的能力大财配资,仿真的能力,我们是提供这些能力的,包括工具链等等,跟这些企业其实是一个合作关系,至于他们应用在什么场景,腾讯都是愿意去支持的,我们并不会做自己的硬件机器人。
方道配资提示:文章来自网络,不代表本站观点。