
18 通用人工智能的曙光:生成式人工智能技术的产业影响
在近年来汽车科技革命的推动下,消费者被逐渐培育成熟
并越发挑剔,对汽车这一下一代移动终端提出更高的智能
化和个性化需求。汽车“第三生活空间”的形态定位逐步显
现,要求车企洞察用户的想法和偏好,并充分将云计算、
5G、大数据等新兴技术运用于车辆研发与运维体验。
在软件定义汽车的趋势下,汽车行业的发展受AI技术推动
显著。汽车行业的 AI 技术应用于诸多产品功能,如驾驶辅
助、车辆诊断、语音识别等。而生成式人工智能里程碑式的
技术变革和大规模应用爆发,将通过制造进步、增强自动
化、乘客体验和安全等应用,重塑汽车领域的方方面面。
加速自动驾驶的技术跃迁与应用落地
自动驾驶技术的研发和商业化面临路况环境复杂、长尾场
景多、安全容错率极低等诸多挑战,而生成式人工智能将通
过赋能自动驾驶的感知、规划决策和系统测试等环节,逐一
击破关键痛点,助推自动驾驶的场景化落地。
在感知环节,实现图像自动标注。
随着自动驾驶发展进入深
水区,对数据规模提出更高需求。而数据标注当前高度依赖
人工标注,存在成本高昂、质量参差、产能不稳等问题。生成
式人工智能通过自监督、预训练的认知逻辑,学习大量的图
像数据和人工标注结果,理解图像的特征和涵义,自动生成
准确化标签,达到数据标注的降本提质。当前国内外基于生
成式人工智能技术进行数据标注的领先企业有Scale AI、
毫末AI等。此外,特斯拉、小鹏等自动驾驶技术领先的主机
厂也开始将大模型引入自主研发的全自动标注系统,其中
特斯拉的自动标注系统可取代 500 万小时的人工作业量。
在感知环节,辅助BEV大模型在城市场景落地。
高级别辅助
驾驶向城市场景拓展是自动驾驶厂商当前的工作重点。而
BEV(Bird's-eye-view, 鸟瞰图)大模型正取代高精地图成
为城市场景的新技术路线。BEV大模型将车身摄像头、雷达
等信息统一转换至全局视角下的3D场景,构建实时动态的
“高精地图”。而生成式人工智能将进一步使自动驾驶的场
景感知具备“补全”能力,缓解BEV大模型在城市复杂路况
的车端感知局限性。例如,在雨雪天等拍摄模糊情景下,生
成高分辨率图像,为智驾决策提供保障。
在决策规划环节,提升策略应对能力。
基于人类反馈的模型
微调,可以将人类司机应对道路状况的真实驾驶行为用于
自动驾驶策略的决策纠正,提升复杂环境下的驾驶策略安
全性与流畅度。国内厂商毫末AI推出DriveGPT,主要用于
提升自动驾驶的认知决策能力。
在路测环节,优化仿真测试环境。
自动驾驶系统在真实路测
存在事故风险、测试鲁棒性不足、测试周期长等问题,而生
成式人工智能可以通过真实素材学习与视角渲染进一步缩
减真实和虚拟世界的鸿沟,从扩充训练数据集(注入罕见的
危险场景,如道路障碍物、极端天气、传感器故障等)、模拟
其他交通参与者(如行人、其他车辆的不同反应模式)等方
式,提高自动驾驶系统泛化能力。此外,可通过重建场景使
测试车辆与周围环境持续交互,优化自动驾驶系统的行为
预测算法和决策能力。2023年6月,Wayve发布了用于构建
虚拟路测场景的生成式模型GAIA-1。
推动智能座舱向主动式交互阶段演进
随着消费者对汽车“第三生活空间”的认知逐渐深化,智能
座舱成为车企的“兵家必争之地”。具体来看,未来智能座舱
的交互(直觉化、智能化与个性化的座舱交互)、环境(如显
示/声/光等)、控制(内饰的智能化)、空间(整体座舱空间的
灵活再分配)等将成为车企在突围战中的致胜关键点。生成
式人工智能通过赋能座舱的交互性和操作性,重塑座舱空
间,带来乘驾体验的焕新升级。
语音交互和智能助理。
大语言模型使车内语音助手在多轮
人机对话中构建深度的上下文理解能力,赋予拟人化、情
感化的表达风格,摆脱以往对话风格程式化的缺陷。通过
将语音系统与车内控制模块打通,语音系统的角色可升级
为智能助理,实现语音指令、导航规划、日程安排、信息查
生成式人工智能将催化汽车产业的智能
技术革命