—— 汽车产业链供需平台 ——
下载盖世APP

首页 > 资讯 > 活动 > 德赛西威:Native AI 开发新范式

德赛西威:Native AI 开发新范式

盖世直播 2026-07-03 16:49:52
分享

硬件能力的升级与电子电气架构的集中化演进,正在为AI在车端的规模化落地提供坚实土壤。2026年6月25日,德赛西威AI实验室负责人刘怡初在第八届AI智能座舱大会上表示,随着单算力成本快速下降、多模态感知能力日趋成熟,模型与硬件正进入“双向奔赴”的阶段。与此同时,用户对智能座舱的期待已从“可用”向“好用”和“更懂我”跃迁,可持续学习、自我进化、从被动响应走向主动服务,成为Native AI的核心特征。

在他看来,端云协同是这一轮变革的关键路径。云端模型聚焦复杂任务的通用规划能力,端侧则通过场景感知与Skill化封装,成为云端能力的延伸与补充。随着Agent形态从单点功能向持久化、主动化演进,算力架构也从座舱域控走向中央域控与AI Box的柔性扩展,一个三位一体的技术底座正在成型。从“AI Ready”到“AI Native”的范式转变,最显著的区别在于动作空间从封闭集走向开放集,系统具备了自适应与自进化的能力。

围绕这一方向,德赛西威重点推进Agent运行时底座、端侧推理框架与交互仿真平台三大模块的构建。推理框架聚焦多平台适配、上下文压缩与解码加速,在带宽与算力受限的端侧环境中提升推理效率与稳定性;交互仿真平台则通过因果推理与生成式模型,模拟真实座舱交互与长尾场景,为Agent的快速验证与迭代提供支撑。刘怡初表示,德赛西威将持续以开放全栈、快速落地的价值主张,推动AI座舱从炫酷场景走向可规模化交付的工程实践。

image.png 

刘怡初博士 | 德赛西威AI实验室负责人

以下为演讲内容整理:

技术驱动力与需求侧变革:智能座舱为何需要原生AI

从技术驱动力来看,硬件能力的升级使得模型能够从云端逐渐走向端侧。架构从分布式向集中式的演进,以及硬件单算力成本的快速下降,为AI在端侧上车提供了丰厚的技术土壤。与此同时,多模态感知能力的成熟、端云协同能力的增强,以及模型知识密度的不断增加,使得模型能力与硬件能力形成了双向奔赴的趋势。技术拐点已然成熟。

从需求侧来看,汽车被当作移动的智能终端,用户体验的需求被重构。传统座舱对“可用”的要求,已进化到“好用”乃至“更懂用户”的更深层次。德赛西威认为,原生AI的特性主要体现在两点:一是可持续学习,能够自我优化迭代进化,这需要通过底层的记忆模块来实现;二是从被动的单点功能执行,进化到主动的服务。

Agent运行时底座:构建安全高效的端侧中枢

在原生AI开发的技术层面,德赛西威认为有三个重要模块,首先是Agent运行时底座。考虑到新一代智能体拥有更强的权限范围和操作能力,若直接部署在域控或云端均存在一定限制,因此将其部署在AI Box上具备三大优势。第一,能够将座舱域控的关键信号、车控服务等能力进行Skill化集成,但其权限受到编排、审核与审计,不会对整车安全造成威胁。第二,将端侧模型以及舱外感知的能力进行Skill化。第三,AI Box通常仅利用其GPU或NPU进行模型推理,将Agent运行时部署其中,也能充分利用其CPU资源。此外,它还能连接云端大模型进行复杂的任务规划,并将云端生态服务进行Skill化定制,从而起到整体中枢的作用。

在车端,Skill化与PC端存在显著区别,车端有更强烈的安全审核需求。因此,Skill Contract需要具备至少八个层面的协议能力,包括描述前置条件、执行策略以及日志审计,以确保权限审计管理协议在车端执行的安全性。以一个样板场景为例,当用户输入“洒水车过来后关窗”的指令时,云端规划会复用哨兵感知链路的摄像头和AVM输入链路,通过Prompt重配更改端侧感知模型的目标调整和触发条件配置,最终完成自动关窗的任务。整个过程涉及从HMI到HAI的授权与策略,并在确认权限审计与流程状态后,在车端完整执行。用户只需输出指令,系统便复用了哨兵链路和端侧模型的感知能力,实现了端侧模型作为云端模型触手和端侧模态感知补充的功能,同时规避了模型数据出舱的问题。

端侧模型推理框架:突破硬件限制的关键技术

第二个重要模块是端侧模型的推理框架。该框架旨在让模型在不同硬件平台和异构算力架构上稳定运行,并具备多平台多模型调度、上下文压缩编译、资源占用分段式服务化、高优先级任务打断等增强特性。模型层面支持LLM和VLM。对于端侧模型而言,30B参数量的模型是一个较为可用的门槛,其通常采用MoE架构,单次推理激活的参数可能在3B左右。

在一次完整的大模型推理流程中,从Query输入、Encoder编码、Prefill及KV Cache更新,到最终的Decode逐Token循环输出,德赛西威会进行PD计算图分离、KV Cache全生命周期管理,以及在Decode层面采用投机采样等加速技术,以突破硬件带宽限制。该推理框架将大语言模型主干与其他多模态进行了解耦,多种模态实现Token统一后输入主干进行推理,这使得适配不同模态模型时,能够更快地使模型上车。在工程端,该框架能节省首响速度,提升受带宽限制影响的Decode速率,并降低内存占用。

在KV Cache层面,德赛西威主要进行了压缩和复用。压缩通过低比特量化减少RAM占用,这对于控制AI Box的BOM成本至关重要。KV Cache的复用则主要在多轮对话及Agent编排的特定提示词场景下,对大量缓存进行复用和压缩。在多模态流式编码与填充方面,为了减少首响延迟,采用了分块输入的方式,有效降低了TTFT。在上下文压缩方面,结合Agent开发链路,通过微调模型时使用DSL等技术,压缩输出长度和词表,使端侧模型构建Agent时的上下文长度得以精简。在大模型推理的解码阶段,德赛西威主要通过SSD自推理、传统投机解码和块级扩散解码三种方式来突破显存带宽限制。自推理对显存友好,落地成本较低;投机解码需训练好小模型以提高命中率,理论上限更高;块级扩散解码的理论提升范围更大,有望进一步提升吞吐量。

座舱世界模型:交互仿真的新范式

第三个重要模块是Agent开发完成后的交互仿真平台。类比智能辅助驾驶领域从分段式到端到端的技术演进,座舱的交互仿真也需要一种新的测试方法。对于一段式模型,无法像分段式那样在ASR后或TTS前进行文本校准和监测,因此需要一个“座舱世界模型”来模拟用户与座舱之间的交互。它的作用是进行闭环仿真座舱、生成长尾稀有数据以及自动化验证待测模型或Agent。

其核心架构是一个因果Agent,能够推理舱内的故事线并进行因果演化。系统使用多个Text-to-Image模型,多步可控地生成舱内和舱外的场景渲染图片和传感器输入数据,并通过因果推断Agent输入车身信号数据,不同类别的数据需做到模态对齐和时间同步。对于端到端方案,输入直接为音频,系统使用TTS模型模拟多麦克风输入、主驾多云区环境噪音等。因果Agent会接收反馈,闭环推进下一时间点的场景,完成整个闭环仿真链路。该平台的用途主要包括座舱场景测试,由因果Agent持续推进故事线,模拟用户口语化的打断与纠错;生成难以采集的长尾Corner Case数据;由于其生成式模型的特性,动作操作范式也是开集路线,覆盖率更广。整体生成链路从极简指令类别的补全,到多维度补全图像和故事线细节,再到任务生成,最后通过大模型驱动多轮交互和待测模型的模拟评估。在此过程中,会进行模型对齐人类偏好的工作,并通过保留口语化、倒装句、自我纠正等特征,使仿真环境更贴近真实座舱场景。

展望与挑战

德赛西威目前在智能座舱领域的产品矩阵较为全栈和丰富,通过AI大模型、用户交互设计以及EEA架构方案,依托座舱融合的计算方案,融合生态组合形成丰富的产品线。其价值主张是开放全栈、快速实现,旨在与业界同仁共同推动下一代AI座舱的发展。未来,如何在保证安全的前提下,进一步优化端侧模型的性能与效率,以及如何构建更逼真、更全面的座舱世界模型以应对日益复杂的交互场景,将是行业共同面对的挑战。

(以上内容来自德赛西威AI实验室负责人刘怡初于2026年6月25日-26日在第八届AI智能座舱大会暨2026第四届车载显示与感知技术革新峰会上发表《Native AI 开发新范式》主题演讲。)

关注我们更多服务平台

添加社区公众号、小程序, APP, 随时随地云办公尽在掌握

联系我们
盖世汽车社区 盖世汽车中文资讯 盖世汽车会议 盖世汽车研究院 盖世大学堂 Automotive News Global Auto Sources 友情链接 Copyright@2007-2022 All Right Reserved.盖世汽车版权所有
增值电信业务经营许可证 沪B2-2007118 沪ICP备07023350号 沪公网安备 31011402009699号 未经授权禁止复制或建立影像,否则将追究法律责任。