—— 汽车产业链供需平台 ——
下载盖世APP

首页 > 资讯 > 智能网联 > 物理AI迎“ChatGPT时刻”,英伟达全栈重构

物理AI迎“ChatGPT时刻”,英伟达全栈重构计算未来

盖世汽车 2026-01-06 16:57:38
分享

“计算行业的每一层技术堆栈,都正在被重新构建”

在2026年拉斯维加斯CES的聚光灯下,英伟达创始人黄仁勋抛出了一个意味深长的开场白。这句话如同投入平静湖面的巨石,激起的涟漪迅速扩散至整个科技界。

更引人注目的是,这场万众期待的发布会未提及任何新款游戏GPU——这个曾经让英伟达崛起的基石业务。这一反常的安排,与台上热烈讨论的“物理AI”形成了鲜明对比。

这无异于一个明确的信号,宣告了一次精心的战略转向:英伟达的商业重心,正从AI芯片向物理AI及AI时代的计算基础设施提供商转向。

这家以图形处理器起家的公司,正将其庞大的AI技术赌注押注于一个更具颠覆性的领域——让人工智能不仅能够理解和生成内容,更要能够理解物理定律、进行因果推理,并在现实世界中安全、可靠地行动。

发布会上,黄仁勋甚至直言“物理 AI 的 ChatGPT 时刻已然到来”。这意味着,人工智能的历史性浪潮正从“认知与生成”的层面,涌向“理解与行动”的深水区。

从“认知”到“行动”的范式革命

本次发布会一开场,黄仁勋便定下基调:“大约每十到十五年,计算机行业就会经历一次重置。”从大型机到个人电脑,再到互联网、云计算与移动设备,每一次平台迁移都催生了全新的应用生态。

而当前,黄仁勋指出有两个平台转移在同时发生:第一,未来要在AI之上构建应用程序;第二,软件的运行方式和开发方式也发生了根本性改变

他用一句简洁有力的宣言概括了这场巨变:“你不再‘编程’软件,而是‘训练’软件;你不再在CPU上运行它,而是在GPU上运行它。”

这意味着,传统的、预编译的、静态执行的软件时代正在终结,取而代之的是一个能够理解上下文、每一次交互都从零开始动态生成的智能时代。整个AI计算技术栈,正如他所形容的那个“五层蛋糕”(即技术栈)——能源、芯片、基础设施、模型和应用,“每一层现在都在被重新发明”

在这场史诗级的重构中,英伟达将其战略雷达锁定了一个超越当下文本与图像生成、触及现实世界根基的前沿——物理AI。黄仁勋明确将其置于关键位置:我们知道大语言模型并不是唯一的信息类型。宇宙中凡有信息之处、凡有结构之处,我们都能教一种语言模型去理解那种信息,理解其表征,并将其转化为一种AI。其中最重要的一种是物理AI,即能够理解自然定律的AI。” 

所谓物理AI,包含两层深刻内涵:其一,是让AI获得对物理世界如重力、摩擦力、因果关系等的基本常识;其二,是让AI具备基于这种常识与真实世界进行安全、有效交互的行动能力。

这意味着,人工智能接下来发展的主航道,将从擅长处理信息符号、进行认知与生成的“虚拟智能”,坚定地迈向能够理解物理规律、并执行实体行动的“行动智能”。

ScreenShot_2026-01-06_154341_207.png

图片来源:英伟达直播截图

而驱动这一范式革命的,是来自产业端对机器行动能力的迫切刚需,以及技术端突破数据瓶颈的必然追求。

比如在自动驾驶领域,车辆真正需要的其实并非在云端生成一段完美的驾驶描述,而是在暴雨夜晚的十字路口,毫秒之间做出安全的并线决策。在制造业中,机器人需要适应从未见过的零件形状或突如其来的装配顺序变化,而不是机械地重复预设轨迹。这些需求共同指向一点:AI必须走出虚拟的“舒适区”,进入充满不确定性的真实世界。

然而,训练这样的AI面临一个根本性挑战,即如何让AI能理解物理世界运作的常识,比如物体恒存性、因果关系。这些内容对于人类来说虽然都是常识,但对AI来说完全是未知的。

要解决这一根本性难题,黄仁勋认为,必须创建一个系统,让AI能够学习物理世界的常识、规律。“当然也能从数据中学习,当数据相当稀缺,并且需要能够评估AI是否有效,这意味着它必须在环境中进行模拟。如果AI没有能力模拟物理世界对其动作的反馈,它怎么知道自己执行的动作是否符合预期?”

这意味着,还要找到一种超越单纯数据堆砌的新方法。英伟达的解法是,构建一个由三台计算机组成的基本系统——一台用于训练AI模型,一台用于模型推理,另一台则用于物理模拟,这是实现一切物理AI工作的基础。最终通过这三台计算机的深度协同,共同构成物理AI从认知到行动、从虚拟到现实的工业化“流水线

实现“物理AI”的全栈引擎

宣告战略转向固然重要,但将其变为现实则需要坚实的技术支柱。

英伟达在CES上展示的,并非单一产品的更新,而是一套从底层硬件、核心软件到开发范式的完整全栈引擎,旨在为物理AI提供工业化的基础。

硬件基石是代号为“Vera Rubin”的新一代AI超级计算平台。这一平台的命名源自发现暗物质证据的天文学家Vera Florence Cooper Rubin,某种程度上也寓意着英伟达探索未知物理世界的雄心。

不过,Rubin平台的革命性,远不止于纸面上相比前代Blackwell平台提升数倍的推理性能和训练性能——Rubin的推理性能比Blackwell提升了5倍,训练性能提升3.5倍,或降低十倍的推理成本,其真正的突破在于架构设计理念的转变:它是专为万亿参数模型的海量推理而生的“动力引擎”

ScreenShot_2026-01-06_153935_617.png

图片来源:英伟达直播截图

该平台同时集成了Vera CPU、Rubin GPU、NVLink 6交换机、ConnectX-9 SuperNIC、BlueField-4数据处理单元和Spectrum-6以太网交换机六类芯片,不仅硬件集成度达到了新高度,而且通过芯片级的协同设计,在一个Vera Rubin机架内部构建了高达每秒240TB的GPU间互联带宽,旨在系统性解决长期运行AI推理任务时面临的算力、网络和存储瓶颈。

其中Rubin GPU,作为Rubin平台的核心,搭载了第三代Transformer引擎,NVFP4推理算力达到50 PFLOPS。

据黄仁勋透露,目前Rubin系列芯片已经全面投产,将于今年下半年推出,重要应用于物理AI训练、机器人模拟、自动驾驶仿真等领域,其订单规模已达3000亿美元。其中,首批使用Rubin的云服务提供商包括AWS、谷歌云、微软等。

在软件核心层面,承载“物理常识”的是多款开源模型,包括Cosmos世界基础模型、Alpamayo自动驾驶AI、Isaac GR00TN 1.6人形机器人视觉语言动作(VLA)模型等。

Cosmos旨在赋予机器人类似人类的推理与世界生成能力,该模型通过海量视频和仿真数据,可以学习基本物理规律。据黄仁勋介绍,Cosmos目前已经用海量视频、真实驾驶与机器人数据,以及3D模拟做过预训练,理解世界是怎么运行的

ScreenShot_2026-01-06_154813_448.png

图片来源:英伟达直播截图

Alpamayo则代表了自动驾驶AI的范式进化。作为首个面向自动驾驶的开源大规模推理VLA模型,Alpamayo的核心能力是“思维链”推理,能够理解复杂场景中的因果关系并解释其决策逻辑。比如面对混乱的施工场地或突然闯入的行人,不再仅仅是像素到方向盘的直接映射,而是能够像人类一样进行多步推演:识别理解周围环境、推断意图、评估风险、生成决策。

值得一提的是,面向自动驾驶领域,此次黄仁勋除了发布Alpamayo系列开源 AI 模型,同时还推出了面向高保真辅助驾驶开发、完全开源的端到端仿真框架AlpaSim和多元化的大规模辅助驾驶物理 AI 开放数据集,共同构建了一个自我强化的开发闭环,用于推理型辅助驾驶堆栈的开发。

不过,Alpamayo 并不是直接部署于车端的模型,而是作为大规模教师模型,供开发者调优、蒸馏,成为其完整辅助驾驶技术栈的核心基础,任何汽车开发者或研究团队均可在此基础上进行研发。

黄仁勋透露,首款搭载英伟达完整自动驾驶技术栈的梅赛德斯-奔驰CLA车型将于2026年第一季度在美国上路,第二季度计划在欧洲上路,下半年在亚洲上路。另外,捷豹路虎、Lucid 和 Uber 等,以及包括伯克利 DeepDrive 在内的自动驾驶研究社区,也将依托 Alpamayo 加速推进安全的推理型 L4 级部署进程。

开源、联盟与标准之争

手握强大的技术栈,英伟达的下一步棋是构建无可撼动的生态系统。其战略核心是一套以开源为矛、以联盟为盾、以平台化为终极目标的组合拳。

这步棋的深层意图远不止于技术共享。通过将Cosmos、Alpamayo等核心模型与工具链开源,英伟达正在执行一项宏大的商业计算:降低整个行业进入AI时代的门槛,从而将自身定义为行业事实标准的制定者。

其逻辑链条清晰而有力。如果物理AI如同英伟达所描绘的那样是下一个浪潮,那么最大的市场将不是少数几家科技巨头采购GPU训练大模型,而是成千上万的机器人公司、汽车制造商、物流企业乃至农业科技公司,都需要构建和训练自己专属的物理AI模型。

基于这一背景,开源核心工具能够迅速吸引最大规模的开发者涌入英伟达构建的生态体系。当全球的工程师都开始使用CUDA、Omniverse、Cosmos进行开发时,这些工具及其底层依赖的英伟达硬件,便成了无可撼动的“标准配置”。

因此,开源在此成为了一种最高效的生态锁定和标准推广手段,最终目的仍是扩大其在硬件与平台层面的统治力。值得关注的是,英伟达不仅开源模型,还开源用于训练这些模型的数据。比如在自动驾驶领域,英伟达便开源了物理 AI 开放数据集,该数据集包含超过 1700 小时的驾驶数据,覆盖广泛的地理区域和环境条件,涵盖推动推理架构发展所必需的罕见且复杂的真实世界极端场景。

“因为只有这样,你才能真正信任模型的产生过程。”黄仁勋表示。从这个维度,英伟达也是一个前沿AI模型构建者。

而与行业领导者的战略联盟,则是将这些技术实力与生态势能转化为商业现实的加速器。

本次演讲中,黄仁勋同时宣布,梅赛德斯-奔驰CLA将成为首款搭载Alpamayo的车型。这家以严谨和工艺著称的汽车巨头,其认可不仅仅意味着一份订单,更是对英伟达物理AI技术安全性、可靠性与成熟度的最强有力验证。

这种合作构建了一个正向商业闭环:头部客户的落地案例降低了其他企业的采用风险,从而吸引更多伙伴加入生态,丰富的生态应用又反过来增强英伟达平台的吸引力与不可替代性。

至此,英伟达的平台化野心已完全浮现——不再满足于仅仅扮演“AI芯片供应商”角色,而是致力于成为迈向物理AI时代的“全栈计算基础设施的定义者和提供者”。英伟达提供的是一整套“芯片+模型+工具链”的完整解决方案,其目标是让任何公司构建物理AI应用时,都能像在iOS或Android上开发App一样,自然而然地选择英伟达的全套技术栈。

这场生态棋局的终极胜利,将是让“英伟达生态”与“AI开发”成为同义词。

物理AI繁荣背后亦有挑战

英伟达点燃的物理AI之火,注定将重塑多个产业的版图。

首当其冲的是自动驾驶、机器人及工业制造。在黄仁勋看来,物理AI的ChatGPT时刻已然到来,机器已经开始具备理解真实世界、推理并付诸行动的能力。在这一变革下,无人驾驶出租车将是最早受益的应用之一,而Alpamayo为智能汽车注入的推理能力,将使其得以应对罕见场景、在复杂环境中安全行驶,并解释其驾驶决策,这将为安全、可规模化的自动驾驶奠定了基础。

对于机器人行业,物理AI则意味着机器人将获得通用的“行动智能”,能够快速适应新任务和新环境,从而从高度定制化的工厂固定岗,走向更为灵活的仓储、物流、零售乃至家庭服务场景,其商业模式也将从单纯的硬件销售,转向“机器人即服务”。

不过,随着竞争疆域的拓展,产业竞争的维度也变得前所未有的多元和复杂。

过去的AI竞争,很大程度上是围绕芯片算力与能效的“硬竞赛”。而在物理AI时代,竞争将同时在多个维度展开:一是世界模型能力的竞争,即谁的基础模型对物理规律的理解更深刻、更通用;二是仿真生态完备性的竞争,即谁的虚拟世界更逼真、工具链更易用、开发者社区更活跃;三是现实数据闭环的竞争,即谁能更高效地将真实世界产生的小数据,用于迭代和优化仿真模型;最后才是传统的算力竞赛。

英伟达通过全栈布局,正试图在所有维度同时建立优势。

然而,通向物理AI的道路并非坦途,机遇总与挑战并存。最核心的技术挑战在于“模拟与现实之间的鸿沟”——无论仿真多么精细,都无法完全复现真实世界的所有噪声和意外,如何确保在虚拟世界中训练出的智能体,能安全无缝地迁移到现实,仍是待解的难题。

此外,当AI实体在物理世界中自主行动时,其安全性与伦理问题被急剧放大,可解释性、故障冗余和责权界定都需建立全新的标准与框架。

结语

展望未来3-5年,我们将看到物理AI从技术演示走向规模商用的关键节点。

而英伟达,正凭借其超前的战略洞察、全栈的技术储备和精明的生态布局,试图将自己从AI浪潮的“卖铲人”,升级为整个物理智能时代的“总建筑师”与“规则制定者”。

这场从认知到行动的范式革命,不仅关乎一家公司的命运,更将重新划定人、机器与物理世界交互的边界。

关注我们更多服务平台

添加社区公众号、小程序, APP, 随时随地云办公尽在掌握

联系我们
盖世汽车社区 盖世汽车中文资讯 盖世汽车会议 盖世汽车研究院 盖世大学堂 Automotive News Global Auto Sources 友情链接 Copyright@2007-2022 All Right Reserved.盖世汽车版权所有
增值电信业务经营许可证 沪B2-2007118 沪ICP备07023350号 沪公网安备 31011402009699号 未经授权禁止复制或建立影像,否则将追究法律责任。