—— 汽车产业链供需平台 ——
下载盖世APP

首页 > 资讯 > 行业 > 智元发布全国首个通用具身基座模型ViLLA,

智元发布全国首个通用具身基座模型ViLLA,开启具身智能新纪元

盖世汽车 2025-03-10 12:47:08
分享

2025年3月10日,国内人工智能领军企业智元科技在北京国家会议中心正式发布"智元启元大模型(Genie Operator-1)",这是我国首个面向复杂物理世界的通用具身智能基座模型。该成果突破性地提出"Vision-Language-Latent-Action(ViLLA)"融合架构,标志着中国在通用人工智能领域取得重大技术跃迁。

783b76de42ac8937490188a3c0f1fb38.jpeg

图片来源:智元机器人

重构人机交互范式 ViLLA架构实现多模态深度融合

区别于传统单模态大模型,启元模型通过三层异构神经网络构建感知决策闭环:视觉模块采用动态注意力机制处理环境信息,语言引擎集成多轮对话上下文记忆,而独创的Latent Action空间则将抽象指令转化为可执行的动作序列。在测试中,模型展现出跨场景任务迁移能力——面对"整理杂乱书桌"指令时,系统能自主规划路径、识别物品类别并完成精准抓取摆放,全程无需人工干预。

全场景落地加速 智能终端迎来革命性升级

基于启元基座开发的具身智能终端已进入规模化测试阶段。在工业质检领域,搭载该模型的机械臂可将零件缺陷识别准确率提升至99.7%,同时将操作效率提高3倍;智能家居系统中,家庭服务机器人可通过三维语义理解实现"擦桌子时避开装饰品"等精细化动作。更值得关注的是医疗护理场景,经过专业数据训练的机器人已能协助完成导诊分诊、康复器械操作等专业任务,为老龄化社会提供解决方案。

产学研联动构建生态壁垒

智元科技联合清华大学、中科院自动化所等机构成立"具身智能联合实验室",计划年内开放百万级参数级的开源训练框架。公司CEO李峰透露:"我们将持续投入超20亿元研发资金,年内推出支持多国语言、适配主流硬件的开发者套件,与合作伙伴共建具身智能产业生态。"随着国家"新一代人工智能发展规划"的深入推进,智元科技此次突破或将加速我国在通用人工智能赛道上的国际竞争力。

关注我们更多服务平台

添加社区公众号、小程序, APP, 随时随地云办公尽在掌握

联系我们
盖世汽车社区 盖世汽车中文资讯 盖世汽车会议 盖世汽车研究院 盖世大学堂 Automotive News Global Auto Sources 友情链接 Copyright@2007-2022 All Right Reserved.盖世汽车版权所有
增值电信业务经营许可证 沪B2-2007118 沪ICP备07023350号 沪公网安备 31011402009699号 未经授权禁止复制或建立影像,否则将追究法律责任。