华为“天才少年”破局:智元启元大模型落地 家庭机器人可期?
21世纪经济报道记者陶力 实习生胡梓杨上海报道
昔日的华为天才少年“稚晖君”,又站到了聚光灯下。
3月10日,智元机器人正式发布了全球首个通用具身基座大模型——智元启元大模型(Genie Operator-1,简称GO-1),这标志着具身智能向通用化、开放化、智能化方向快速迈进。
在生成式AI遭遇边际效益递减的当下,具身智能正成为AI技术突破物理世界的关键路径。该模型通过首创ViLLA架构,整合多模态大模型与混合专家系统,使机器人仅需千条以内的视频数据,即可掌握擦拭、倒水等复杂动作,训练成本骤降。
这项突破不仅实现了“一脑多形”的跨本体迁移能力,更通过持续进化的数据回流系统,让家庭服务机器人,首次具备了通过日常交互积累物理经验的可能。
“我们公司使命是运用通用机器人来创造无限生产力,机器人只有硬件本体,那肯定是不够的。将来,AI能力一定是区分整个机器人产品竞争力的核心环节。就像今天的新能源车、手机一样,硬件供应链也会高度整合,在最后比拼的一定是AI能力。”智元合伙人、具身业务部总裁、研究院执行院长姚卯青在当日的沟通会对21世纪经济报道等媒体直言,如果机器人没有自主作业能力,价值是非常有限的。
这个大模型已部署到智元研发的多款机器人本体中。他透露,具身智能的AI研发是公司的战略级投入。
截止到目前,智元机器人已完成了天使轮、A轮、A1轮等多轮融资,其创始人“稚晖君”彭志辉于1993年出生,毕业于电子科技大学信通学院。2020年,他以“华为天才少年计划”加入华为。
2022年离职开启创业后,彭志辉创办的智元机器人已经率先在行业内完成了机器人大规模量产,再用百万级别的数据,进行大模型自主研发。姚卯青表示,在五年后的未来,物理AI能够真正落地家庭场景。随着模型的不断升级优化,机器人被带回家后,人们可以自己进行视教,而不是通过数据采集。
让AI在虚拟世界生成完美图片容易,但在现实世界中,教机器人稳定抓取鸡蛋却很难。因此,当宇树机器人扭着秧歌在蛇年春晚亮相后,瞬间成为智能硬件新晋顶流。
过去的小模型之所以只能停留在实验室而无法走到公众面前,是因为它们无法通过对大规模图文和视频的学习,来构建通用的场景感知和指令理解。
“每一个新场景下的新动作,都需要大量的数据学习,而且成功率不高,不同形态之间的机器人也无法共享数据。”智元具身研究中心常务主任任广辉坦言,这种反差揭示了AI发展的深层矛盾:当数字世界的智能水平逼近人类时,物理世界的笨拙机械臂仍需要工程师逐行输入预设指令代码。
这些现实局限,倒逼着机器人领域技术路线的革新。
智元机器人公布的GO-1基座大模型,展示了突破物理智能瓶颈的全新路径。这个集成了ViLLA架构的4D世界模型,能够将包括时间在内的整个物理世界囊括其中,可以实现小样本泛化。
任广辉举例表示,拿海绵布擦拭有污渍的桌子这一动作,机器人仅需要150条数据就能学会;对于倒水这一相对复杂的动作,仅需1000条左右,而没有搭载GO-1模型的机器人,则需要一万甚至五万条数据。“这就降低了一到两个数量级的采集时间和成本。更重要的是,GO-1模型同一套算法可同时应用于双足、轮式、机械臂等不同形态的机器人。”
从性能来看,GO-1相比已有模型成功率大幅领先,平均成功率提高了32%。经实验发现,在倒水、清理桌面、补充饮料等任务中表现相对突出。
因此,家庭场景的突破更令人期待。未来,机器人能通过日常交互积累物理经验:当扫地机器人第10次撞到桌腿时,它不再重复错误,而是建立空间记忆模型;照料老人的陪护机器人,则通过长期观察学会预防跌倒的预判能力。
这种持续学习机制,正在打破服务机器人“智能不足”的发展瓶颈。
谈及人们普遍关心的家庭机器人,姚卯青表示机器人进入家庭涉及行业安全标准,伴随技术发展,从推进到落地需要五年左右的时间,定价估计在三十万元以上,“学习倒咖啡这一个动作,训练软件的成本可以在万元之内解决,但这并不包含机器人本体的硬件成本。”
物理AI在未来可以覆盖工业、商业、家庭等全方位社会场景,但短期内,智元会聚焦于工业场景,并且已有试点项目在工厂落地。
“数据是模型的燃料。” 姚卯青强调,数据回流系统保证了GO-1模型的“持续进化”特性。有人工审核参与的数据回流系统,会把错误场景或错误动作的数据上报,以确保数据集的质量,后续再加入到模型训练当中。
一直以来,工业场景对数据的要求较高,在互联网上也很难获取。同时,工业场景动作成功率对应门槛也相对较高。但在工业方面,对数据成本的容忍度也更高,人们更加关心最终的落地效果。在模型训练时,几万条甚至几十万条数据都是可以接受的程度。
此外,开源生态建设也成为破局关键。姚卯青表示,AgiBot World开源项目两周之内,一直占据榜首第一的位置,所获好评量,远超Google旗下的类似数据集。这种协作模式大幅降低了行业合作成本与准入门槛。
“生成式AI 的发展是有明确的产业分工的,像数据的采集标注、审核甚至是数据的交易都有一些平台性的机构出现,那么在机器人领域,我认为这也是有机会的。”姚卯青表示,如果每一家都来自己建设场地、投入设备,是一个重复造轮子、重复投资的行为。长期来看的话,可以由个别的几家企业来集中承担公共平台的职责。
针对近日市场上定价9.9万机器人所引发的热度与讨论,姚卯青认为当前阶段,机器人领域应该以价值为导向,而非低价竞争。“我们对AI研发的战略级投入是非常坚定的。智能化今年已经开始规模化量产和交付,相关研发投入可以较好地被分摊掉,不会被显著地转移到终端售价上。”
信达证券认为,AI的发展从根本上推进了人形机器人和自动驾驶等端侧的发展。Grok3/o3-mini等模型展示了对物理定律逐步深刻的理解,而Deepseek相关模型则反映了推理成本的迅速降低。
受此激励,端侧较高级别的智能落地可期,人形机器人或迎来迅速产业化。相较于人形机器人,工业机器人早已在汽车、光伏、物流等多个行业广泛应用。
国家市场监督管理总局数据显示,截至2024年12月底,全国共有45.17万家智能机器人产业企业,注册资本共计64445.57亿元,企业数量较2020年底增长206.73%,较2023年底增长19.39%,呈稳健上扬态势。国家统计局数据显示,2024年我国工业机器人累计产量达到55.6万套,同比增长14.2%。
不过,当行业出现井喷之势,洗牌也会来临 。而AI+大模型的能力成为下一个竞争的关键环节。
姚卯青认为,大模型在机器人行业的应用也会经历一些渐进式的发展,会从一些较为容易入手、结构化场景较为明确的地方,先去进行落地探索。然后逐渐再演化到一些半结构化和半开放的任务和场景,最终真正实现通用人工智能AGI在物理世界的应用。“可能到那个时候,我们真正能走入千家万户,去在家庭中执行各类开放式的指令任务。近两年,我们还是会去集中看一些工业、服务业在商业领域的应用。”
或许,机器人真正走到我们身边仍然需要时间,但步伐已经在加快,行业也被拉到前所未有的高度。
对于智元机器人来说,已实现了年均千台的量产规模,家庭场景依然是其长期目标。诸如倒茶、制作早餐之类的简单任务,未来可能只需要几千元成本即可实现。
“我们用两年时间,走完了别人可能八年都没有走完的路,”姚卯青坚定相信,智能化才是机器人的未来,且未来会持续投入到软硬件一体化研发中。
更多内容请下载21财经APP
网站内容来自网络,如有侵权请联系我们,立即删除!
Copyright © 屯百科 琼ICP备2023011085号-1