更多精彩 >

星动纪元端到端原生机器人大模型ERA-42正式亮相,引领具身大模型进入灵巧操作时代

2024-12-23 12:32:36   来源:华夏晚报  作者: 

摘要:这是业界首次仅通过同一个具身大模型就实现了五指灵巧手像人手一样使用多种工具完成上百种灵巧复杂操作任务,展现了ERA-42行业领先的通用、灵巧操作能力。

导语:近期,星动纪元端到端原生机器人大模型ERA-42正式亮相,即“纪元原生机器人大模型”,寓意着不断探索宇宙万物的终极答案,展示了其与自研五指灵巧手星动XHAND1结合后的灵巧操作能力,已学会了使用不同工具完成100多种复杂灵巧的操作任务,并且持续在同一个模型下学习新的技能。例如,拿起桌上螺钉钻钻紧螺钉、用锤子敲打钉子、将水杯扶正后再往水杯中倒水等任务。

图片1.jpg

基于ERA-42,星动XHAND1能用不同工具完成多种灵巧操作新任务

这是业界首次仅通过同一个具身大模型就实现了五指灵巧手像人手一样使用多种工具完成上百种灵巧复杂操作任务,展现了ERA-42行业领先的通用、灵巧操作能力。模型不需要任何预编程技能,完全基于其强大的泛化和自适应力,能在不到2小时内通过收集少量数据就学会执行新的任务。同时,ERA-42还在快速不断学习更多新技能中。

图片2.jpg

基于ERA-42,星动XHAND1可完成100多种精细化、智能化的五指灵巧手操作任务

ERA-42也是世界范围内首个真正的五指灵巧手具身大模型,开启了具身大模型的通用灵巧操作时代。

1. “真正”的具身大模型才是开启通用具身智能体的密钥,需要具备以下三个要素:

一是统一一个模型泛化多种任务和环境:通过构建一个统一的原生模型,融合视觉、语言、触觉和身体姿态等全模态信息,实现对不同任务和环境的泛化能力。

二是端到端:从接收全模态数据,到生成最终输出(如决策、动作等),通过一个简洁的神经网络链路完成。该过程无需人为设计特征、预编程或干预处理步骤,使得具身智能体能够实时适应不同任务和环境,显著提升灵活性与开发效率。

三是Scaling up(规模化):真正的统一的端到端算法才允许模型通过持续的数据积累实现自我完善,使得具身大模型在数据量指数级增长的同时,不仅提升性能,还能在未知任务中展现卓越的自适应和泛化能力。

例如,被行业广泛熟知的Physical Intelligence (简称PI)发布的π0模型就具备上述要素,是典型的真正意义上的端到端具身大模型。

2. 星动纪元ERA-42是国内首个真正意义上的端到端原生机器人大模型,比肩世界领先水平

早期,星动纪元和PI几乎同期采用了端到端算法来提升其原生机器人大模型性能,PI推出的π0模型,通过结合互联网规模的视觉-语言预训练与机器人操作数据集后训练,使得机器人能够在人类环境中自主执行多种复杂任务,这是机器人从特定任务的“专家”向多任务的“通才”发展历程上的重要一步,也是具身大模型领域的一个里程碑。

图片3.jpg

星动纪元早期发布的研究成果和Physical Intelligence (PI)几乎不谋而合

星动论文HiRT: Enhancing Robotic Control with Hierarchical Robot Transformers发表在CoRL2024

而后,星动纪元又探索了另一条训练道路,采用大规模视频数据学习策略,涵盖无标注的视频数据、公开各类形态机器人的数据、人类活动数据以及遥操作数据等。并且,在上述数据的使用上,星动纪元不是直接模仿视频里的人怎么去做,而是学习行动之后会产生什么样的结果。这种方式使得学习效果不受限于数据质量,能大大降低数据收集成本,解决了数据消耗量巨大、需要大量高质量数据的行业难题。

此外,星动纪元的技术团队已将世界模型融入原生机器人大模型中,使得模型不仅具备行动能力,还具备了对物理世界的理解能力,能够对未来行动轨迹进行预测。

图片4.jpg

后期,星动纪元探索了融合世界模型的原生机器人大模型

星动论文Prediction with Action: Visual Policy Learning via Joint Denoising Process发表在NeurIPS 2024

还能迅速响应外部干扰,并在任务执行过程中持续自适应优化行为,直至任务完成。提升了机器人执行任务的高效性和准确性。

星动纪元打造的端到端原生机器人大模型ERA-42凭借其预测能力,模型具备强大的泛化、自适应和规模化能力。结合星动纪元为AI打造的全新硬件平台,可快速实现具身智能体软硬件协同进化和商业化落地。

3. 星动纪元端到端原生机器人大模型ERA-42引领具身大模型进入通用灵巧操作时代

1)相比夹爪,星动XHAND1已经可以完成100多种精细化、智能化的复杂灵巧操作任务

相比夹爪,基于ERA-42能力,五指灵巧手能够真正像人手一样使用更多种多样的工具,完成更通用、灵巧性更强、复杂度更高的百种以上操作任务。

图片5.jpg

基于ERA-42,五指灵巧手星动XHAND1相比夹爪能使用更多不同工具执行更灵巧操作

2)星动纪元原生机器人大模型ERA-42能理解物理世界和预测未来

融合世界模型后,ERA-42具备对物理世界的理解以及对未来的预测的能力,从而大幅提升了泛化能力和任务成功率。

例如,下图中上方的图片展示了真实物理世界中打开冰箱的逐帧操作,下方的图片则为ERA-42生成的环境建模与对打开冰箱任务的逐帧预测。可以看到两张图片非常接近,说明模型预测非常准确。这与其他机器人大模型直接学习行动、而忽视对世界本身理解的方式,或者仅将世界模型用于生成仿真数据的方式,存在本质的区别。

图片6.jpg

真实世界执行任务和ERA-42预测执行任务对比图

3)星动纪元原生机器人大模型ERA-42具备更强泛化能力

基于大规模视频数据的预训练,只需采集少部分数据,基于ERA-42的泛化能力,短时间内通过单一的策略灵巧手就能学会执行新的操作任务。此前,星动纪元技术团队就通过这种训练方式采集简单的红黄蓝方块抓取数据,成功实现了从未见过的多样化物体(如胡萝卜、茄子等)的抓取泛化,并相对其他模型算法在泛化任务上显著提升了成功率。

图片7.jpg

通过简单彩色方块的抓取数据实现多样化物体的泛化抓取操作

4)星动纪元原生机器人大模型ERA-42具备更强自适应性

由于融合了世界模型,ERA-42不管在单任务上,还是长序列任务上都展现出了业内领先的强大抗干扰能力。

5)星动纪元原生机器人大模型ERA-42初步体现“Scaling效应”

并且研究结果表明,随着模型规模的扩大,任务成功率也明显提升,初步体现了和大语言模型训练中类似的“Scaling效应”,即模型规模与性能之间的正相关性。

图片8.jpg

“Scaling效应”显示模型与机器人性能呈现正相关性

4.星动纪元端到端原生机器人大模型ERA-42和为AI打造的全新硬件平台协同进化,共建原生具身智能体

构建通用具身智能体需要软硬件协同迭代,就像人类的脑和身体是从小到大同步协同成长的一样。

图片9.jpg

构建原生通用具身智能体=原生机器人大模型+为AI定义的硬件平台协同进化

因此,星动纪元打造了为AI定义的全新硬件平台。以星动自研推出的五指灵巧手星动XHAND1为例,共有12个主动自由度,并采用纯电驱方式,且每个自由度都有对应的驱动源,实现全自主五指关节驱动,能执行高精度任务。星动XHAND1每个手指配备一个高分辨率(>100点)触觉阵列传感器,提供精确的三维力触觉和温度信息。单手最大握力能达80N,负载可达25kg。

图片10.jpg

星动XHAND1 —— 全自驱 真自由

星动XHAND1在作业能力上展现出的高性能在协同ERA-42后,为实现复杂灵巧操作任务奠定了基础。

依托ERA-42,星动纪元通用人形机器人执行任务的通用性和泛化性将大幅提升,结合此前发布的在复杂多样的地形上稳定行走和奔跑的运动性能,配合上下肢协同作业能力,潜在应用场景也将更加多元化,真正实现原生的通用具身智能体的产业化落地。


猜你喜欢

全国政协委员曹鹏:以数字技术创新协同,促进新型工业化发展

创新创业京东工业

“提高产业链协作效率和供应链一体化协同水平是制造业数智化转型中的关键路径。”十四届全国政协委员、京东...

3小时前

天丝红牛发声:“50年协议”没有实质意义

创新创业天丝红牛

一份来自深圳中院的民事裁定书,让红牛品牌“50年协议”争议再次引起关注

6小时前

百思特咨询:中国企业如何应对存量市场带来的“低欲望”陷阱?

创新创业百思特

近年来,国内经济增速放缓、房地产市场持续低迷,地缘政治与贸易保护主义又加剧了外部环境的不确定性,这些...

6小时前

新业态兴起伴生虚假摆拍,多方合力强化治理净化环境

创新创业天眼查

随着互联网技术的飞速发展,平台经济催生了一系列新业态,如直播带货、短视频创作等,极大地丰富了人们的娱...

6小时前

养老服务新举措:居家社区养老提升与老年人需求满足并进

创新创业天眼查

在老龄化社会背景下,民政部聚焦老年人急难愁盼问题,着力实施居家和社区基本养老服务提升行动。

6小时前

第十四届公益节暨ESG影响力年会将举办 共筑可持续发展未来

峰会第十四届公益节

公益节是中国公益慈善领域最具影响力的年度盛事。公益节设立于2011年,是国内首个由大众媒体联袂发起的...

2024-10-31

五粮液:助力“中国酒都”宜宾崛起,引领中国白酒书写新篇章

上市公司五粮液

当前,五粮液已构筑了以国家企业技术中心为统揽的科技创新平台体系,建有国家创新平台7个和省部级创新平台...

2024-10-31

持续大幅增收提效,硬核创新药企逆势崛起

上市公司迪哲医药

通过持续大幅增收减亏,迪哲医药光速验证自己商业模式可行性,已超出所有人预期

2024-10-31

通化东宝再度抛出增持计划:不设定价格区间,坚定看好公司发展前景

上市公司通化东宝

2024年10月30日晚间,通化东宝发布公告称,公司控股股东东宝集团拟通过自有资金与自筹资金相结合的...

2024-10-30

海王生物:政策促进生物医药全链条发展,公司经营质量有望进一步改善

上市公司海王生物

10月30日晚,海王生物(000078.SZ)披露了2024年三季度报告。

2024-10-30

我爱我家2024年前三季归母净利润扭亏为盈,展现强大经营韧性

上市公司我爱我家

随着“5.17”等一系列房地产新政的密集出台,今年前三季度房地产市场逐步展现出回暖向好的趋势。

2024-10-30

上牌数次被拒、耗时耗力!电动自行车上路因何成难题?

大消费电动自行车

电动自行车以便捷、环保的特点成为了许多市民出行的首选。

2024-10-30

接棒政府补助,恒洁推出企业专补 “焕”动消费新热潮

恒洁

新一轮“以旧换新”政策带来的成效正不断显现。

2024-10-30

解码荣昌生物三季报:风物长宜放眼量

荣昌生物

10月份即将结束,创新药行业的三季度“考试”也将落下帷幕。

2024-10-30

投资家网(www.investorscn.com)是国内领先的资本与产业创新综合服务平台。为活跃于中国市场的VC/PE、上市公司、创业企业、地方政府等提供专业的第三方信息服务,包括行业媒体、智库服务、会议服务及生态服务。长按右侧二维码添加"投资哥"可与小编深入交流,并可加入微信群参与官方活动,赶快行动吧。

沙特天空塔投资设立专项基金带领中国氢能独角兽扎根沙特

2016年注册于北京的中氢新能技术有限公司,下设位于大兴的装备制造公司、位于海淀区的技术研究院、材料...

挑战奔驰的明星车企,突然“翻车”了

一度无比高光的理想汽车,猝不及防遭遇重挫。

深圳天使母基金姚小雄:将来股权投资行业竞争是服务能力的竞争

2024年1月10日,由投资家网主办,财经锐眼、有时间协办,北京微金科技有限公司承办的“第十二届股权...

避免卡脖子,硬科技如何“逆境”突围?

2024年1月10日,由投资家网主办,财经锐眼、有时间协办,北京微金科技有限公司承办的“第十二届股权...

VC/PE眼中的“专精特新”

2024年1月10日,由投资家网主办,财经锐眼、有时间协办,北京微金科技有限公司承办的“第十二届股权...

第二届中匈可再生能源、新材料商业投资峰会将盛大启幕

第二届中匈可再生能源、新材料商业投资峰会将盛大启幕

第二届中匈可再生能源、新材料商业投资峰会于2025年4月9日在匈牙利布达佩斯盛大启幕。

雕刻耐心|第18届中国投资年会·有限合伙人峰会在沪召开

雕刻耐心|第18届中国投资年会·有限合伙人峰会在沪召开

“中国投资年会”作为私募股权行业的年度盛会,已成功举办了18届,吸引了全国VC/PE领域从业者的广泛...

雕刻耐心|第18届中国投资年会·有限合伙人峰会即将启幕

雕刻耐心|第18届中国投资年会·有限合伙人峰会即将启幕

2024年的一级市场,“耐心”是最高命题,也引发了持续全年的讨论。

不响不辍|第18届中国投资年会·年度峰会在沪召开

不响不辍|第18届中国投资年会·年度峰会在沪召开

5月8-10日,由投中信息、投中网主办的“第18届中国投资年会·年度峰会”在上海外滩W酒店盛大召开。