Figure AI发布人形机器人通用大模型：支持陌生物品识别，两台机器人可协同运行

Figure AI发布人形机器人通用大模型：能识别陌生物品，两台机器人可共享运行

Figure AI发布突破性人形机器人通用大模型Helix

2月21日，AI机器人初创公司Figure AI正式发布了其最新的人形机器人通用大模型——Helix。这一模型的推出标志着机器人技术在家庭应用领域迈出了重要一步。

Helix：实现质的飞跃

Figure AI表示，如果机器人的能力没有显著提升，就难以真正进入家庭环境。而Helix的推出正是为了弥补这一差距。Helix不仅能够像人类一样进行推理，还实现了对机器人上半身（包括手腕、躯干、头部和单个手指）的高速率连续控制。此外，Helix可以在两台机器人之间协同工作，使它们能够共同完成复杂的任务，操作从未见过的物品。

自然语言指令驱动

配备Helix的机器人只需根据自然语言提示，就能拾取几乎任何小型家用物品，包括那些从未见过的物品。与以往的方法不同，Helix使用一组神经网络权重来学习所有行为——从拾取和放置物品到使用抽屉和冰箱，甚至跨机器人交互，而无需针对具体任务进行微调。

高效运行与商业部署

Helix能够在嵌入式低功耗GPU上运行，这意味着它可以立即投入商业部署。这对于希望将机器人技术引入家庭环境的公司来说是一个巨大的优势。家庭环境充满了无数难以预测的物品，机器人要想在其中发挥作用，必须能够按需生成新的智能行为。传统方法需要大量的人力和时间成本，而Helix则提供了一种即时通用的解决方案。

双系统架构：快速与通用的结合

Helix采用了“双系统”架构来解决之前方法中的根本性权衡问题。S2基于一个70亿参数的开源视觉语言模型构建，负责高层次目标的规划；S1则是一个8000万参数的交叉注意力Transformer架构，负责实时执行和调整动作。这种架构让每个系统都能在其最佳时间尺度上运行，S2“慢思考”高层次目标，而S1则“快思考”实时执行和调整动作。

高质量数据集与训练

Figure AI收集了一个高质量、多机器人、多操作员的多样化遥操作行为数据集，总计约500小时。为了生成自然语言条件下的训练对，他们还使用了一个自动标注的视觉语言模型来生成事后指令。这些指令处理来自机器人机载摄像头的分段视频片段，并以“为了得到这段视频中看到的动作，您会给机器人下达什么指令？”为提示。

行业动态与未来展望

Figure AI成立于2022年，曾获OpenAI、微软、英伟达、英特尔以及亚马逊创始人贝佐斯等投资。今年2月初，Figure AI宣布终止与OpenAI的合作。公司创始人布雷特·阿德科克表示，他们计划将Helix的规模扩大1000倍，并预计2025年将是关键的一年，届时公司将开始生产更多机器人，并解决家用机器人的问题。

值得注意的是，深圳市优必选科技股份有限公司也在近期宣布了类似的进展，针对最新的开源推理大模型DeepSeek-R1进行了验证。同时，OpenAI投资的另一家机器人初创公司1X也即将有新发布，OpenAI自身也在重组机器人部门，由Meta前负责人凯特琳·卡利诺夫斯基负责。国内的宇树科技也在频繁公布人形机器人的算法升级，显示出整个行业正在快速发展。

看来，人形机器人的未来充满无限可能，好戏才刚刚开始。