3月13日深夜,英伟达、微软和OpenAI参与投资的人形机器人创企Figure AI发布了人形机器人Figure 01的全新演示视频,展示了Figure 01嵌入OpenAI的大模型后智能交互等方面的提升。
人形机器人
视频中的人形机器人能够与人类进行流畅的对话,理解人类的意图,并执行基于自然语言指令的抓取和放置任务。
整合了OpenAI大模型的Figure人形机器人与人类互动和执行任务方面更加流畅自然,Figure 01可以准确地描述出周围环境的细节,如清晰地表达桌面上的物体布局以及人物的状态,使得机器人能够像一个真实的人类助手一样理解和传达场景信息;并且在做决策时能够运用常识推理,例如,它能够根据观察到桌子上的盘子和杯子推断出下一步可能要放在晾衣杆上。
人形机器人执行任务
此外,还能理解抽象指令进行转换执行,Figure 01可以将用户提出的不明确的、抽象的需求(“我饿了”)转化成具体的动作序列(寻找食物并选择一个苹果递给对话人)。
借助语言生成能力,Figure 01不仅能够执行任务,还能对行动逻辑进行解释,视频中机器人能够用简单的英语描述其选择苹果的原因,这有助于用户理解机器人的行为逻辑,增强人机交互的透明度和信任度。
Figure AI创始人兼CEO Brett Adcock介绍,视频是正常倍速速度连续拍摄的,而且没有人为远程控制机器人的动作。他们将机器人摄像头拍摄到的图像和机载麦克风捕捉的语音,转录为文本输入到由OpenAI预训练的多模态模型中,OpenAI提供了视觉推理和语言理解,Figure AI的神经网络则提供快速、灵巧的机器人动作。
人形机器人执行任务
Figure机器人操作高级AI工程师Corey Lynch表示,Figure 01现在可以做到描述其视觉体验、规划未来的行动、反思自己的记忆、口头解释推理过程。
本月初,OpenAI才官宣与Figure合作,宣布专为机器人打造下一代AI大模型,合作仅13天,在大模型的加持下,Figure 01人形机器人就展示出了更强的能力,Figure创始人Brett Adcock也表示公司希望能大规模生产。
Figure AI成立于2022年,发展势头迅猛,打造的Figure 01人形机器人引发了科技界和投资界的热烈反响,今年2月29日Figure宣布,获得了6.75亿美元的B轮融资,投资机构包括微软、OpenAI创业基金、英伟达、亚马逊创始人杰夫·贝索斯等,目前估值高达到26亿美元(折合约187.12亿元人民币)。
Figure的目标是建立一种世界级的人工智能模型,并通过此模型驱动生产每一台人形机器人,赋予它们在复杂环境中进行智能决策和有效行动的能力。
并希望未来能销售数以亿计的模型驱动的人形机器人,服务于各类生活场景,包括家庭、教育、工业生产和医疗护理等,以应对全球劳动力短缺、提升生活质量。
随着人工智能技术的不断突破,人形机器人的发展正以前所未有的速度加速前行,今年2月发布的Figure 01人形机器人的视频还只是展示灵活自然的执行任务动作,如今对话交互、情境理解和决策能力得到了极大的提升,向着更高级别的智能助手升级。
不仅是Figure 01人形机器人,不久前特斯拉第二代人形机器人Optimus Gen2展示人形机器人在工业和家庭应用中的潜力;此外,英国公司Engineered Arts推出的人形机器人Ameca也展示了与人类进行自然对话的能力。
科技巨头们协作发力,人形机器人智能水平加速提升,正在以超乎想象的速度进入我们的工作、生活场景。