搜索
中关村商情网 首页 IT业界 机器人 查看内容

基于Gemini 2.0,Google推出让机器人执行细腻操作任务的人工智能模型

2025-3-13 21:28| 发布者: admin| 查看: 461| 评论: 0

除了公布可用于单一GPU或TPU的「Gemma 3」人工智能模型,Google DeepMind更以Gemini 2.0模型为基础,分别推出可用于机器人运作的「Gemini Robotics」与「Gemini Robotics-ER」两款人工智能模型,标榜能使机器人执行诸如折纸、掐紧夹链袋等更细腻操作任务。

此次推出模型,主要采用视觉、语言、动作合一的「VLA」 (vision-language-action)设计,让机器人透过电脑视觉处理资讯后,在理解语言指令情况下产生细腻执行动作,让机器人可以更仔细动作完成人类下达指令。

「Gemini Robotics」可直接用于控制机器人行为,让机器人具备更多执行通用型态任务能力,并且提升互动及灵活度表现。而「Gemini Robotics-ER」则可透过Gemini模型的进阶推理能力执行任务来运行自己的程式,例如能让机器人判断执行任务时,如何排除途中遇到障碍的情况,并且能处理人类以自然语言下达指令。

目前「Gemini Robotics」模型已经与美国德州人形机器人公司Apptronik合作,另外也向Boston Dynamics、Agility Robotics等机器人公司提供「Gemini Robotics-ER」模型有限存取权,使其建构更多机器人应用形式。

同时,Google也表示此次提出模型是在以科幻小说家Isaac Asimov于著作中提出机器人三法则:「机器人不得伤害人类,或坐视人类受到伤害」、「机器人必须服从人类命令,除非命令与第一法则发生冲突」,以及「在不违背第一或第二法则之下,机器人可以保护自己」为启发,进而提出「机器人宪法」 (Robot Constitution)框架,透过「ASIMOV」资料集评估机器人行为安全性,并且用于测试机器人对于指令理解程度。


鲜花

握手

雷人

路过

鸡蛋

最新评论

返回顶部