近日,谷歌对外公布一项正在研究的“乒乓球机器人”项目,该项目名为“i-Sim2Real”。据了解,该机器人在与人类对打时,一回合内完成连续接球340次。
谷歌强调这只是人类与AI的“合作”,并非击败人类,但以AI成长的速度,该机器人将很快堪比职业选手。谷歌开发该项目的原因是想要人工智能在乒乓球对抗中,探索高速动态环境中的人机互动。
谷歌的乒乓球机器人可在模拟环境中不断学习,并将学习成果运用于现实世界。该项目使用一个简单的人类行为模型作为近似的起点,在模拟训练和在现实世界中部署之间交替进行,在模拟环境中数分钟或数小时的训练,就可达到数年的实时训练的成果。
i-Sim2Real是谷歌提出的强化学习架构的应用,该架构从过去的动作和观测结果中学习自我校准。其视觉适应网络利用由演示轨迹和强化学习目标组成的各种模拟数据,能够从各种视点控制机械臂到达视觉指示的各种目标,并且独立于摄像机校准。
谷歌之所以在乒乓球运动中研究i-Sim2Real,因为在乒乓球运动中,机器人可以与快节奏以及相对不可预测的人类行为进行交互,同时乒乓球的规则相对于篮球、板球等运动也较为简单直接。机器人完成乒乓球动作时,既要求速度又要求精度,这对学习算法提出了很高的要求。同时,这类运动具有固定的、可预测的环境,使其成为研究人机交互和强化学习问题的理想测试平台。