波士顿动力的机器人在运动控制方面表现卓越,同时也展现了高度的智能。例如,配备机械臂的 Spot 机器人在物体识别和抓取方面表现出色。另一方面,以 AI 技术见长的特斯拉在硬件领域也投入了大量资源。您一直强调将运动控制与人工智能相结合的重要性,在发展人形机器人方面,我们可以从这些公司的实践中获得哪些启示?
在人形机器人领域,目前的重点依然是从仿真中获取数据。在仿真的潜力没有被完全挖掘或达到瓶颈之前,研究者肯定会集中精力在仿真方面深入探索。但是,当任务发生变化时,仿真的局限性就会显现出来,而目前又无法直接从视频中获取所需的数据。在这种情况下,像 Mobile ALOHA 使用的方法就非常巧妙,因为它解决了数据获取的难题。然而,如果要让机器人完成诸如踢足球、打篮球或攀岩等复杂运动,遥操作的方法可能就不太适用了。随着研究的不断深入,我相信还会出现许多新的技术手段,最终很可能会发展到能够直接利用视频数据。
传统上,我们习惯将系统划分为规划、感知和控制等几个模块。近来,端到端网络逐渐流行,这种方法可能实现我们所需的效果。然而,端到端方法下,系统的内部结构可能与我们常规认知中的模块划分不同。尽管它可能依旧包含类似规划、感知、控制的功能,但其划分方式可能与传统方法大相径庭。我认为不应强求 AI 系统的内部结构必须符合传统认知或经验,关键在于它能否有效地解决问题。
不过,随着人工智能和神经网络技术的进步,以及硬件设备的发展,有可能出现更符合仿生特点的系统。目前有许多研究,如类脑控制、类脑 SLAM 等,都在尝试这一方向。虽然这些方法并没有完全按照生物系统的原貌去实现,但它们把握了核心机理,可以利用现有的电子和机电器件,按照信号处理的方式重新构建整个系统,实现全新的架构。我认为在仿生这个方向上还有很大的创新空间,从长远来看,在仿生领域继续深入研究是很有价值的。
但这时候如果你非要从事仿生,可能最终仿生就是正确的,但仿生学在 20 年以后胜利,并不意味着现在做仿生就能取得成功,现在从事仿生学研究可能连经费都拿不到,更不用说做出典型案例了。历史上有一个很好的例子,维纳在 MIT 找了两个年轻人,由于计算机最终采用了冯诺依曼架构而非他们的方案,这两个年轻人都郁郁而终,三十几岁就去世了,对此维纳也无能为力。