问题:您为什么将演讲的题目定为“攀登视觉智能之梯(Ascending the Ladder of Visual Intelligence)”?
李飞飞:我认为,仅凭直觉就能知道,AI的复杂程度和成熟程度是有不同层次的。在演讲中,我想传达这样一种感觉,即在过去几十年中,尤其是过去10多年的深度学习革命中,我们在视觉智能领域学到的知识已令人叹为观止,在这项技术上的能力也日趋成熟。我还受到了犹大·伯尔(Judea Pearl)“因果阶梯”的启发(《因果革命(The Book of Why)》,2020)。
这个演讲还有一个副标题,叫“从看到做(From Seeing to Doing)”,这是一个被大家低估的理念:无论对于动物还是AI,视觉都与交互、做事密切相关,这是对语言的某种悖反。但从根本上说,语言还是一种用来传递想法的交流工具。在我看来,视觉和语言恰好互补,都是极其重要的AI发展模式。