Sam Altman:事实上,我们希望能在各个方面都取得突破,但目前我们特别关注模型的推理能力。我相信,也希望这种推理能力能够帮助我们实现许多长期以来的突破性目标。比如说,这样的模型能够为科学研究做出新的贡献,能够编写更复杂的代码,我相信这些都将推动重大进展。因此你会看到 o 系列模型的快速迭代,这对我们的战略布局来说至关重要。
主持人:关于 OpenAI 的未来规划,还有一个我认为很重要的问题:你们如何看待为非技术背景的创始人开发无代码工具,帮助他们构建和扩展 AI 应用?你们对这个方向有什么思考?
Sam Altman:这个目标一定会实现,但我认为第一步是开发工具来提升已经掌握编程技能的人的生产力。当然,最终我们相信能够提供真正高质量的无代码工具,现在市面上已经出现了一些不错的尝试。但目前你还不能直接向 AI 要求说“我要构建一个完整的创业项目”,这还需要一段时间。
Sam Altman:利用 AI 构建那些此前难以实现或根本不可能的产品和服务,这将创造出数万亿美元的新市值。确实有一些领域我们会努力参与,那就是让模型变得极其强大,这样你就不用那么费力就能让它们完成你想要的任务。但其他所有的事情,比如在这项新技术之上构建创新的产品和服务,我们认为这只会变得越来越好。
Sam Altman:我认为即使我们能达到这一预测值的一个零头,那也已经是非常显著的成绩了。确实,这个行业需要巨额的资本投资,同时也将带来巨大的经济收益。历史上每次重大的技术革新都是如此,而 AI 无疑正是一场这样的革命。明年对我们来说将是进军下一代系统的关键之年。关于无代码软件时代的到来时间,我无法给出确切的时间表。但是,我们可以想象一下未来的场景:当每个人都能轻松地描述出他们想要的公司软件系统时,这将带来多大的经济效益。尽管这一目标的实现仍需时日,但如果真的实现了,考虑到目前构建此类系统所需的巨大难度和高昂成本,这将是一个颠覆性的进步。
主持人:我们待会儿会谈到 AI 智能体,讨论这些价值是如何实现的。就价值传递的机制而言,开源是一种非常重要的方式。你如何看待开源在 AI 未来的角色?当遇到“我们是否应该开源任何模型或某些模”这个问题时,你们内部是如何讨论的?
Sam Altman:在生态系统中,开源模型显然有其重要地位。现在已经有一些非常优秀的开源模型。同时,也需要有精心设计的、集成度高的服务和 API。我认为这些都有其存在的价值,用户会根据自己的需求做出选择。
主持人:作为一种价值传递机制,我们一方面有面向客户的开源方式,另一方面可以通过 AI 智能体。我注意到关于智能体的定义存在很多概念混淆。你是如何定义智能体的?在你看来,什么是智能体,什么不是?
Sam Altman:这只是我的即兴想法,没有深思熟虑过——但在我看来,AI 智能体就是能够接受长期任务,且在执行过程中几乎不需要督导的存在。
主持人:你认为人们对智能体有什么误解?
Sam Altman:更准确地说,我认为我们都还没有对这项技术最终会呈现什么样子形成直观认识。我们都在暗示某些看起来很重要的东西。也许我可以举个例子:当人们谈论 AI 智能体代理时,他们经常给出的典型例子是:“哦,你可以让智能体帮你预订餐厅,它可以使用 OpenTable 或者直接给餐厅打电话。好吧,这确实能帮你省去一些麻烦。” 但我认为,更有意思的是那些人类做不到或不会去做的事情。
Sam Altman:这里面其实包含两个问题:一个是我们如何做到的,另一个是每个人都很关心的问题 ——Transformer 之后会是什么。关于我们如何做到的,这是我们的特殊秘诀。复制已知可行的东西相对容易,其中一个原因是你已经确信这是可能的。所以在一个研究实验室取得某项突破之后,即使你不完全清楚他们是如何做到的,去复制它也是可行的。你可以在 GPT-4 的复制品中看到这一点,我相信你也会在 o1 的复制品中看到这一点。
最难能可贵的,也是让我最引以为豪的,是我们的文化孕育出了一种能力:持续探索全新且未经验证的领域。很多组织——我不是在说 AI 研究人员,而是一般而言——很多组织都声称自己具备这种能力。但在任何领域,真正能做到的都很少。从某种意义上说,我认为这是推动人类进步最重要的要素之一。这也是为什么我幻想退休后要写一本书,记录下我所学到的关于如何建立这样一个组织和文化的所有经验。
Sam Altman:这个世界上有太多极具天赋的人,但他们无法充分发挥自己的潜力,可能是因为他们在一个管理不善的公司工作,或者生活在一个缺乏优秀企业的国家,又或者是其他诸多原因。说到 AI 最让我兴奋的一点是,我希望它能帮助我们比现在做得更好,帮助每个人充分发挥自己的潜能,而我们现在离这个目标还很遥远。世界上有很多人,我相信如果他们的人生轨迹稍有不同,本可以成为杰出的 AI 研究员。
Sam Altman:确实,他们有一个在编程方面表现出色的模型,这是非常令人印象深刻的工作。我认为开发者在大多数情况下会使用多个模型。我不确定随着我们进入这个更加智能体化的世界,这种格局会如何演变。但我觉得未来会是 AI 无处不在的景象。我们现在谈论和思考它的方式感觉有些不太对。也许用我的话来说,我们会从关注单个模型转向关注整个系统。当然,这需要一定时间。
Sam Altman:你知道,我们这里有很多人都对构建通用人工智能充满热情,这本身就是一个强大的激励因素。没有人期望这会是一条轻松的、直达成功的道路。有一句历史名言,我可能会引述得不够准确,但其内核是这样的:“我从不祈求上帝站在我这一边,而是祈求我能站在上帝那一边。” 在深度学习领域进行探索就有这样一种感觉 —— 仿佛是在追随某种正确的方向。你只需要坚持,它最终似乎都会有效,尽管在途中会遇到一些重大障碍。对此的深刻信念一直支撑着我们。
Sam Altman:这每天都在变化。不是说有一个特别重大的决定。当然,确实有一些重要的决定,比如我们是否要在这个还是那个产品方向上投入,或者我们要用哪种方式构建下一代计算系统。这些都是非常关键的、单向门式的决定,就像其他人一样,我可能推迟它们的时间过长了。但最大的挑战在于日常决策。每天都会遇到一些模棱两可的决定,它们之所以会上报到我这里,正是因为都是些难以权衡的事情。我并不觉得自己特别可能比其他人做得更好,但我还是得做出决定。困扰我的不是某一个特定的决定,而是这些决定的数量。
主持人:当面临这些左右为难的决定时,你会特别倾向于咨询某些人吗?这些人有什么共同特点?
Sam Altman:不会。我认为错误的做法是依赖某一个人来处理所有事情。至少对我来说,正确的方式是拥有 15 到 20 个值得信赖的人,你相信他们每个人在特定领域都有独到的见解和丰富的经验。你可以像“打电话求助朋友”一样,找到在具体问题上最有经验的专家,而不是试图找一个在所有方面都精通的人。
06 AI 革命不应该比喻为互联网,而是晶体管
主持人:说到艰难的决策,我想谈谈半导体供应链。你现在对半导体供应链的担忧程度如何?
Sam Altman:我不太清楚该如何量化这种担忧。当然是会担心的。这可能不是...好吧,我可以这样说:它不是我最担心的问题,但确实位列所有忧虑的前 10%。
主持人:我能问问你最担心的是什么吗?我觉得问这个问题已经超出了会惹麻烦的程度。
Sam Altman:这关系到我们整个领域正在尝试做的事情的普遍复杂性。这感觉像是一个……我认为最终一切都会没问题,但确实是一个极其复杂的系统。而且,这种复杂性现在在每个层面都呈现出疯狂的状态。你可以说这种情况在 OpenAI 内部也存在,在任何一个团队内部也是如此。
主持人:你说“前所未见”。很多人把这波浪潮比作互联网泡沫时期,就热情和兴奋程度而言。我认为不同的是人们投入的资金规模。甲骨文创始人 Larry Ellison 曾说,要进入基础模型竞赛,起步就需要 1000 亿美元。你同意这个说法吗?当你看到这个数字时,你觉得这说得通吗?
Sam Altman:不,我认为实际所需资金会比这少。但这里有一个有趣的观点:每个人都喜欢用之前的技术革命来类比,试图将新技术革命放在一个更熟悉的背景下理解。首先,我认为总的来说这是一个不太好的习惯,尽管我理解为什么人们会这样做。其次,我认为人们选择用来类比 AI 的例子往往都不太恰当。
互联网显然与 AI 有很大的不同。你提到了这一点,比如说成本问题,不管是需要 100 亿还是 1000 亿美元才能具有竞争力。互联网革命的一个显著特征是入门门槛其实很低。现在,还有一点更接近互联网的是,对于许多公司来说,这只会像是互联网的延续。就像是别人制造这些 AI 模型,你可以用它们来构建各种精彩的产品。它就像是构建技术的一个新的基础要素。但如果你试图构建 AI 本身,那就是完全不同的故事了。
我们以前有摩尔定律这样的规律,现在我们可以想象一系列关于 AI 的定律,告诉我们它会以怎样的速度变得更好。整个科技行业都从中受益。在你使用的产品和服务中都包含着大量的晶体管技术,但你不会把这些公司看作是“晶体管公司”。这背后有着极其复杂且昂贵的工业流程,以及庞大的供应链体系。基于这个看似简单的物理发现,带来了惊人的进步,为整个经济带来了长期的巨大提升。尽管大多数时候你都不会去想它,你不会说“哦,这是一个晶体管产品”。它就像是,好吧,这个东西可以为我处理信息。你甚至不会去思考这一点,这已经成为理所当然的事情。
07 社会本身的变化程度可能会出人意料地小
主持人:接下来我想和你玩个快问快答的游戏,请你直接给出下意识的答案。
如果你现在是一个 23、24 岁的年轻人,拥有如今的基础设施,你会选择构建什么?
Sam Altman:我会选择某个由 AI 赋能的垂直领域。我想用教育辅导作为例子,可能是打造最好的 AI 辅导产品,或者是我能想象到的最出色的教学系统。类似的领域都可以,可以是 AI 律师,可以是 AI CAD 工程师,或者其他类似的方向。
主持人:你以前提到过写书的计划。你打算给这本书起什么名字?
Sam Altman:我还没有想好具体的书名。除了觉得这样一本书应该存在,因为它能帮助释放很多人的潜能之外,我还没有深入思考过这本书的其他细节。所以也许会是关于人类潜能的主题。
主持人:在 AI 领域,有什么是目前没人关注但每个人都应该投入更多精力的方向?
Sam Altman:我特别期待看到,这个问题其实有很多不同的解决方案,但我想说的是某种能够理解你整个生活的 AI。它不需要真的拥有无限的上下文理解能力,但是要有某种方式让你能拥有一个 AI 智能体,它了解关于你的一切,能访问你所有的数据等等。
主持人:在过去的一个月里,有什么事情让你特别惊讶的吗?
Sam Altman:是一个我现在还不能讨论的研究成果,但它确实令人惊叹。
主持人:你最尊重哪个竞争对手?为什么是他们?
Sam Altman:说实话,我现在基本上尊重这个领域的每一个参与者。我认为整个领域都在进行着令人惊叹的工作,有着才华横溢、工作极其努力的人。我不是在回避这个问题,而是我确实能在这个领域的各个角落看到非常有才华的人在做出色的工作。有特别突出的一个吗?不太容易说。
主持人:告诉我,你最喜欢的 OpenAI API 是什么?
Sam Altman:我认为新的实时 API(Real-time API)非常出色。当然,我们现在已经建立起了相当规模的 API 业务,其中有很多出色的功能。
主持人:在 AI 领域,你现在最敬佩的是谁?
Sam Altman:让我特别表扬一下Cursor 团队。当然,AI 领域有很多人在做着令人难以置信的工作,但我认为 Cursor 团队真正做到了将愿景变为现实。我本可以列举很多值得称赞的研究人员,但就利用 AI 来创造真正令人惊叹的用户体验,以一种前所未有的方式创造价值而言,我认为他们的成就确实非常突出。在思考这个问题时,我特意把 OpenAI 的任何人都排除在外,否则首先就会是一长串 OpenAI 的人员名单。
主持人:你如何看待延迟和准确性之间的权衡?
Sam Altman:你需要一个可以在两者之间灵活调节的机制。就像现在我们在做快问快答一样,我其实回答得还不够快,但我在努力不过分思考。在这种场景下,你需要的是低延迟。但如果你说:“嘿,Sam,我希望你能在物理学领域有重大发现”,那么你可能会很乐意等待准确性再发展个几年。关键是,这种权衡应该由用户来控制。
主持人:我想问问关于领导力中的不安全感,我认为这是每个人都会有的感受,但我们很少谈论。当你思考领导力方面的不安全感,作为一个领导者你想要改进的方面,你今天最想在作为领导者和 CEO 的哪些方面有所提升?
Sam Altman:这周让我最困扰的是,我对我们的产品策略细节感到比以往任何时候都更加不确定。我认为产品总的来说是我的一个弱项。而现在公司正需要我在这方面提供更强有力和清晰的愿景。我们有一位出色的产品主管和一个很棒的产品团队,但这是一个我希望自己能做得更好的领域,而且我现在正急切地感受到这种不足。
主持人:你招聘了 Kevin Weil 作为 CPO(首席产品官)。我认识 Kevin 很多年了,他确实很出色。
Sam Altman:Kevin 太棒了。
主持人:在你看来,是什么让 Kevin 成为一位世界级的产品领导者?
Sam Altman:我首先想到的词是纪律性。
主持人:是在关注重点这方面吗?
Sam Altman:是的,包括什么该做什么不该做、真正站在用户角度来思考我们为什么要做或不做某件事,以及始终保持严谨务实的态度,不轻易被天马行空的想象所左右。
主持人:如果你有一根魔法棒,可以为 OpenAI 五年和十年内的愿景描绘蓝图吗?
Sam Altman:坦白说,我可以轻松地规划接下来的两年。但如果我们的判断是正确的,如果我们开始打造的系统真的能在科学进步等方面发挥巨大作用……实际上,我想说的是,我认为在五年内,我们会看到技术本身以一个令人难以置信的速度不断进步。人们可能会说:“哇,通用人工智能的时代来了又走了,不管怎样,这个进步的步伐简直疯狂。” 我们在不断发现新的东西,不仅是关于 AI 研究,还有其他所有科学领域。如果我们现在能坐在这里预见到那个场景,它起来应该会让人觉得难以置信。