通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  三级通信军士

注册:2007-10-293
跳转到指定楼层
1#
发表于 2024-10-25 11:01:58 |只看该作者 |倒序浏览

在资金充足的会话AI开发者之间的激烈竞争中,Anthropic 突然取得了一些真正的进展。

这家初创公司宣布了一款新软件,可以为人们完成任务,比如构建网站或编辑电子表格。这个功能被称为“计算机使用”,意味着 Anthropic 的 Claude 模型实际上可以查看用户的屏幕并为他们采取行动,比如移动光标、点击按钮和输入文本。

(计算机使用功能通过截取你的屏幕截图,决定需要采取的行动,执行这些行动,然后再次截取屏幕截图以决定AI模型接下来应该做什么,一位发言人向我解释说。)

如果这听起来很熟悉,可能是因为我们之前报道过 OpenAI 几个月来一直在开发类似的软件——尽管 Anthropic 因安全考虑而以行动稍慢著称,但他们似乎在这场比赛中击败了 OpenAI。

然而,OpenAI 并不是一个会被轻易甩在后面的对手。正如 Erin、Amir 和我昨天报道的那样,他们正在通过多个编码助手计划,加倍努力开发能够编写软件的AI。

问题是,Anthropic 的新计算机使用产品和 OpenAI 的编码助手可能会与一些初创客户的业务直接竞争。以 Cursor 为例,这是一个流行的编码助手。它的产品基于 OpenAI 的模型,其投资者包括 OpenAI。但开发者告诉我,OpenAI 正在开发的编码助手可能会与 Cursor 产品直接竞争。

这延续了模型开发者通过与客户竞争来蚕食自己业务的最新趋势。

不过,值得一提的是,能够实际查看我们屏幕上的内容而无需依赖辅助功能或查看底层代码的AI软件,可能会带来一系列新的机会。

例如,当你在构建网站时,如果网站上按钮中的文本不小心溢出了按钮边界,使用计算机的代理将能够看到并修复它,而不是必须查看底层代码来弄清楚页面可能是什么样子,这可能更加困难,一位开发者告诉我。

另一位开发者给了我这个例子:网站制造商已经变得更擅长于使他们的网站上的广告HTML代码不那么明显。这使得AI驱动的广告拦截软件更难分析该代码并弄清楚要删除什么以去除广告。但是,一个可以直接看到广告本身的计算机使用代理会发现这项任务容易得多,开发者说。

然而,这项技术也有其缺点。已经有一些小公司担心员工使用 ChatGPT 或像 GitHub Copilot 这样的编码工具,可能会不小心泄露专有信息或代码给模型开发者。想象一下,他们对于拥有计算机控制权并截取你的活动屏幕截图的AI软件会作何感想!

OpenAI 在与 Anthropic 的竞争中加倍投入开发能编写软件的 AI

OpenAI 的 ChatGPT 已经成为一个数十亿美元的业务,这在很大程度上是因为程序员使用它来编写和检查代码、修复漏洞以及将代码翻译成不同的编程语言。

现在,面对竞争对手人工智能初创公司 Anthropic 的竞争,OpenAI 正在加大改进其为软件编程提供的工具的努力。一些正在开发中的产品或功能旨在使在微软的 Visual Studio Code 等主要代码编辑程序中使用 OpenAI 的 AI 进行编码任务变得更加容易,而其他一些则旨在承担更大的软件开发任务。

- 根据某些衡量标准,Anthropic 的 AI 最近在编码方面超过了 OpenAI

- OpenAI 的编码产品可能会威胁到 GitHub Copilot、Cursor 等初创公司

- OpenAI 开发了一个工具来帮助其 AI 研究人员,包括生成代码

例如,OpenAI 一直在开发一个产品,用于处理可能需要人类数小时或数天的软件工程任务,并根据客户的指示自动编写和执行复杂应用程序的代码,一位听取过 OpenAI 领导层相关讨论的人士表示。

目前尚不清楚 OpenAI 何时会推出这样的产品。

编码任务成为 OpenAI 开发的大型语言模型的早期应用之一,部分原因是 AI 生成的代码可以快速测试其是否有效。微软的 GitHub 单元从 2021 年开始使用 OpenAI 的 LLM 为 AI Copilot 产品提供动力,该产品在程序员输入时提供代码建议。

但是,2022 年底推出的 ChatGPT 提供了一个更广泛可访问且免费的替代品,迅速获得了流行。OpenAI 随后说服了数百万程序员为 ChatGPT 的升级版本付费——并获得比 GitHub Copilot 更早访问升级的 LLMs,这些能力现在是一个订阅产品,预计每年产生约 30 亿美元的收入。

AI 公司还相信,能够生成良好代码的模型也可以为其他类型的查询生成更好的答案。

现在,OpenAI 在 AI 编码方面有些处于下风,因为竞争对手 AI 初创公司 Anthropic 已经成为一个强大的竞争对手。周二,Anthropic 宣布了一款新软件,可以像人类一样使用计算机代表人们采取行动,例如移动光标、点击按钮和输入文本。

理论上,Anthropic 软件可以帮助程序员完成构建网站和改进其外观等任务。OpenAI 已经开发了数月的类似产品,即计算机使用代理,但尚未推出。

根据一些 OpenAI 用来评估模型编码能力的指标,Anthropic 的模型最近有所优势,据一位与 OpenAI 高层领导讨论过这个问题的人士称。

Anthropic 的联合创始人 Daniela Amodei 最近告诉 The Information,AI 编码还不能完全取代工程师,还需要“一些指导”,但其 Claude 聊天机器人已经将其开发者的生产力提高到了 Anthropic 可能会改变其招聘计划的程度。Anthropic 预计到 2024 年底,将以每年 10 亿美元的速度产生收入,即每月 8300 万美元。这比年初的原始预测高出 25%,尽管 Anthropic 与销售和云合作伙伴(如亚马逊网络服务)分享的收入比例比 OpenAI 与云合作伙伴(如微软)分享的收入比例更大。

OpenAI 的内部工具显示了其 AI 在编码相关任务方面的广泛潜力。该公司开发了一个内部研究助理工具,以帮助 AI 研究人员更快地工作,包括为他们的 AI 模型实验生成代码,据一位员工称。这位人士表示,该产品在内部很受欢迎,但目前尚不清楚公司是否会公开发布。

这个内部工具似乎是向开发能够自行进行 AI 研究的 AI 迈出的一步——这项技能需要的不仅仅是编码,还包括为新实验生成想法,而 OpenAI 的领导层已经公开表示,这种技能可能会在未来几年内实现。

OpenAI 的员工还考虑开发公司 Canvas 产品的一个版本——一个新的 ChatGPT 界面,使用户更容易起草文档和代码——可以与开发人员的代码库集成,据一位与 OpenAI 经理讨论过这个想法的人士称。

这样的功能将使 AI 更好地理解用户现有的代码库和他们正在工作的项目类型,但用户可能仍然需要执行将代码复制粘贴到聊天机器人中的繁琐任务。

最终,OpenAI 希望提供更通用的计算机使用代理,可以控制客户的计算机以处理超出编写代码范围的更广泛任务,类似于 Anthropic 周二宣布的那一个。据一位见过演示的人士称,OpenAI 已经在内部展示了一个初步版本的代理,该代理将使用用户的计算机执行订餐等任务。一个被分配编码或应用开发任务的自主代理可能能够在遇到问题时咨询基于网络的资源以获得帮助。

正在开发中的 OpenAI 产品可能会威胁到其应用程序编程接口业务的客户,他们销售编码助手。其中之一是 Cursor,它使用 OpenAI 模型为其产品提供动力,并从 OpenAI 获得了风险投资。

OpenAI 未来的编码产品可能与开源编码助手如 Continue 或 SWE-agent 重叠,这些助手使用 LLM 帮助用户编写代码和修复漏洞。

新产品还可能与 GitHub Copilot 竞争。微软在 7 月份的财务披露中暗示,GitHub Copilot 有望通过订阅每年产生 3 亿美元的收入。该公司利用该工具的受欢迎程度向客户销售其他 AI 产品,例如其 Office 365 应用(如 Word、Outlook、Excel 和 PowerPoint)的 Copilot 功能套件。在客户购买多个产品的情况下,微软已经对 GitHub Copilot 等产品的价格进行了折扣。

微软和 Cursor 的发言人没有立即回应置评请求。


来源:36kr

举报本楼

本帖有 1 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2024-11-5 22:38 , Processed in 0.167990 second(s), 16 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部