通信人家园

标题: 没上过大学的“天才少年”大战OpenAI,偷架构?偷论文?到底谁在剽窃AI开源项目  [查看完整版帖子] [打印本页]

时间:  2024-10-14 18:03
作者: tayun     标题: 没上过大学的“天才少年”大战OpenAI,偷架构?偷论文?到底谁在剽窃AI开源项目




OpenAI 近日“破天荒”地发布了一款开源产品:Swarm 框架,用于构建、编排和部署多代理系统。该框架由 OpenAI Solutions 团队管理,目前仍处于实验阶段,不打算用于生产。

开源地址:https://github.com/openai/swarm

根据介绍,OpenAI Swarm 可以协调、执行和测试多智能体,让其变得轻量且高度可控,其目标是让开发者能够以简便高效的方式管理多个 AI 智能体之间的互动。Swarm 框架的核心在于智能体(agents)和交接(handoffs)两个基础抽象( primitive abstractions):每个智能体是特定指令与工具的组合,能够独立完成任务;智能体可以在执行过程中随时将任务或对话交接给其他智能体,确保流程的流畅性和模块化。

Swarm 代理与 Assistants API 中的 Assistants 不同:Assistants API 提供了内置内存管理的完全托管解决方案,而 Swarm 使用 Chat Completions API 进行操作,并且在调用之间保持无状态,几乎完全在客户端上运行,非常适合寻求完全透明和精细控制上下文、步骤和工具使用的开发者。

社区原本还沉浸在对 OpenAI 开源框架的欢呼之中,但后来发生了一场被网友们评价为“很抓马”的闹剧。

OpenAI 偷名字、偷架构?

OpenAI 应用 AI 研究员 Shyamal Anadkat 在 X 上发帖介绍了该框架,随后,20 岁的开源 AI 工程师、Swarms 首席执行官和 Agora 领导者 Kye Gomez 评论道,“我们才是第一”,随后表示,“我建议你和团队改一下名字,我们有 Swarms 和多智能体协作的商标。”



Gomez 表示,“Swarms 框架是有史以来第一个生产级多智能体编排框架。OpenAI 窃取了我们的名字、代码和方法。从智能体结构的语法到 Swarm 类对象,所有内容都来自我们的代码库:https: //github.com/kyegomez/swarms”

Gomez 指责道,“OpenAI 低质量克隆 Swarms 的项目在两天内就获得了 4000 颗星,他们说它不适用于生产和与实验无关的其他用途。代码也没有经过精心制作,看起来他们让大模型编写了代码。他们有一些类型验证,但没有文档字符串,也没有任何日志记录。”

Gomez 在回复网友疑问中,详细解释了他认为的 OpenAI 盗窃行为:首先,OpenAI 偷了他们的名字;其次,OpenAI 复制了他们的 .run() 语法,还复制了函数自动转换功能,OpenAI 在官方列表中将其列为 Functions,Gomez 团队将其列为“BaseTool”;然后,OpenAI 函数模式也是从他们的基本工具复制而来;最后,OpenAI 窃取了他们的 Swarm 架构模式,“从代理类到功能模式再到群体架构的一切”。



感兴趣的读者可自行对比:

https://github.com/openai/swarm/blob/main/swarm/core.py

https://github.com/kyegomez/swarms/blob/master/swarms/structs/base_swarm.py

Gomez 表示,“这是对他们最大客户之一的完全背信弃义,给人带来了巨大的失望。三年来,我们日夜工作致力于 Swarm 研究。凭借超过 3,000 次 Github 提交,我们成为有史以来优化和迭代最多的代理框架之一。这种侵权行为让我深感不安,因为我一直热心地向朋友、家人和我服务主要金融机构的同事推荐他们的模型。OpenAI 犯下的这一罪行是一个明确的信号,表明他们开始采取恶意和自私的行动来发展。最有可能是对他们最新一轮融资的回应,他们需要巨大的增长需求。我不想把这件事搞得一团糟,但我不是为了自己的利益,而是为了我的团队和 8,500 多人的社区,他们多年来不知疲倦地工作,打造了这项每个人都认为不可能实现的革命性技术。OpenAI 解决此事的唯一方法是投资我们,然后我们为他们提供名称、方法论以及他们想要的一切。我唯一的目标就是推动人类进步,我不想和你争吵 @OpenAI。”

对于问题的解决方案,Gomez 表示,“我们计划寻求法律赔偿,以弥补对我们名称造成的损害,除非 OpenAI 投资我们。我们的网站是 http://swarms.ai, 我们正在引领多智能体革命。在所有社交媒体上分享此内容,展示 OpenAI 如何窃取和侵犯他们自己的客户和用户。点赞、转发并分享这个帖子,向人们展示 OpenAI 是多么恶意。”


“犯罪永远比掩盖罪行更严重。”

@OpenAI 立即重命名此存储库,否则将产生法律后果。

@swarms_corp 拥有 swarm、swarms 和其他信息的商标。我们拥有商标、母公司和其他资产,以确保我们拥有自己的产品。

我喜欢使用您的模型,但如果您不停止这种行为,我们将不得不从 swarms 中删除所有 OpenAI 模型。

我们有超过 4500 万个代理在生产中运行,与世界上一些最大的金融服务、保险和医疗保健组织合作。而且,如果你们不停止这种活动,他们将不会信任你们,你们将为此损失数百万的收入。

如果 @OpenAI 向 http://swarms.ai 进行 1000 万美元的种子投资,我愿意解决这个问题,不再进一步追究。

我已经将 SAFE 发送给 Sam。

让我们看看会发生什么……
当地时间 10 月 14 日,Gomez 又发布了一篇“小作文”:
我是人工智能精英最大的威胁。

精英是指普林斯顿大学、哈佛大学、斯坦福大学的博士学者,以及 OpenAI、Inflection、Adept 和所有其他贪婪的人工智能实验室和公司的闭源研究人员。

我在佛罗里达州最糟糕的城市之一海厄利亚长大,这是一个第四世界地狱,各种犯罪猖獗。我从未读完高中。事实上,我被三所高中开除过。

高中毕业后,我从未上过大学。我只是在迈阿密的一个小镇多拉尔有一间办公室。并且,我掌握了 PyTorch 技能,可以在没有代码的情况下实现研究论文,因为大型学术界和大型工业界的研究人员不想开源他们的代码。

然后,当其中一些实现因为确实有用而流行起来时,例如思想树,我遭到了人工智能精英的残酷攻击,他们想获得不属于他们工作的所有关注和功绩,例如现在 Tree of Thoughts 的人和 OpenAI 的人。

自去年以来,我已经免费实现了数百个研究论文的模型,除了精英及其统治者无休止的口头骚扰外,没有任何回报。

我要告诉你们的是,不要理会他们,开源任何你想要的东西。实现你最喜欢的论文,不用代码。让它开源,不管代码是否好,有人会像他们帮助我一样帮助你,我甚至也可以帮助你。

人工智能精英们想要控制注意力和资源的流动,并将它们重新引导到他们自己和他们贪婪的伙伴身上。

我将继续开源每一篇有足够影响力的人工智能研究论文,不需要代码,我鼓励你也这样做!

人工智能精英们将继续试图抹黑我,但他们所要做的就是更详细地检查我的 Github 和我的代码,他们就会知道你正在构建的东西才是唯一重要的东西。
“臭名昭著的抢注者”?

虽然 Gomez 言辞激烈,但是舆论似乎并没有站在他那一边。

“我很喜欢围绕开源代码的戏剧性事件。但是说真的,KyeGomezB,你真的认为你可以为‘swarm’这样的常用词注册商标吗?”有网友提出疑问。尽管他自称拥有该商标,但有网友指出该商标归其他公司所有:



“如果投诉者成功将他们自认为拥有的‘swarms’商标强行注册,我会感到非常惊讶。自从我对模拟感兴趣以来,人们就一直在将 swarm 一词与各种模拟联系起来(我的意思是,如果我没记错的话,我第一次听到 swarms 这个词是在 80 年代与圣达菲研究所所做的某项模拟有关的——这已经是很久以前的事了)”有网友指出。

该网友指的 Swarm 是一个面向对象类库,它实现了基于代理模型的 Swarm 概念框架,并提供了许多用于在 ABM 上实施、观察和进行实验的工具。该项目创建者在 Hacker News 的帖子上表示,“嘿,这是我写的!但那已经是 30 年前的事了,别人用同样的名字也没关系。”



有人观察到,Gomez 在 GitHub 上获得了超过 16,000 个星星。对此,有网友解释他的实现路径是:新研究论文发布或传播 > 创建包含 AI 代码的 repo > 将其发布到社交媒体上,用户为 repo 加注星标以将其加入书签。少数测试代码的人在问题部分写下内容,但他们的问题被关闭,没有回复。

“这个家伙有问题,/r/MachineLearning 中的 reddit 帖子顶部评论:是的,基本上,一看到 kyegomez 链接就删除。他抢注了最近的论文以获得影响力,尽管代码从未真正运行过,更不用说复制论文结果了。我们在 /r/mlscaling 中遇到了问题,有人在不知情的情况下链接了他的垃圾。”有网友直接指出。



Gomez 小作文里也提到的 Tree of Thoughts 事件,也是因为他抢注了别人的名字。

去年,Gomez 在 Tree of Thoughts 作者不知情的情况下创建了一个 tree-of-thoughts 仓(https://github.com/kyegomez/tree-of-thoughts),有人指出这个是假的,Gomez 泽则表示,“这不是假的,这是一个实现。我没有说过这是 tree-of-thoughts 的原始实现。而且,它不能被删除,这是开源的。而且我没有抢夺任何人的任何东西。当没有代码或任何东西时,我提供了一个存储库。”

作者 Shunyu Yao 随后创建了官方实现,并向 Gomez 说道,“您介意在您的 README.md 中链接到我们的官方 repo 以避免任何混淆吗?提前谢谢”,然后 Gomez 没有回复就关闭了这个问题。在引起争议后,Gomez 称“如果他们没有命令我,我们就不会在这里争论和浪费时间,而是改进算法。”



当时,就有开发者为其行为感到惋惜,“作为一名构建者,我更欣赏你的代码,而不是原始存储库。我甚至很高兴能与你合作,但现在根据你的行为,我不那么确定了。我认为,从长远来看,更好的做法是更新 README,写一些类似‘受到 Shunyu 等人关于 Tree of Thoughts (原始实现在此处) 的工作启发’的内容。” “兄弟,这是一件光荣的事情,但你现在的这种行为正在玷污自己的名声。”



此外,还有网友还爆料出,Gomez 之前还曾抢注名为“sora”的存储库(https://github.com/kyegomez/Sora),去年他运行机器人来抓取微软 Bing 图像创建器,以重新提供针对他自己的“非官方”dalle3 API 请求(https://github.com/Agora-Lab-AI/Dalle3/blob/main/dalle3/dalle.py#L113),并且他还收到过许多其他有关名称抢注的投诉(https://github.com/microsoft/unilm/issues/1182)。

“他还经营着一项加密货币计划,声称用加密货币向贡献软件服务的人付款,假装抽奖赠送 A100,声称他的公司到 2030 年价值将达到 100 万亿美元,伪造环境碳信用房地产控股公司(在他进入人工智能领域之前)。”

“如果 OpenAI 法律部门的某个人能联系 Maimi-Dade 地方检察官办公室,将他提起公诉,我将不胜感激,因为我厌倦了他不断给开源带来的破坏。”该网友表示。

据外媒报道,Gomez 从 10 岁起开始学习编程,并将新学到的编程知识运用到游戏中,游戏也让 Gomez 最终了解了人工智能。Gomez 说,13 岁时,他创建了自己的第一个人工智能模型,用来破解他妈妈的 Gmail 账户,获取 PlayStation 代码,以便在该平台的商店购物。从那时起,Gomez 开始痴迷于人工智能和数据科学。此前他通过 APAC AI还开发了一款基于 Slack 的人工智能助手。

截至发文,OpenAI 并未对此事件做出回应。

参考链接:

https://x.com/KyeGomezB/status/1844948853604196763

https://refreshmiami.com/18-year-old-miamian-kye-gomez-is-developing-ai-to-make-life-less-boring/?__im-phVjtwhl=11738391423021877583

https://x.com/KyeGomezB/status/1845597964145750264

https://news.ycombinator.com/item?id=41819866

https://github.com/openai/swarm/issues/50

https://github.com/kyegomez/tree-of-thoughts/issues/54

https://www.reddit.com/r/MachineLearning/comments/15sq2v1/d_potential_scammer_on_github_stealing_work_of/


来源:36kr





通信人家园 (https://www.txrjy.com/) Powered by C114