通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  三级军士长

注册:2007-10-294
跳转到指定楼层
1#
发表于 2024-12-11 14:45:20 |只看该作者 |倒序浏览
  • 克雷西 发自 凹非寺
    量子位 | 公众号 QbitAI
OpenAI员工发推介绍今天发布的新功能,结果意外泄露了未发布的模型

在Reddit上,被列文虎克附体的网友发现,OpenAI研究员Karina Nguyen展示的新功能界面中出现了一个陌生的名字——

ChatGPT ε(第五个希腊字母,读作Epsilon)。

这名网友猜测,这极可能就是之前被传出的下一代模型“猎户座”





一石激起千层浪,越来越多的网友开始用显微镜研究起了这张图片。

结果还真有新发现——

Karina的浏览器收藏夹中有一个名为Agents(智能体)的文件夹,还打开了一个叫“Scientist Assistant”的标签页。





目前Karina已经将原推文删除,但种种迹象引发了网友们的热烈讨论。

特别是Karina还是前不久从隔壁Anthropic跳槽来OpenAI的,嗯,就……

网友:故意的还是不小心的?

发帖的网友表示,ε极有可能就是之前盛传的“猎户座”模型。

在贴文中,这名网友给出了他的理由——

天文学中,猎户座腰带上的中心恒星Anilam(参宿二),用巴耶命名法表示正是猎户座ε





今年七月,OpenAI推理模型o1的原型“草莓”被曝光。

到了八月底,The Information称,OpenAI已经悄悄对“草莓”进行过展示,它还被用来改进代号“猎户座(Orion)” 的新模型。

“猎户座”就此浮出水面,定位是OpenAI的新旗舰,也就是GPT-4的下一代





彼时的OpenAI忙的则是“抓内鬼”,与GPT-4o上线之前的操作不谋而合。





到了十一月,长期跟踪ChatGPT进展和网页源码的“光头哥”Tibor Blaho还公布了一系列新信息。

光头哥的历史战绩不可谓不丰厚,曾经通过源码分析在OpenAI官宣两个半月之前就挖出了ChatGPT的搜索功能界面。





光头哥的分析中,和“猎户座”相关的部分总结如下:

  • 参与测试新模型的OpenAI员工称, “猎户座”仅完成20%训练时就达到了GPT-4级别的性能。
  • 但最终质量提升小于从GPT-3到GPT-4的飞跃,这表明传统的Scaling可能由于高质量数据变得有限而放缓。
  • 训练“猎户座”使用了先前模型(GPT-4和o1)生成的数据,可能导致它重现旧模型的一些行为。




The Information则爆料,“猎户座”模型相对GPT-4的提升幅度,小于GPT-4相对GPT-3,已进入收益递减阶段。

这也是奥特曼曾说可能不会把新模型命名为GPT-5的原因之一。





不过ε这个命名,还是遭到了网友们的吐槽:





回到Karina的推文截图,网友们也给出了关于Agent和Scientist Assistant的分析。

有人认为Scientist Assistant是ChatGPT生成的对话摘要,而Agents只是一个普通的浏览器收藏文件夹。

也有人认为,这里的“Scientist Assistant”,就是智能体的一种。





另外,这次的泄露虽然看似意外,却有不少人都认为这是OpenAI故意为之,有人更是表示OpenAI在这种事情上简直是驾轻就熟。





顺便提一句,“双十二”开始之前有网友用马斯克的Grok,通过分析推特大数据,猜测了7款要发布的新品。

其中Sora和满血o1已经被证实,此次泄露的“下一代模型”ε和可能是泄露的“AI智能体”也都在Grok的预测当中。





种种迹象表明,新模型的上线的概率还是比较大的,当然最终解释权还是在OpenAI手里。

至于是不是真的有,表现又是如何,我们继续关注后面几天的发布。

Canvas可执行代码,免费用户也能用

说完这波泄露事件,再来看看“双十二”第四天的正经发布内容。

此前OpenAI给plus用户测试的Canvas(画布)功能迎来更新。

此前左上角模型切换栏中的GPT-4o with canvas也已经消失,入口被移到了输入框下方的按钮当中。





在画布里,可以对文档进行编辑审阅,将修改意见以批注的形式展示,看起来更直观了。





代码方面,也可以边写边debug。





最重要的是,Python代码可以直接在画布中运行了。

据介绍,Canvas当中配备了几乎所有的Python库,代码执行速度非常快。





运行中的报错信息也对ChatGPT可见,鼠标滑过就能看到对错误信息的具体解释,还能一键修复。





另外,Django框架创始人Simon Willison还发现,Canvas中的代码执行与之前的代码解释器不同。

Simon指出,Canvas中的Python代码是通过Pyodide(WASM中的Python)运行的,这意味着具备它联网能力。





用泄露了ε的Karina的话说,新版的Canvas是一个“数据科学家”。





在评论区,还是有很多网友跑过来问ε的事,“闯了祸”的Karina自然是已读不回。





除了功能更新,Canvas也不再是plus专属,免费用户也可以用了

这次是上线到了网页版和Windows客户端,这下Windows用户终于不用羡慕Mac用户了(手动狗头)。





参考链接:
[1]https://www.reddit.com/r/singularity/comments/1hb9z2n/chatgpt_%CE%B5_seen_in_this_quickly_deleted_tweet_from/
[2]https://www.reddit.com/r/singularity/comments/1hbbi6k/agents_are_coming_as_seen_from_openai_employee/
[3]https://www.youtube.com/watch?v=qZ0ImE41pVs
[4]https://x.com/simonw/status/1866601649160278248


来源:网易

举报本楼

本帖有 4 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2024-12-22 22:50 , Processed in 0.220216 second(s), 17 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部