通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  上等兵

注册:2018-6-62
跳转到指定楼层
1#
发表于 2023-8-21 17:00:29 |只看该作者 |倒序浏览

在 AI 拉锯战上,谷歌的口令一直是:「咱不能输」。

如今,谷歌带着它的“复仇者联盟”,向 OpenAI 全军出击!

据外媒报道,谷歌正在马不停蹄地赶工中,准备在今年秋天发布迄今为止可能是大模型界的阿尔法级别产品:Gemini。

毋庸置疑,ChatGPT 珠玉在前,谷歌想要展开正面交锋,得有点绝杀才有说服力。

万众期待之下,几个月来,谷歌一直蓄势待发。

4 月,谷歌将深度学习人工智能研究部门 Google Brain 与子公司 DeepMind 合并,成立 Google DeepMind。一切旨在提高效率,将谷歌庞大的计算资源和 DeepMind 的研究技能结合起来。

5 月,在谷歌举行的 I/O 2023 大会上,谷歌就指出,Gemini 目前正在接受训练,一旦经过微调,它就会像 PaLM 2 一样「以不同的规模和能力」面世。

6 月,谷歌的 Gemini 被爆由谷歌最强 AI 团队 Google DeepMind 倾力打造。那时,谷歌就声称:“这个 AI 系统将谷歌背后的技术与大型语言模型相结合。 该系统具有新的功能,例如规划或解决问题,比 OpenAI 的 GPT-4 更强大”。

随后的日子,谷歌将数百位工程师的集结于此,只为在今年秋天用 Gemini 扳回一局。

据 The Information 报道,为了应战,谷歌联合创始人 Sergey Brin 甚至亲自参与 Gemini 项目开发,并对模型进行评估。

从“复仇者联盟”版图来看,由 Google Brain 和 DeepMind 公司的前主管共同管理监督 Gemini 的大部分小组。目前,已曝光的名单中,至少有 26 名技术大拿正参与开发。

此外,Gemini 将团队划分为约 10 个小组,分别负责预训练、数据、基础设施、模型微调、模型评估、代码库、多模态、强化学习、工具使用以及人工标注数据。

众所周知,两个月前,谷歌 DeepMind 首席执行官 Demis Hassabis 放下狠话:Gemini 将成为能「媲美」 ChatGPT 的聊天机器人!

今,需要划重点的来了。

据知情人士透露,谷歌意图将 Gemini 模型打造成一款「文本生成功能」与「文生图功能」相结合的多模态产品。

简单来说,除了像 GPT-4 大型语言模型一样理解并生成对话文本,还能像 Midjourney 一样生成图像。

此外,还提及了 Gemini 的一些其他功能,例如如分析图表、创建带有文字描述的图形,甚至使用文字或语音指令控制软件。

值得一提的是,Gemini 坐拥强大能力的背后,离不开庞大的训练数据支撑。

而恰巧谷歌拥有大量的资源,尤其是在可用于训练 AI 模型的数据上,占据绝对优势。

例如,谷歌可以访问 YouTube 视频、Google 图书、庞大的搜索索引以及 Google Scholar 的学术材料。其中,大部分数据都是谷歌「独家」。

据 The Information 早前的报道,谷歌自家的视频平台 YouTube 更是为 Gemini 的训练有素,作出了帮衬。

通过使用 YouTube 视频副本来训练 Gemini,由此将音频与视频集成到 Gemini 中,使其具备多模态能力。

例如,通过 YouTube 视频训练出的模型可以辅助工程师根据视频诊断汽车维修问题、根据用户想创建的网站或应用程序的草图来生成软件代码等。

据 Global Media Insight 估计, YouTube 上至少有 8 亿个视频。

目前,为保证自己在这场 AI 军备竞赛中占据绝对优势,谷歌公司的律师也在持续密切关注 Gemini 使用的训练数据材料,以防侵犯版权。

网友:“ChatGPT 统治的终结?”

若 Gemini 的愿景实现,这款集合了“ ChatGPT + Midjourney/Dall-E + Microsoft 365 Copilot ”的大模型,很有可能将直接带着谷歌逆风翻盘。

这场将在秋日由 Gemini 拉开的正面交锋,也引发了不少业内人士的讨论。

谷歌前高管、风险投资公司 Felicis Ventures 的创始人 Aydin Senkut 极度认可:“这是正确的方向。相信最终,谷歌会成功的!”

彭博社风投分支 Bloomberg Beta 的 AI 初创企业投资人 James Cham 表示:“这将是有模型能与 GPT-4 旗鼓相当的第一个迹象。我认为,在过去的九个月中,也许每个人都在问:什么时候才会有人能赶上 OpenAI?”

除此之外,不少网友也展开了热情讨论:

  • “Gemini 项目的合并过程并不容易,涉及到两个独立团队的磨合”;

  • “我还记得 Bard 的‘翻车’事件,希望 Gemini 能改写历史”;

  • “ChatGPT 统治的终结?”

  • “Gemini 的成败可能决定谷歌未来能否保持其在 AI 技术领域的领先地位”……


立秋已过,接下来让我们一起期待谷歌的秋季发布会吧。


举报本楼

本帖有 6 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2024-11-16 22:56 , Processed in 0.413057 second(s), 16 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部