通信人家园

标题: NoteBookLM的成功,谷歌自己也想复制 | 焦点分析  [查看完整版帖子] [打印本页]

时间:  2024-11-15 17:09
作者: see122     标题: NoteBookLM的成功,谷歌自己也想复制 | 焦点分析


文 | 袁滢靓

编辑 | 邓咏仪

在美国,播客的影响力在某种程度上,已经可以超越TikTok了。

在不久前结束的美国大选中,特朗普和哈里斯都将播客视为重要的宣传战场。而特朗普和美国播客断层顶流Joe Rogan的访谈播客,在YouTube获得了现象级的4800万次观看,被视为特朗普胜选的“临门一脚”。

时代早变了。据尼尔森公司统计,11月5日星期二,大选的收视黄金期,通过18个电视网络收看2024年美国总统大选报道的观众,也才约4230万人。

事实上,不论白宫,还是硅谷,播客作为一种新媒介,正在快速崛起

最近两个月,一款由谷歌开发的AI笔记产品NotebookLM就增长迅速。SimilarWeb数据监测显示,10月份的流量增长了200%以上,达到9.2M次,比一个月前的3.1M次高了约两个身位,在社交媒体上被频繁刷屏、风头无两。

之所以火,就在于NotebookLM的一个小功能——“音频概览”:输入长文本,利用AI就能生成播客。它能针对任意的文本材料,生成长达十几分钟的逼真双人播客,语音、语调,甚至内容调侃,都充满了“活人味”。



△NoteBookLM的“音频概览”功能


网友都感慨:“谷歌这次终于狠狠创新了。”而火了之后,谷歌的老伙计Meta坐不住了,立即基于Llama模型,推出了NotebookLM的开源平替版NotebookLlama。

AI笔记产品的热度也顺势而起。11月15日,腾讯官宣了AI笔记新产品ima.copilot,它能检索微信公众号文章,并形成自己的专属知识库。

据TechCrunch报道,10月28日,AI笔记产品Read AI筹集了5000万美元B轮融资,Granola完成其2000万美元的A轮融资。

无心插柳柳成荫

事实上,NoteBookLM只是一个具有落地可能性的demo,一开始,谷歌不是想做一个播客产品,更多的还是想基于源文档,对内容进行概述、梳理和提问,来提高生产力,就和大部分AI笔记想实现的一样。

但AI生成播客这个功能,成了那只“金手指”,



△NotebookLM近几个月的流量曲线


这跟当年的ChatGPT如出一辙——它本来也只是一个大模型的预览版,通过一个对话窗口,想让大众直观地感受到产品的提升。

用NoteBookLM制作播客非常简单。直接上传单个或多个来源材料,点击右侧的音频加载,等待几分钟后,就会产出一段十几分钟的男女对话音频,同时还支持自定义音频,例如应该针对哪些受众、哪些主题等。

将奥特曼最新的访谈投喂给NoteBookLM,严肃的访谈内容变得生动活泼了。

对谈的两人一边分析AI的潜力,一边用带有幽默感的比喻,让复杂的技术话题变得易懂、接地气。比如,把AGI的诞生比作“新生命的到来”,或调侃AI公司需要“一个聪明人和10,000个GPU”。

Scailing Law(缩放定律)在两人的一唱一和中也变得通俗易懂:
A: 想象一下你正在教计算机识别猫,对吧?小模型,它可能会学习尖耳朵、圆脸、基础知识,但一个巨大的模型是在数百万张猫图片上训练的。

B:它成为终极猫专家。

A:远不止如此,它还可以从表情中学习品种、情绪,甚至发现微小的疾病迹象,简直是详细级别。
令人惊喜的逼真效果、简单的一键式体验,让许多网友跃跃欲试。在X上随手一搜,就能看到许多“几分钟之内快速制作播客”的经验贴,无一例外都是借助NoteBookLM来实现。

如果再加上其他AI工具,如生成数字人的Heygen、可编辑脚本和声音的Wondercraft等,甚至还能形成更丰富的音视频内容。



△来源:X


想成为网红,先得营销

如今的生成式AI产品,没点“花活儿”都难以出圈。

无独有偶,上一个获得社媒高声量的AI产品,是低代码开发平台Wordware的一个吐槽小功能,上线 8 天,就吸引了426万用户,连创始人都措手不及。

这款毒舌AI活脱得像原生网友,可以根据X上的内容,分析单个账号的性格、两个账号的兼容模式,犀利毒舌,玩梗非常溜,让网友直呼过瘾。

例如,它对马斯克和特朗普的关系评价是,“这是一个高风险的权力二人组,具有创新和争议的爆炸性潜力……他们如同两只阿尔法狼在争夺谁能先对着月亮嚎叫……马斯克提议用核武器轰炸火星,而特朗普要让月球再次伟大。”



△Wordware毒舌分析马斯克和特朗普的关系


对比NoteBookLM和Wordware的传播方式,我们会发现,它们都是在基础产品之外,发布一些能够引起广泛社交传播的小功能。

这些小工具在使用上大大降低了应用门槛——即使是小白也可以迅速上手,产出也是走搞笑有趣路线,这其实与抖音、TikTok短视频在全球的火爆逻辑不谋而合。

NotebookLM团队的负责人Raiza Martin,在访谈中还透露了一种非常规的、类似“公开创业”的运营逻辑。

团队每天在社交媒体上分享项目进展,并在开发者聚集的Discord建立频道,以便在一线关注用户的反馈和使用习惯,从而及时调整和更新。目前,已有超过60000个用户加入。

视频生成明星初创Pika的打法其实也相似。刚亮相时,团队就选择在Discord运营,迅速获得50万用户。

今年10月,新发布的Pika 1.5模型就又推出了一个新的AI模版——输入一张静态图片,就能实现爆炸、融化、膨胀、变成蛋糕等多种效果,各种脑洞开大、整活玩梗和搞怪,精准对标社交媒体用户的趣味。

生成式AI应用,正在经历交互方式创新

OpenAI联合创始人Andrej Karpathy对双人播客形式之所以吸引人的原因,是这么分析的:聊天很难,而听别人聊天更轻松得多;阅读很难,而靠在椅背上听要容易得多。

甚至,不要要求用户输入,因为人们往往不知道他们想要什么,直到直接展示给他们看。

回顾互联网超级应用的诞生,本质上,它们都有交互形式上的创新。

在抖音之前,视频大多是横向的,用户在消费内容时,需要不断点击、退出、选择和再点击。而抖音竖屏视频流的设计,将操作简化为上下滑动,大大降低了使用门槛。

现在的AI产品也在经历差不多的进程。在模型从文本走到多模态后,用户如今也不需要再手动敲字和模型交互,直接说话已经十分流畅。

NoteBookLM带来的启示是,要将大型语言模型的能力(智商、上下文长度、多模态等),转化为更能被用户消费的内容样态,其侧重点并非AI本身,而是场景定位和用户体验。

今年10月发布的ChatGPT-canvas,就是OpenAI在交互设计的一次尝试。它最独特的地方是,将向ChatGPT询问的操作与编辑/编码的内容整合在一起,构建了一个更加人机协同的界面。

也就是说,用户可以直接在canvas编辑文本或代码。编辑的文档将自动显示在聊天界面右侧,用户用鼠标选中需要调整的部分,在弹框里进一步提问GPT,或通过快捷方式菜单调整长度、更改阅读级别、修复错误等。



△canvas页面


Arc浏览器创始人Josh Miller认为,小公司确实还有机会,尤其是在用户界面上的创新。换句话说,成功定义用户页面的AI产品,更能成为杀手级应用,更能最终胜出。

连谷歌也想复刻自己

在NoteBookLM爆火后,谷歌近日又推出了一款AI学习工具Learn About。

类似于互动式的电子百科全书,Learn About提供了历史、生物、天文、体育等各类学科的交互式文章和指南,同时可以自动扩展和深入探索,用AI加速知识学习。

单单是Learn About的交互模式:要点总结、时间线、常见问题等,都能嗅出浓浓的“NotebookLM味”。



△Learn About的页面


和大多数AI聊天机器人不同,NoteBookLM和Learn About虽然保留了空白对话框,但更多的空间留给了一个个装着内容的“框”。



△NoteBookLM的页面


这些框,将建议的主题、指南、重点和注释直接展示出来,而不用用户自己去思考“我应该问什么”。

只需点击几下,知识就会以文字、图片、视频等不同模态的形式,从屏幕上涌过来。不少网友称这是“爱丽丝掉进兔子洞”般的体验。



△Learn About以滑动页面,呈现多模态的拓展学习


此外,NotebookLM团队的负责人Raiza Martin认为,在设计产品上,真正要思考的是,如何让新的东西变得直观而易被接受。

她举了一个反例,在使用NoteBookLM时,用户做的第一步就是上传源文档。对用惯了ChatGPT的用户而言,这个微妙的操作步骤,足以引发困惑和犹豫。

当然,基于源文档的设计有其独特的意义。它使我们重新意识到,日常的创造往往都是基于某些已有的资料或文档。

这也是AI笔记产品能提供超级生产力的原因,通过整合、分析和拓展各种信息,减少搜索信息时的回头路,打造第二大脑。

从这个角度上看,我们也能看到互联网发展的影子。以前的第二大脑是APP,是小程序,而现在发展成了AI。

我们的需求没有变,只是我们的要求,变得要更聪明、更智能了。

来源:36kr





通信人家园 (https://www.txrjy.com/) Powered by C114