通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  二级通信军士

注册:2010-4-283
跳转到指定楼层
1#
发表于 2024-10-11 20:05:55 |只看该作者 |倒序浏览
AI这把火终于烧到了播客。

近期,谷歌开发的AI博客NotebookLM彻底火了。原因是,它能将用户提供的内容进行总结,并生成一段引人入胜的对话式播客,把信息娓娓道来。

国外AI大佬Andrej Karpathy更是称赞其“点亮了LLM的新交互范式”。如今,国内字节的豆包大模型也已跟进。

那么,NotebookLM究竟有哪些有趣的玩法?而当AI进入播客领域,又会对其产生怎样的影响呢?
01 解锁使用AI播客的三种姿势
从名称就可以看得出,NotebookLM的定位起初是一款AI云笔记软件。

它基于用户上传的文档内容(包括Google文档、幻灯片、PDF、文本文件、网页链接等),生成长文本摘要、多语言会话、提纲、常见问题解答、学习指南等内容。

到这里,NotebookLM和它的名字一样普通,和别的AI笔记没区别。

要说NotebookLM破圈,全靠生成语音功能,它把小作文变成了超逼真的电台聊天。

使用者尝试了各种玩法,他们把各种书籍、文章、其他播客转成AI短音频。

这才发现,NotebookLM在信息的组织、检索和验证方面做得很好,适合需要精确引用和深入研究特定资料的场景,如学习研究、法律分析、商业报告等。

找到了差异化的使用场景,NotebookLM火也是自然的。

做成一档绘声绘色的播客节目,NotebookLM离不开三个开源模型(Llama 3.1 405B、MeloTTS、Bark),是它们帮助NotebookLM完成从理解文本到生动言说内容的过程:

长文本理解:Llama 3.1 405B擅长处理长文本,能够理解和生成高质量的文本内容。

口语化人声:文本转语音 工具MeloTTS,能将输入的文字转化为自然流畅、可定制的声音。

音效:文转音频模型Bark,能生成包括音乐、背景噪音和简单的音效,还有高度逼真的非语言交流,如大笑、叹息和哭泣。

接下来介绍几个AI播客的用法,看看哪一个是你需要:

1、最强AI第二大脑,“信息快餐”开吃

用NotebookLM对论文、书籍、公知社交平台进行梳理总结,并生成逼真生动的人声娓娓道来,效果惊艳。

有人用“股神”段永平的社交主页投给AI,只花5分钟,就做了一档英文播客《段永平的故事》。

也有人对NotebookLM上传了几千条Flomo笔记,一期近20分钟的podcast,讨论了笔记里内容,还能给人以灵感启迪。

这可能是目前的“最强AI第二大脑”产品。

AI播客把原本结构化、线性表达的知识文本,降格成几分钟就能听完的“信息快餐”,就像是用了《三体》中的降维武器“二向箔”。


▲NotebookLM分析《老美都要在太空建数据中心了!成本大降95%,英伟达强力支持》(乌鸦智能说文章)

因为效果过于自然逼真,Andrej Karpathy也给出盛赞,称其“点亮了LLM的新交互范式”。

2、自我关怀,听老外轮番“彩虹屁”

“如果你感到有点沮丧,把你的社交动态粘贴到NotebookLM中,就能得到一通8分钟的‘真人’深度赞美。”

这是HuggingFace首席科学官分享了用NotebookLM进行自我关怀的方法。(之前我们也写过一个在自我关怀方向的AI产品,SocialAI)

把个人社交媒体上的动态/简历导出来,然后复制粘贴给NotebookLM,AI博客里的“人”会对使用者进行狂热的讨论,还甚至讨论起对方的优劣势,以及会不会录用对方的问题。


其实我们每个人最感兴趣的,是自己,所以延续自己的想法和兴趣的内容,充满乐趣和正反馈。

在这个创业机会上,国内已经有大厂出手了。豆包产品经理钟二信在即刻上透露,豆包很快也会上类似的功能。

3、自制英语播客,费曼学习法达成

当老外用AI总结播报论文、制作夸夸的时候,国内却开辟了AI播客的另一个场景——学英语。NotebookLM带动了AI双人英文播客的火爆,小红书上不少博主都在倾情推荐。


有人探索出了一套超棒的英语听力练习法,简直是费曼学习法+自制podcast,制作步骤也非常地简单:

学习:听AI播客讨论 (音频约7~18min) ,进入情景学习

反馈:导入笔记,听AI播客来复盘,内容熟悉,不会走神

调整:自己控制话题难度,再也不怕听不懂

这种学习方法可以让人沉浸地表达和思维。AI播客里一男一女,美式英语纯正清晰轻松幽默,而不是枯燥的英文新闻单向输出。

场景诞生的原因是国人学英语的高需求。我国的英语市场常年火爆,根据数据显示,少儿英语培训市场在2018年就达到3160亿元,成人英语市场规模在2019年也达到了953亿元。

得益于此,中国是访问NotebookLM最多的国家,甚至超过了美国。

02 声音短视频化,知识内容生产及消费方式将被改变
一直以来,播客都是一个相对小众的需求。

这和其内容特点有很大关系。与短视频等内容不同,播客内容更侧重于知识输出,内容追求知识密度,因此播客的时长往往较长。

比如,国外头部播客的时长动辄三四个小时,而国内播客小宇宙上,大多数电台的节目时长也在一小时左右。

但这就带来了两个问题:

一方面,长时长内容,大幅提升了用户的消费门槛

根据PodcastIndex的数据,当前还在活跃的播客有400万以上。而平均一个人收听播客的时长为6-7小时,这注定有海量的播客内容无法被广泛消费。

另一方面,这也不符合大众内容消费碎片化的趋势

在TikTok上,电影解说账号的点赞量平均在3万左右,爆款可达到百万点赞。

解说型书单视频也大受欢迎,这种号的主要内容是“3分钟内解说一本书”。抖音上像是@不略这样的号,在只发布30+个作品时,就已经拥有180w万点赞了。


以上两点,使得播客的受众相对受限。

但NotebookLM的出现极有可能改变这一切。

有公式就是快!NotebookLM加快了内容的自动化生产,它将高密度文字内容转化为听觉材料。它还把优质内容变短了,“二创”的知识短音频更符合当下的消费习惯。

同时,AI特有的交互特点,也能实现AI播客的定制化,让知识更入耳入脑。

比如,将特定的阅读材料,用AI处理成更符合自己接收习惯的东西,可以是自己喜欢的声音,又或者双人畅言聊天。

当播客内容的供给被AI进一步放大,且形态更符合用户消费习惯,播客消费仍然很大的挖掘潜力,比如开车、通勤、入睡时,也就是长时间、无注意力(无法用手操作)的场景。


▲来源:即刻@Yangjixxxx

可以想象,随着AI技术的进步,将出现一个更加丰富和智能内容生态。而这或许是内容消费侧潜力最大的机会。

来源:36kr

举报本楼

本帖有 2 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2024-11-5 12:20 , Processed in 0.169641 second(s), 17 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部