通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  少尉

注册:2015-11-142
跳转到指定楼层
1#
发表于 2024-11-13 20:38:57 |只看该作者 |倒序浏览
衡宇 西风 发自 凹非寺
量子位 | 公众号 QbitAI
百度突然扔出了个AI创作界的Game Changer!





一个由文心多模态大模型加持的万能白板,因为支持任何模态的素材输入,并能精准满足用户原始创作需求,被命名为「自由画布」

一切都在一块类似“空白画布”的界面上操作,只需要一拖、一圈,就能在这一个平台上,以任何格式的输入,生成任何格式的你想要的内容,分享到任何平台上——包括各种社交平台、内容创作社区、朋友圈、小红书甚至播客。

而且对使用设备没有任何要求(不敢想在iPad上用这个功能得有多丝滑)。

就真的很随心所欲,真的非常All in One。





行业内一直有声音在探讨,专注文档和创作的文库,和专注存储和管理的网盘,是值得打通并创造新的价值,成为全新的生产力。

现在,这两个国民级应用通过AI融合、重构后,也确实让我们看到了AI生产力贯穿内容生产的始终,让创作融会贯通的机会。

只是没想到它们动作这么快——在刚刚结束的世界大会上,百度创始人、董事长兼首席执行官李彦宏就宣布推出自由画布。

这个“立即可用的现货”,打破了两个老牌产品边界,搞出来的还是个AI创作领域的新物种

为什么说是AI创作的新物种?

因为它完全不同于Chatbot的形式,还颠覆了传统的内容创作编辑工具。

自由画布打破了AI创作领域中的格式输入、内容输出、存储分享的限制,仅需极简操作,便能处理各模态的素材。





一方面,用户使用成本和使用门槛再一次大幅降低;另一方面,AI内容生成的精准度、可控度进一步提升。

从此AI功能在一个平台内部,就能任用户逍遥。大伙儿对此也都很好奇,据说开放预约测试首日,就已经有20万人排队预约了。

把AI生产能干的事儿一锅端了

自由画布在内容生产创作的几个环节上,到底能带来什么巨大的突破变化?

话不多说,先拿非常生活化的一个具体场景,看看功能pipeline展示。

今年夏末《黑神话:悟空》爆火后,山西旅游火得不得了。假设我们也想去大同打卡一波,需要一份贴心的旅游攻略,同时需要在网上找几个旅游搭子,自由画布就可以派上用场。

打开自由画布,首先你将体验到全模态输入自由

我们日常会接触的100多种格式,不论是文本类的doc、pdf、excel,还是多模态图像音频视频类的jpg、mp3/mp4等,自由画布全都支持

并且得益于百度文库和百度网盘的互通,百度网盘中的私域资料可以与百度文库公域资料融合为自由画布提供创作素材。

因此搜索关键词“大同”,就能将各种格式资料,统统拽进画布。





紧接着,自由画布将最大限度的展现其编辑和创作自由,几乎你要啥它就给你啥的那种。

操作十分简单,将要用的资料用鼠标“圈”起来,然后在旁边跳出的框里输入prompt即可。

所以,我们只需直接输入“生成大同一日游攻略”,点击发送按钮:





这份大同一日游攻略不仅秒秒钟生成了,而且竟然是以海报的形式。

就拿这精细程度来说,路线、交通耗时等一应俱全,休息空档都预留出来了,十分周到。

这样的攻略,不仅当个人行程安排妥妥够用,而且海报排版布局也审美在线,如小红书等社区创作者拿来作为分享素材,应该也会收获不少点赞吧(doge)。





攻略有了,让它帮忙找旅游搭子也同理,直接输入prompt“帮我写一份招募搭子的文案”:





时间、需求细节面面俱到,文案风格都是小红书/朋友圈式的:





生活/娱乐场景之外,自由画布也能拿捏学习工作场景的需求

比如需要题海战术的考公考编,平时真的非常令人头疼,现在自由画布助力easy多了——

丢给自由画布几份历年考公真题练习试卷:





简简单单一句“把试卷做了”:





自由画布就麻溜溜的像真人做题似的,规规整整、逻辑清晰的把几套试卷做完了。

关键是它还排着头标注好“第一题”、“第二题”……没有把不同的题目混为一谈,这就有点离谱了:





上面展示的是对上传内容进行整体调用,也就是把拖入自由画布的资料都用鼠标“圈”出来了,然后指挥它。

局部调用,当然也可以!

所有格式的文件都可以提前进行大意总结、重点标记、框架参考等AI标记处理,大模型能够记住用户标记,通过对所有标记过的文件,直接圈选完成新内容的生成和创作。

比如单独拎出一个音频就能得到AI纪要和逐字稿,单独点击一个视频也有AI纪要和分段总结,把这些组合“圈”在一起就能让它生成新的内容。





这也展示了自由画布对内容进行多层次调用、生成的能力

就像做饭似的,每种食材都有不同的用途,有的直接下锅炒,有的用来榨汁调味,还有的切成小丁点缀色彩。而现在,这些食材已经经过了AI的预处理。

也就是说AI对这些多模态素材已经深入理解了,所以针对用户下达的指令,他都能进行多格式内容创作。

融合视频、音频、文档多模态各种资料,它也能完成一键AI总结:





而之所以说自由画布“把AI生产能干的事儿一锅端了”,是因为除上述功能外,自由画布的AI力,只有咱想不到,没有它做不到。

大热门AI搜索功能也“内置”其中。

它的搜索答案基于百度文库自有专业文献和全网信息,具体出处都标注得很清楚。





还有脑图生成功能,结构清晰,阅读起来简单多了:





这还没完,接下来还有重头戏——生成高质量长文

考虑到长文生成的用户往往对专业度、准确度有更高的需求,后台技术和工程做了很长时间的打磨。

体现在前台UI界面上,会自动先列大纲,不满大纲可修改,然后再生成:





最终给到的长文就是一份详细的“调研报告”,图文并茂:





报告里的内容还可以继续编辑,现在不少办公软件有的润色、缩写、扩写等AI编辑功能在画布中也能直接操作。









将“调研报告”中的数据制作成图表也是手拿把掐:





甚至还能直接将调研报告变成PPT,上传模版、自定义模版、现成模版自由挑选:





效果be like:





最后,当你的创作结束时,自由画布适配了当下知识分享最流行的形式,通过一个链接能直接进行分享、查看、二次编辑,不仅可以轻松分享到朋友圈、小红书,甚至用户还可以根据找到的资料生成语音播客。

还能直接存在个人百度网盘中当作私域资料,随用随看:





综上来看,自由画布真真儿名副其实了,“自由”体现在输入、编辑/创作、分享整个内容创作全流程的方方面面。

你想要的AI内容创作功能,都被它给包揽了。

用户所有的操作,都可以只在这一个平台端到端完成,用一个平台单挑Office全家桶+Canvas。

既不用像WPS、Office等编辑器似的不同格式需要放在不同的编辑器处理,降低了使用门槛;又相比此前AI编辑器更能精准创作出用户想要的内容,用户无需切换好几个平台用不同AI做不同任务。

emmm怎么不算一种buff叠满呢?

这种“六边形战士”也难怪会被称作是AI时代又一新物种。

打通传统产品边界的智能生产力

注意,AI起来的不只有自由画布。

从去年8月起,整个百度都在用AI重构自己,百度文库和百度网盘当然不例外。

作为累计超过10亿个人用户的App,百度网盘,此前的站位一直是“存储型”。AI大模型之力,让它升级为“一站式内容存储、管理和消费平台”,为用户提供生活、学习、工作、娱乐等多个场景的服务。

一系列AI功能也接踵砸向用户:最近的“简单听记”,在办公场景/会议场景下,特别是金融投资领域获得了很好的口碑。而以它为代表的简单系列、视频AI看等AI重点功能,都在帮助用户深度挖掘可用价值,更好地把存储在网盘的文件真正地用起来。

百度文库更是站在15年的长期资源积累上,先从跨模态领域下刀,相继推出智能PPT生成、文档生成、思维导图生成、智能小说、研究报告生成等多种AI能力,从内容获取平台,摇身一变成为“一站式AI内容获取和创作平台”。

现在两者融合,最直接受益的就是文库代表的公域知识和网盘背后的私域资料,水灵灵地被打通了。

怎么说呢,大模型不愧是大模型。

在没有大模型的年代——这句话听起来说的是很遥远的事,但其实不过两年而已,技术进步的速度太快——虽然文库和网盘同处百度生态中,但你很难想象这两个产品除了功能路径的融合,最多也就是“用文库搜索一个东西,下载后存到网盘”,然后就没有然后了。





大模型的出现,让整个产品的边界发生了变化,搜索、创作、编辑和存储在文库和网盘形成了循环

自由画布这一招,表面上看,是打通贯通了创作的起点到终点,想实现各位的输入、编辑、创作、分享自由;更深层次的角度而言,背后是百度结合自有生态,打通公域私域、打破产品边界的创举。

如果分别把文库和网盘看作两座孤岛,那么自由画布就是AI大模型浇筑的连接二者的跨岛大桥,打破技术和资源的能力孤岛,而且资源、用户共享,即刻双向通车。

技术引领创新、融合打破孤岛、生态数据飞轮形成——

全新的「智能生产力」,就此诞生。

现在市面上的AI生成随机性太强,生成的内容常常不受用户控制,无论是多少遍,都很难直接使用,“AI味儿”过于明显。

而自由画布给了用户充分“指挥”的机会,用户在每个素材上都能留下自己的要求,细节之处体现个性化的需求,生成的内容更符合用户的期待,生产的内容在行业真正达到了「直接可用」。

或许业界都没有想到,多模态AI功能All in One的第一枪,是由两个老牌产品用AI重构、打通后发出的。

或许还没有想到的是,它自由如斯,甚至不是引爆AI 2.0浪潮的ChatGPT所代表的“Chatbot”的样子。





从一开始认为“ChatBot是最好交互方式”,到质疑“ChatBot是不是最好交互方式”,再到现在自由画布出现,想法很放飞,证明“ChatBot或许真不是最好交互方式”。

也证明了,All in One的AI工具,它真的会出现,而且真的很有用、很好用。

但这一定不是百度在AI产品的终点,更不是AI在产品上的终点。


来源:网易

举报本楼

您需要登录后才可以回帖 登录 | 注册 |

手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2024-12-23 02:41 , Processed in 0.289577 second(s), 16 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部