经验 1175 分贝 0 家园分 2371 在线时间: 6 小时 最后登录: 2010-6-8 帖子: 584 精华: 0 注册时间: 2010-4-28 UID: 523373
注册:2010-4-28 5
今年年初,OpenAI发布了“文生视频”的工具Sora,仅凭几段视频,就让很多人见识到了AI生成视频的力量。
它可以将一个女人在街上走路的相关提示词内容,生成一段堪比好莱坞大片的影视特效,相比于之前的AI生成视频工具,Sora用实力证明了AI不是人工智障,而是潜力无穷的人工智能。
这款工具的横空出世,就像一颗石头扔进了平静的海面,掀起了重重巨浪,有的人感到自己的饭碗受到了威胁,产生了严重的失业焦虑,而有的人则认为不会冲击到自己所处的领域,坚信人的创造力远超于没有灵魂的AI。
而就在大家众说纷纭之时,敢于吃螃蟹的聪明人已经用AI赚到了人生的第一桶金。
AI创业小团队的商业模式
我们今天的故事,要从一个创业小团队开始说起。
主攻AI生成视频赛道的西羊石团队,是由三个年轻人组成的,一个大厂员工西堂,一个名校毕业生羊羊,一个程序员小石。
最初他们都对AI生成视频很感兴趣,在同一个知识付费社群里相识,看到今年年初Sora的技术大爆发,感觉行业时机成熟,可以做一些商业化的项目,于是三人一拍即合,在今年四月开始创业。
最初,西羊石团队是在视频号上,发布一些AI视频作品(文旅广告片,儿童寓言故事等等)来吸粉,几个月时间就打造了一个粉丝数过万的IP账号,在这期间,有一部分敢于尝鲜的公司向他们投来了橄榄枝。他们逐步开辟了第一条可以盈利的商业路径,就是制作to B、G端的广告片、文旅片。
相比于传统影视公司制作的广告片,西羊石团队中的小石认为,AI生成视频广告片的优势是成本更低、性价比更高,“我们通过AI技术可以基本达到传统影视广告的效果,甚至有些视频更适合用AI去做,相同效果的基础上,我们节省了购买拍摄器材的成本、实地拍摄的人力和资源成本,相当于成本只有传统影视广告的1/10到1/5。”
对于很多追求性价比的客户来说,他们会选择尝试AI生成视频,尤其是一些淘宝平台的中小商家和地方文旅,对此接受程度更高。所以西羊石团队自从创业以来,并不愁接商单,短短七个月,在广告片上的营收就达到了20多万元,这对于一个没有任何高成本投入的三人团队来说,已经是赚到了第一桶金。
同时他们还在开辟第二条商业化路径,那就是通过在互联网上打造个人IP,吸引那些想要学习AI生成视频的人,针对性地提供教学服务。简单来说,就是针对C端的知识付费。
他们围绕着AI绘画视频教程和AI视频案例拆解,搭建了一个阶梯明确的教学体系,既有价值10元的AI视频教学,也有价值百元的AI视频陪伴群,还有价值五千元的AI视频私教课程。其中10元的体验课购买人数最多,学员群里目前已经发展到了五千多人,而价格较高的私教课程,也有50个忠实用户。
从小石的观察来看,愿意为AI生成视频课程花费高昂价格的用户,往往都是从事互联网行业的人,年龄在30岁左右,有很多都是程序员,也有不少视频制作爱好者,想要尝试用AI生成视频做副业。因为社群基因偏向于互联网行业,传统影视行业从业者比较少。
虽然起步晚,但随着学员越来越多,西羊石团队第二条商业化路径的营收也水涨船高,目前将近20多万元,和TO B端的营收持平。这第二条路子,相比起定制化的广告片,商业化推广会更快,产品也更容易实现规模化的复制。而且这个创业小团队,也用自己的商业化成功,向更多学员证明了这条路的可行性。在他们的授课下,目前也已经有25个学员成功靠AI生成视频赚到了钱。
图源:西羊石AI视频
当下虽然AI生成视频的概念很火,但技术仍不成熟,对于整个视频行业来说,思想上的冲击远大于实际的冲击,更多的客户还是会优先选择传统影视行业进行合作,留给AI生成视频团队的机会并不多。
可AI的出现,无疑给所有人心里都种下了一个焦虑的种子,很多人都渴望掌握技术的先机,而不是被技术淘汰,所以关于AI的各类教学课程在网上很火,人们买的不仅是课程,更是一份对未来的投资。很显然,在未来,得AI者才能得天下。
如何用AI生成视频?
传统影视的拍摄流程大家都很熟悉,但是应该如何用AI生成一支视频呢?这是一件看似很简单,但其实很有技术含量的事情。
骨朵曾经多次用某AI生成视频软件的文生视频来做出自己想要的内容,结果发现生成出来的一个比一个更离谱,AI属实是已读乱回。细细研究之后才发现,原来AI生成视频里面也有很多门道,不只是要输入准确的提示词,更要掌握正确的流程方法。
小石告诉骨朵:“我们目前AI生成视频的全流程是先用ChatGPT等AI生成文字软件,来生成文字剧本,再用MJ/comfyui等AI生成图片软件,将文字变成图片,然后用runway等图生成视频软件,将图片变成视频,最后再用剪映等软件来剪辑素材,形成正片。”
之所以要用图生视频,最重要的原因是,“在文生视频、图生视频、视频转绘这三种方式中,如果想要视频稳定且保持风格人物一致,图生视频的效果是最好的。 ”小石说。
在正确的流程方法基础上,擅用提示词也很重要,不然AI就会已读乱回。一个准确的提示词,能生成出一张恰到好处的图片,继而生成出合适的视频素材。“我们在写提示词时,首先会确定图像主体,包括背景主体和图片风格,在这个基础之上,会进一步针对不同细节、角度、光线进行详细描述,才能生成出合适的图片。”
比如这张14岁的“坏蛋”男学生图片,西羊石团队所使用的提示词就是先描述动画风格,再描述男孩子的细节,最后是他的神态:“Chinese anime style,10 years old,full body photo, short hair, inch long, in the classroom, a modern Chinese male student, rebellious and fierce.”
图源:西羊石AI视频
生成了合适的图片后,西羊石团队会将两张静态图片作为前后帧导入AI生成视频软件,来形成一支动态的视频。这样一整套流程下来,除去和客户沟通的时间,制作一支AI广告片只要3到7天。
最近西羊石团队就做了一支香菇肉酱的广告片,这支广告片展现了香菇肉酱的熬制过程,和流淌在香喷喷米饭上的质感,令人垂涎欲滴。其中近距离的食物特写和酱料流动的细节处理,都逼近于实拍的效果。
这支广告片的制作流程,据团队表示,首先是用Midjourney生成高质量的色彩鲜艳的食物素材图片,然后用这些图片来生成视频,并通过Runway最新的Gen-3来制作酱料流动的视频特效,使视频看起来更加丝滑和连贯,最后用轻快的剪辑、活力的BGM和艺术字,来共同烘托出这个产品的独特风味。
AI生成视频软件的竞争格局
不得不说,AI生成视频的效果,确实令人惊艳,有些视频甚至令人难辨真假,观感宛如实地取景拍摄了一样,但是有些视频又会令人觉得太离谱,产生了各种各样“手脚错位”的恐怖谷效应。
根本上,是因为AI还太不可控,所以反复游走在惊艳与离谱之间。瀚皓科技CEO吴杰茜曾表示,可控性是文生视频当前最大的痛点之一,很多团队都在做针对性的优化,尽量做到生成视频的可控。
在这点上,小石也深有同感,他在使用AI生成视频时也遇到了很多困难。“第一是AI的理解程度不高,比如我们想要某一个物体动,但是它生成出来的所有物体都在动,所以我们需要尝试很多次才能输出合适的视频;第二是人物的稳定性不高,视频前后的人物主体不一致,所以我们需要通过AI绘画、AI换脸进行精细化的调试;第三是审美不太行,两个画面的衔接很生硬,就像PPT一样,不够流畅。 ”
这些种种不可控的因素,是AI生成视频还难以大范围推广的根本原因,所以很多传统影视行业的从业者也会觉得,目前AI的实力被过分夸大了,它的智商还相当于几岁小孩,无法有效协助工作,AI生成视频离真正落地最起码还有3到5年。而作为新兴AI生成视频的从业者,小石认为关键的技术引爆点将是,“如果AI生成视频的人物一致性能够控制好,算力规模能够进一步升级,就能更快更好地生成视频,实现大范围的推广。”
如果AI生成视频真的能够硬刚传统影视行业,那么哪家AI公司能在这场没有硝烟的商战中拔得头筹呢?
小石综合自己所使用过的AI生成视频软件,做了一个整体的优劣势分析。他认为:“国内的可灵软件,优势是操作简单,人物稳定性不错,劣势是审美不行,画面衔接不连贯,对于复杂场景支持的不够;即梦软件,优势是人物表情富有表现力,整体绘画风格比可灵要好,劣势是画面一致性不高。国外luma软件的优势是首尾帧转换很丝滑,劣势就是价格高。综合下来runway的效果是最好的,无论是对于提示词的理解、场景的稳定性、审美的艺术性,还是性价比,都在一众软件中脱颖而出。”
虽然国外的软件要比国内软件起步更早,在某些性能上优于国内软件,但国内的AI生成视频大模型却有一个独家优势,那就是天然对中文的理解力更强,能在大数据的支撑下,生成更符合中国语境的视频,比如一些国风和文旅类的视频。
而且惊艳了众人的Sora至今都没有向公众开放,也许Open AI 还在憋着一个新的大招。这场AI公司的大战,谈论谁是冠军也许言之尚早,但毫无疑问,它们将彻底改变影视行业。一旦 AI生成视频突破了技术的瓶颈,人们真的可以用寥寥几句话或几张图就生成出逼真的影像时,影视行业的高门槛将不复存在。
人人都可以成为影视创作者,只要有一台电脑,就能实现脑海中的剧本。那一天会让很多人丢掉饭碗,也会让很多人乘风而上,赚到人生中的第一桶金。而在那一天来临之前,我们唯一能做到的就是更了解AI——这个不知疲倦的学习机器,这个人类最强大的对手,同时也是帮手。
来源:36kr