用AI生成视频，赚到人生的第一桶金

2024-11-21 21:30 12 阅读 0 评论 8 点赞

声明:本文来自于微信公众号骨朵网络影视，作者:未盈，授权靠谱客转载发布。

今年年初，OpenAI发布了“文生视频”的工具Sora，仅凭几段视频，就让很多人见识到了AI生成视频的力量。

它可以将一个女人在街上走路的相关提示词内容，生成一段堪比好莱坞大片的影视特效，相比于之前的AI生成视频工具，Sora用实力证明了AI不是人工智障，而是潜力无穷的人工智能。

这款工具的横空出世，就像一颗石头扔进了平静的海面，掀起了重重巨浪，有的人感到自己的饭碗受到了威胁，产生了严重的失业焦虑，而有的人则认为不会冲击到自己所处的领域，坚信人的创造力远超于没有灵魂的AI。

而就在大家众说纷纭之时，敢于吃螃蟹的聪明人已经用AI赚到了人生的第一桶金。

AI创业小团队的商业模式

我们今天的故事，要从一个创业小团队开始说起。

主攻AI生成视频赛道的西羊石团队，是由三个年轻人组成的，一个大厂员工西堂，一个名校毕业生羊羊，一个程序员小石。

最初他们都对AI生成视频很感兴趣，在同一个知识付费社群里相识，看到今年年初Sora的技术大爆发，感觉行业时机成熟，可以做一些商业化的项目，于是三人一拍即合，在今年四月开始创业。

最初，西羊石团队是在视频号上，发布一些AI视频作品（文旅广告片，儿童寓言故事等等）来吸粉，几个月时间就打造了一个粉丝数过万的IP账号，在这期间，有一部分敢于尝鲜的公司向他们投来了橄榄枝。他们逐步开辟了第一条可以盈利的商业路径，就是制作to B、G端的广告片、文旅片。

相比于传统影视公司制作的广告片，西羊石团队中的小石认为，AI生成视频广告片的优势是成本更低、性价比更高，“我们通过AI技术可以基本达到传统影视广告的效果，甚至有些视频更适合用AI去做，相同效果的基础上，我们节省了购买拍摄器材的成本、实地拍摄的人力和资源成本，相当于成本只有传统影视广告的1/10到1/5。”

对于很多追求性价比的客户来说，他们会选择尝试AI生成视频，尤其是一些淘宝平台的中小商家和地方文旅，对此接受程度更高。所以西羊石团队自从创业以来，并不愁接商单，短短七个月，在广告片上的营收就达到了20多万元，这对于一个没有任何高成本投入的三人团队来说，已经是赚到了第一桶金。

同时他们还在开辟第二条商业化路径，那就是通过在互联网上打造个人IP，吸引那些想要学习AI生成视频的人，针对性地提供教学服务。简单来说，就是针对C端的知识付费。

他们围绕着AI绘画视频教程和AI视频案例拆解，搭建了一个阶梯明确的教学体系，既有价值10元的AI视频教学，也有价值百元的AI视频陪伴群，还有价值五千元的AI视频私教课程。其中10元的体验课购买人数最多，学员群里目前已经发展到了五千多人，而价格较高的私教课程，也有50个忠实用户。

从小石的观察来看，愿意为AI生成视频课程花费高昂价格的用户，往往都是从事互联网行业的人，年龄在30岁左右，有很多都是程序员，也有不少视频制作爱好者，想要尝试用AI生成视频做副业。因为社群基因偏向于互联网行业，传统影视行业从业者比较少。

虽然起步晚，但随着学员越来越多，西羊石团队第二条商业化路径的营收也水涨船高，目前将近20多万元，和TO B端的营收持平。这第二条路子，相比起定制化的广告片，商业化推广会更快，产品也更容易实现规模化的复制。而且这个创业小团队，也用自己的商业化成功，向更多学员证明了这条路的可行性。在他们的授课下，目前也已经有25个学员成功靠AI生成视频赚到了钱。

当下虽然AI生成视频的概念很火，但技术仍不成熟，对于整个视频行业来说，思想上的冲击远大于实际的冲击，更多的客户还是会优先选择传统影视行业进行合作，留给AI生成视频团队的机会并不多。

可AI的出现，无疑给所有人心里都种下了一个焦虑的种子，很多人都渴望掌握技术的先机，而不是被技术淘汰，所以关于AI的各类教学课程在网上很火，人们买的不仅是课程，更是一份对未来的投资。很显然，在未来，得AI者才能得天下。

如何用AI生成视频?

传统影视的拍摄流程大家都很熟悉，但是应该如何用AI生成一支视频呢?这是一件看似很简单，但其实很有技术含量的事情。

骨朵曾经多次用某AI生成视频软件的文生视频来做出自己想要的内容，结果发现生成出来的一个比一个更离谱，AI属实是已读乱回。细细研究之后才发现，原来AI生成视频里面也有很多门道，不只是要输入准确的提示词，更要掌握正确的流程方法。

小石告诉骨朵:“我们目前AI生成视频的全流程是先用ChatGPT等AI生成文字软件，来生成文字剧本，再用MJ/comfyui等AI生成图片软件，将文字变成图片，然后用runway等图生成视频软件，将图片变成视频，最后再用剪映等软件来剪辑素材，形成正片。”

之所以要用图生视频，最重要的原因是，“在文生视频、图生视频、视频转绘这三种方式中，如果想要视频稳定且保持风格人物一致，图生视频的效果是最好的。”小石说。

在正确的流程方法基础上，擅用提示词也很重要，不然AI就会已读乱回。一个准确的提示词，能生成出一张恰到好处的图片，继而生成出合适的视频素材。“我们在写提示词时，首先会确定图像主体，包括背景主体和图片风格，在这个基础之上，会进一步针对不同细节、角度、光线进行详细描述，才能生成出合适的图片。”

比如这张14岁的“坏蛋”男学生图片，西羊石团队所使用的提示词就是先描述动画风格，再描述男孩子的细节，最后是他的神态:“Chinese anime style，10years old，full body photo， short hair， inch long， in the classroom， a modern Chinese male student， rebellious and fierce.”

生成了合适的图片后，西羊石团队会将两张静态图片作为前后帧导入AI生成视频软件，来形成一支动态的视频。这样一整套流程下来，除去和客户沟通的时间，制作一支AI广告片只要3到7天。

最近西羊石团队就做了一支香菇肉酱的广告片，这支广告片展现了香菇肉酱的熬制过程，和流淌在香喷喷米饭上的质感，令人垂涎欲滴。其中近距离的食物特写和酱料流动的细节处理，都逼近于实拍的效果。

西羊石AI视频，赞41

这支广告片的制作流程，据团队表示，首先是用Midjourney生成高质量的色彩鲜艳的食物素材图片，然后用这些图片来生成视频，并通过Runway最新的Gen-3来制作酱料流动的视频特效，使视频看起来更加丝滑和连贯，最后用轻快的剪辑、活力的BGM和艺术字，来共同烘托出这个产品的独特风味。

AI生成视频软件的竞争格局

不得不说，AI生成视频的效果，确实令人惊艳，有些视频甚至令人难辨真假，观感宛如实地取景拍摄了一样，但是有些视频又会令人觉得太离谱，产生了各种各样“手脚错位”的恐怖谷效应。

根本上，是因为AI还太不可控，所以反复游走在惊艳与离谱之间。瀚皓科技CEO吴杰茜曾表示，可控性是文生视频当前最大的痛点之一，很多团队都在做针对性的优化，尽量做到生成视频的可控。

在这点上，小石也深有同感，他在使用AI生成视频时也遇到了很多困难。“第一是AI的理解程度不高，比如我们想要某一个物体动，但是它生成出来的所有物体都在动，所以我们需要尝试很多次才能输出合适的视频;第二是人物的稳定性不高，视频前后的人物主体不一致，所以我们需要通过AI绘画、AI换脸进行精细化的调试;第三是审美不太行，两个画面的衔接很生硬，就像PPT一样，不够流畅。”

这些种种不可控的因素，是AI生成视频还难以大范围推广的根本原因，所以很多传统影视行业的从业者也会觉得，目前AI的实力被过分夸大了，它的智商还相当于几岁小孩，无法有效协助工作，AI生成视频离真正落地最起码还有3到5年。而作为新兴AI生成视频的从业者，小石认为关键的技术引爆点将是，“如果AI生成视频的人物一致性能够控制好，算力规模能够进一步升级，就能更快更好地生成视频，实现大范围的推广。”

如果AI生成视频真的能够硬刚传统影视行业，那么哪家AI公司能在这场没有硝烟的商战中拔得头筹呢?

小石综合自己所使用过的AI生成视频软件，做了一个整体的优劣势分析。他认为:“国内的可灵软件，优势是操作简单，人物稳定性不错，劣势是审美不行，画面衔接不连贯，对于复杂场景支持的不够;即梦软件，优势是人物表情富有表现力，整体绘画风格比可灵要好，劣势是画面一致性不高。国外luma软件的优势是首尾帧转换很丝滑，劣势就是价格高。综合下来runway的效果是最好的，无论是对于提示词的理解、场景的稳定性、审美的艺术性，还是性价比，都在一众软件中脱颖而出。”