声明:本文来自于微信公众号数字生命卡兹克,作者:数字生命卡兹克,授权靠谱客转载发布。

就在刚刚,PixVerse的v4版本上线了。

他们AI视频的模型能力,又一次迎来了飞跃。

图片

网址在这:https://app.pixverse.ai/home

2025年后的第一波AI视频的开卷来得比想象中要快,前脚OmniHuman-1刚出,紧接着PixVerse就迎来了新模型的更新。

而我5天前就拿到了体验资格,整体测下来,我的评价是:不管是文生图生还是新玩法都肉眼可见的进步不少,底层模型能力有了质的飞跃。

话不多说,直接上我测试的一些case。

文生:

1. 提示词:龙卷风,高速移动,紧张刺激,城市公路上一辆80年代的橙色复古跑车高速前进、漂移。灾难电影氛围。

image.png

2.提示词:空灵的雄鹿,身体由银色的雾气构成,在月光下闪烁着微弱的光芒。它的鹿角上装饰着浮动的光球,行动悄无声息,身后留下闪闪发光的雾迹。

image.png

3.提示词:时空扭曲跃迁序列:应用爱因斯坦场方程模拟时空弯曲,相机沿克尔黑洞视界面运动,激活时间膨胀视觉效果。在跃迁点设置时空奇点,引入彭罗斯图解算法计算光锥变形(扭曲系数145%)

image.png

而且这波PixVerse v4对于科幻硬核物理效果的支持,我只能说,太帅了。

还有一个我的好朋友@齐马橙 做的视频case,也超帅。

image.png

这个视频的Prompt是这样的:超球面维度跃迁镜头:11维空间投影运镜,使用黎曼流形轨迹算法,在维度坍缩时激活拓扑缺陷视觉预警系统。

虽然里面出现了文字,但是在我的测试下发现,文字的生成并不是特别可控。文生视频能出现,但是图生视频不太行,并且目前只支持英文。

再看图生:

1. prompt:大风天气,女人凝视镜头,远处的田野火焰蔓延。镜头推近,Zoom in。女人露出诡异的微笑。

image.png

2.prompt:机械女武士用手捂住眼睛。放下手,眼睛变成红色。站起来直视镜头。科幻电影风格。镜头拉远,Zoom Out。

image.png

语义理解和人物一致性强的没话说。

PixVerse的对物理规律理解的表现进步也很大。

真实感非常强。

比如这个《某种物质》里面的经典镜头。

image.png

融合过程自然,也没有出现不合理的形变。

镜面的反光也能轻松拿捏,强的离谱。

prompt:宇航员躺在花田里,抬起手臂。然后坐起来。

image.png

除了这些,最直观的感受就是生成速度巨快,极速版在5s左右就能出来,效率拉满真的很爽。

整体效果测下来,V4比V3.5各个方面都强了不止一个维度,新版本的V4基模绝对是AI视频目前稳稳的T1梯队,非常非常强。

说实话,我觉得PixVerse的路走的是对的,即使他们现在靠着特效模板这个功能,破了N次圈,在各种中东土豪国家的AppStore榜单上登顶,但是他们从来没有让模型的进化速度变慢,而是迭代的速度越来越快。

V1版本的上线时间是24年1月15日,V2版本是7月24,V2.5是8月22,V3是10月29,V3.5是12月29,如今V4,是2月24。

DeepSeek爆火之后,基本整个AI圈都有了一个统一的共识:

“AI唯一的应用是智能本身”

模型能力是一切的基石,你应用上的所有功能、体验的优化,都是让用户更低门槛使用“智能”的手段,它更像一个乘以模型的系数,模型能力本身是10分,叠加特效模板这种有趣的功能,乘以10就能得到一个100分的应用。

但是如果模型能力只有1分,即使你做出来了30分的牛逼到爆的功能,最后你得到的也只是一个30分的垃圾。

AI视频领域目前我觉得最典型的就是Runway,牛逼功能确实不少,比如Act-One、超级运镜等等,但是吧,半年了模型几乎就没咋大动过了,在AI时代的尺度上,半年是一个啥样的周期,懂得都懂。。。

而PixVerse我觉得就融合得很好,保持着模型的超快速度的迭代,提升模型的基础能力之后,你的其他能力才有意义。

比如说V4这次一个非常亮眼的新功能:sound。

图片

如果细心的朋友可能会发先,我前面大部分的Case都是视频,这次没用gif,是因为里面,都是带有非常自然的音效的。(之所以文生那趴不是视频是因为公众号最多一篇文章传10个视频。。。)

你只需要把Sound打开,就可以自动跟你的视频匹配音效。

图片

当然,你也可以自己描述,比如我写的一段:sound prompt:宁静的花园,清脆的鸟鸣。

image.png

而且效果我觉得非常自然,问了一下这个音效模式居然是PixVerse自己做的,我觉得比11Labs那个AI音效效果要好。

他们还有一些别的功能,什么speech(对口型)、restyle(上传一段视频,迁移成自己喜欢的风格)等等,大家可以自己试试看,我就不一一列举了。

还是那句话,底层模型牛逼了,其他叠加上的效果才有用武之地。

最后我们再看看PixVerse的看家本领,特效模板。

他们作为这个功能的开创者,这玩意是不得不聊的,得益于V4模型能力的加持,模板效果感觉都比以前的要好了。

图片

我觉得这个打架是最好玩的。。。

比如当鲜虾包骂我文章骂的太狠,我想要报复,但现实中打人是违法的,我就打开kungfu特效,上传我俩的合影,暴打他一顿。

要是实在打不过他,我就可以用Holy Wings特效直接升仙,给他来个降维打击。

真的,太抽象了。

在天庭上还遇到了哪吒和傲丙,想起有群友对他俩嗑生嗑死,于是转手把他俩的动漫合影放到了kiss特效里。(高能提醒+叠甲:不磕的兄弟姐妹们请温柔划走,我怕被打)

image.png

他两居然还知道闭眼,好好好,这细节无敌了。

特效模板我写过了N次了,这个功能是我非常看好的,而它在PixVerse V4的加持下,质感和动作又上升了一个新台阶。

说到底,模型能力才是根本。

有把“智能”本身推到更高的层次,才能让那些特效、音效、风格迁移等功能真正爆发出魔力。

卷吧。

真的很幸运,亲身参与这个大AI时代。

(举报)

点赞(9)

评论列表共有 0 条评论

立即
投稿
返回
顶部