声明:本文来自于微信公众号 数字生命卡兹克,作者:数字生命卡兹克,授权靠谱客转载发布。
大半夜的,可能是我认为做海报、做logo、做文字最猛的AI绘图产品,Ideogram,更新了他们的2.0版本。
把文字嵌入和整个图片的美学质量,又一次推上了巅峰。
可能很多人不知道Ideogram。
在AI绘图里面,这个产品确实也有一点冷门。
不过并不妨碍他,一直是我心中,做文字生成最屌的产品。
在我们做AI绘图的时候,其实过往一直都有一个痛点是,在图片里面嵌入文字,效果都很差。
比如说,我想生成一张图,大概是一个女生面对着镜子,镜子上面贴着一些纸,上面写着一些鼓励的话语。
Prompt是这样的:
A captivating vintage-inspired photograph with distressed edges, featuring a strikingly beautiful, young woman gazing into an ovalmirror. The mirror is adorned with four sticky notes displaying positive affirmations in bold text, such as 'I AM AWESOME', 'I AM LOVEABLE', 'I DESERVE RESPECT', and 'I CAN DO HARD THINGS'. Fairy lights encircle the mirror, casting a warm glow over the scene. A wooden sign at the bottom of the image reads, "Talk to yourself like someone you love." The woman sports a messy bun hairstyle adorned with flowers, and wears a verdant dress. The room exudes a cozy ambiance, and the overall mood of the image is uplifting and empowering., typography, photo
(一张充满复古风情的照片,边缘略显磨损,画面中一位美丽的年轻女子凝视着一个椭圆形的镜子。镜子上贴有四张写着积极肯定语的便签,字体醒目,如“我很棒”、“我值得被爱”、“我值得尊重”和“我能应对挑战”。镜子周围环绕着仙女灯,柔和的光线笼罩着整个场景。照片下方有一个木制的标牌,上面写着“像爱自己一样与自己对话”。女子梳着随意的盘发,发髻上点缀着花朵,身穿一袭翠绿色的连衣裙。房间氛围温馨舒适,整张照片传递出积极向上、充满力量的情感。)
这么多还分区域的字,基本没有任何一个AI,能把这些字完整的、不出错的写到图中,还能保证美感和融合。
Midjourney直接废了,纸上的字都是错的,镜子里面人都没了宛如鬼片,下面的木质标牌也没了。
而以语义理解闻名天下的Dalle3,美感极度拉跨,字也写错了,但是大的东西没丢。
我们再来看看Ideogram。
文字写的非常无敌,全都分区域分块给你写的明明白白,美感也很强,唯一不足的就是镜面的物理规律反了。
从这个case,应该就能看出,Ideogram的特点在哪了吧。
极强的文字嵌入能力,还有目前超一线的图片质量,这两个合在一起,就足够让人兴奋了。
过去很多人问我,有没有一些AI生成海报AI生成logo的产品,我只能说,没有。
因为这两个设计类别,都是以信息为主,而信息的核心载体,是文字,只有解决了文字的准确性,同时审美足够在线,你才能说这玩意,可以生成海报生成logo。
而Ideogram,终于让它们,成为了可能。
这次的2.0更新,重点更新了模型的质量,还有继续究极进化的语义理解能力,我觉得已经是吊打Dalle3的级别了。。。
网址在此:https://ideogram.ai/
写实、设计、3D、动漫,这四个类别的质量得到了大幅强化。
而Ideogram也贴心的为你设计了风格选择器。
直接选择就行,这几个分类还是我比较喜欢的,因为甩几十个类别出来也没有意义,这四个,足够了。
给大家,看看模型的效果。
写实
在写实层面,跟Flux pro和Midjourney比,我觉得也不遑多让。
设计
没啥可说的,属于断层式领先,完全秒杀全场的级别。
3D
整体差不太多,质感是OK的,上限能跟Midjourney打平,但是roll起来的成功率会低一点。
动漫
给我的一个很大的感觉就是,线条非常干净,以及这个语义理解实在是太特么强了,什么稀奇古怪的东西都能揉在一起。
Ideogram整体的模型质量,如果让我评价的话,综合质量在Flux pro之上,Midjourney之下,但同时有两块超长的长板,就是超过Dalle3的语义理解能力,以及领先一个世代的文字生成能力。
因为这两个长板,在实用性上,我觉得甚至可以跟Midjourney平起平坐了。
而且他们还有一个很有趣很棒的功能,就是Magic Prompt,跟莱昂纳多的那个Prompt优化是一样的,但是Ideogram,可以写中文,然后他帮你,自动翻译成英文。
比如我就写了简单的几句中文:“摄影棚中的时尚美女,kpop,极度真实”
它就帮我继续精细化了一堆,还翻译成了英文。
最后出来的图,是这样的。
当然,得益于他们的超强的文字嵌入功能,用它来做Banner来做海报,也终于,成为了现实。
比如做个气泡酒的banner。
A photo of a fashionable and sexy Korean K-pop idol in a photo studio. She is wearing a black leather jacket with gold buttons and a white shirt underneath. The jacket is unbuttoned, revealing her cleavage. She also wears black pants and black boots. Her hair is styled in loose waves. The background is a gray wall.
直接给你把字体设计和排版都做完了,而且画质极佳。
甚至,做个海报,都可以。
把文字能完整的嵌入图片中,替代一大部分的信息设计,我觉得这个才会能进入设计师的工作流,从而产生巨大的潜力。
在价格上,我觉得也还好,完全不贵。
Ideogram,绝对是当前,AI绘图大战的一条鲶鱼,他解决了过往关于设计、关于文字、关于实用的巨大痛点,异军突起,发光发亮。
而很好玩的是,在Ideogram发布2.0模型的2小时后。
Midjourney宣布,网页版向所有人开放,而且曾经的免费试用,再次回归。
新的AI绘图军备竞赛,感觉又要开始打响了。
希望接下来的动作。
能给现在这个AI行业,卷起一些新的风浪。
(举报)
发表评论取消回复