AI图像生成工具Imagine with Meta初体验

AI图像生成工具Imagine with Meta初体验

Meta 于去年年底发布了一款新的独立 AI 图像生成器产品。与其他人工智能工具不同的是,该产品是以 Meta 品牌发布的。

Imagine with Meta 是免费的,但需要注意的是,图像可能不准确或不合适。此外,它目前只在美国上市。

通过这款新产品,Meta 展示了其在人工智能研究方面的悠久历史,开发并开源了该领域一些最强大、最重要的工具。它也在与 Midjourney、Stable Diffusion 和 OpenAI 等大公司竞争。

Imagine 是支持 WhatsApp、Instagram 和 Facebook 图像生成功能的底层模型。它还为 Messenger 群组聊天中的全新 reimagine 功能提供动力,该功能可让参与者共同制作人工智能图像。

Imagine with Meta:它有何与众不同之处?

Imagine 的工作方式与 ChatGPT 中的 DALL-E 3 或 StabilityAI 的 SDXL 1.0 等工具的最大区别在于粒度。与较早的人工智能模型不同,Imagine 无法让你对输出的各个方面进行微调或控制。

你只有一个文本提示来定义你希望模型创建的图像。你可以设置变量,比如确保它以某种风格创建图像,但你不能改变图像的大小、分辨率或生成的图像数量。

它根据提示为您提供了四种选择,均为正方形格式,分辨率为 1280×1280(比 DALL-E 3 稍大),且均带有 Meta 水印。

令人印象深刻的速度

Imagine with Meta 与其他图像生成器最显著的区别之一就是速度。它几乎能立即生成图像,与我最近测试过的 StabilityAI 快速实时图像生成器 SDXL Turbo 的生成时间差不多。

这种快速生成可能是由于它相对较新,不像其他大公司那样被广泛使用。也可能是因为 Meta 专注于大规模提供人工智能。

测试 Imagine with Meta

用 Meta Imagine为了用 Meta 测试 Imagine,我从 ChatGPT 中寻找灵感。我让 OpenAI 的高级版聊天机器人制作了一系列提示,让图像生成器通过测试,并测试其全部功能。

这些提示包括创建复杂多样的场景、艺术风格、复杂的叙事元素、未来主义和幻想场景以及详细的徽标和品牌概念。

维多利亚蒸汽朋克

AI图像生成工具Imagine with Meta初体验

(Image: © AI generated image (Meta))

首先是一个城市景观,特别是一个带有蒸汽朋克风格的维多利亚城市。它需要充斥着黄铜和铜制的华丽建筑,人们穿着维多利亚时代的服装,并配有机械装置。

它创造了一个有吸引力和引人入胜的形象,但并没有真正满足蒸汽朋克的要求。它看起来更像是一个典型的英国维多利亚时代的街景,空无一人的道路和商店。

水下外星人

水下外星人

(Image: © AI generated image (Meta))

接下来,我让 Imagine 生成外星球的水下世界,要求它用大胆的色彩描绘生物发光的植物和生物。它还需要考虑到地球上并不明显的生命多样性,并运用阴影。

这幅作品很好地捕捉到了这一提示的超凡脱俗的本质。它描绘了前景的自然景象和游乐场中发光的城市。唯一的问题是,它描绘了夜空中的星星,而整个场景应该是在水下深处。

走向未来

走向未来

(Image: © AI generated image (Meta))

在下一个提示中,我们前往火星。特别是一个未来的火星殖民地,那里有圆顶的栖息地,还包括红色星球上的沙漠景观。我觉得这幅作品有点滑稽,但它并没有告诉我们要创建一幅逼真的图像。

最大的问题是所有图像生成器在创建行星图像时都会遇到的一个问题–它在行星表面放置了奇怪的版本,并在天空中随机生成了卫星。

暮色中的神话森林

暮色中的神话森林

(Image: © AI generated image (Meta))

最后生成的摄影图像是黄昏时分的神话森林。这需要 Imagine 使用 Meta 生成不同层次的光照。它必须显示古老而巨大的树木、森林地面上的发光蘑菇以及仙女和精灵等虚幻的生物。

这与水下外星人的形象有一些相似之处。它将树木描绘成背景特征,重点放在蘑菇上。它选择的神话生物不是精灵和仙女,而是独角兽。

文本挑战

文本挑战

(Image: © AI Image (Meta))

最后,我请 Imagine with Meta 为一家名为 “篮子里的猫” 的虚构纱线销售企业生成一个徽标。这项挑战不仅要看它如何诠释徽标,还要看它如何在图像中生成文字。在一般的模型中,只有 DALL-E 3 能很好地做到这一点。

它创建了一个有趣的徽标,但对文字的处理却与 SDXL 1.0、Midjourney 或 OpenAI 的 DALL-E 先前版本相差无几-完全不是很好。它乱码了文字,把 “A Catt ia ana Batkett” 写成了 “A Catt ia ana Batkett”,就像在用晦涩难懂的古老英语方言写作一样。不过徽标很可爱。

评论留言