地表最强AI绘图又更新，手把手教你玩转这些新功能（人群绘画）

在北京时间6月23日清晨，全球知名的AI图像生成工具 Midjourney 推出了令人期待的v5.2版本更新。自上一版本发布以来已过去一个多月，其间AI技术和图像生成工具领域的竞争日益激烈。Photoshop等软件在AI功能方面取得显著进展，获得业界广泛赞誉。

面对这种压力，Midjourney v5.2版本更新通过引入创新功能和优化现有功能，进一步巩固了其在行业中的领导地位。本文将深入探讨这次更新的内容，分析其与前版本及竞品之间的差异，并体验Midjourney最新的功能和性能。

首先，我们需要进入Discord并在Midjourney的设置界面中将生成模型版本更新至5.2版本（仅限付费用户，关于购买攻略请自行搜索，国内也有代充业务）。

本次更新引入了一些关键新功能，为用户带来更丰富的体验。这些新功能包括：全新的美学风格设计，修复了风格化命令的问题，新增高变异模式以满足多样化需求，提示词分析功能帮助用户更好地掌握设计元素，以及具有针对性的图片填充功能，与PS AI相媲美。

Midjourney V5.2

接下来，我们将通过对比5.1版本和5.2版本生成同样Prompt的内容，来感受全新的美学风格设计。在第一组对比中，我们选择了一个模拟胶片质感的人像案例作为测试。Prompt如图所示：

Midjourney V5.1

Midjourney V5.2

两组照片都成功展示了关键词中的内容，新版本在光影细节与画面内容的生成（如车辆）方面更为进步，但手部细节仍存有问题。

随后，我们进行了针对物品的AI生成测试。因为DIY频道喜欢拆解硬件，所以我们让AI生成一组硬件的平面拆解图。Prompt如下：

Midjourney V5.1

Midjourney V5.2

这一组作品的对比充分体现了AI在还原较为复杂物品图像方面的局限。尽管两个版本的AI都试图还原一个“他们眼中电脑内部”的样子，但实际生成的图像在质感上虽达到摄影级，内部构造却与真实电脑相差甚远。相较之下，5.2版本在还原细节方面更加真实。

最后一组对比聚焦于中国传统山水画，以探讨两者在解析传统艺术方面的表现。Prompt如下：

Midjourney V5.1

Midjourney V5.2

虽然我对艺术的了解有限，但这两张图片在第一眼看上去都颇具观赏价值。宁静致远的场景与国画中简练的笔触相得益彰。然而，两者仍存在过多细节，缺少了传统山水画中留白的意境。5.2版本在构图平衡感上更出色，其背景山峰的层峦叠嶂感也更具美感。

下面是我从MJ官方论坛和一些爱好者的发布内容中选取的v5.2版本Ai生成图像：

Midjourney V5.2

第二个重要的更新便是与PhotoShop前段时间推出的Ai拓展图像一样的图片填充功能。

用户可以通过指令来调整图片，这些命令主要用于调整图像尺寸和填充细节。"[Zoom Out 1.5x]" 和 "[Zoom Out 2x]" 分别表示将图像缩小到原来的1.5倍和2倍，并在四周填充相应的细节。"[Make Square]" 命令用于将非正方形图像变为正方形，通过在两侧添加细节实现。"[Custom Zoom]" 是一个高级功能，它会弹出一个文本框，允许用户在缩小图像的同时，自定义更改提示词、宽高比或精确缩小比例，以便更好地满足个性化需求。

接下来我们测试一下基于这张“战斗海狸鼠”看看Ai能够拓展出什么意想不到的图片出来，首先是1.5X的缩放。

嗯，场景感出来了，接下来是2X的缩放。

阴暗的天空，合适的背景虚化，主角左边的道具，水中的倒影，非常出色的拓展表现，最后我们再来测试一下进行一下自定义的拓展。我们可以对原来的Prompt进行修改，并修改尺寸等。我们增添了一个关键词是“一个大型的盒子里面”，意思是这只小耗子周围的场景都处于一个盒子中，看看Ai能否正确识别并理解并画出来。

看来它并没有理解“盒子”的概念，但仍然通过创意打造了一个较为惊喜的画面场景。

接下来看一下Ai爱好者们的实际案例：

通过我们的实际测试和案例分析，Midjourney V5.2的缩放填充功能表现出色，与Photoshop中的AI填充技术相媲美。然而，Midjourney V5.2的局限性在于它目前仅能对AI生成的图像进行填充处理，无法对现实拍摄的照片或其他来源的图像进行缩放填充，而Photoshop则可以实现这一功能。

AI图像填充本质上利用了类似于OpenAI的DALL-E所描述的外部绘制（outpainting）技术，根据简单的文本提示快速且无损地添加或删除图像内容，同时自动匹配图像中的透视、光线和风格。这为编辑者提供了快速尝试和迭代不同创意概念的能力。

Midjourney V5.2

接下来我觉得对用户蛮重要的更新点是新的/shorten 命令，这让你可以“简化”一个提示，得到关于哪些词可能没啥用和哪些词可能关键的建议，这个对优化提示词非常重要。首先我们写一个非常冗长的Prompt丢给Midjourney，看看它能怎么优化。

优化结果，分成了逐渐减少关键词的五条建议：

点击 show details 可以显示提示词中每个词的具体权重。

我们来看看其优化后的Prompt的生成结果到底如何，首先是未经优化的长文本Prompt：

Midjourney V5.2

然后是经过优化后的第一条Prompt，拥有与原文相似的关键词矩阵，但简化了内容，只保留了机器能读取的信息：

Midjourney V5.2

接着是经过简化后的最后一条Prompt，只保留了画面最重要的主体信息和绘画风格描述：

Midjourney V5.2

从实际效果来看，经过简化后的第一个Prompt（带有许多细节描述词）的会更加出色，出图效果也最满足我的本意。

总结，Midjourney v5.2的更新在功能和性能方面都取得了显著的进步。尤为突出的是，其针对性图片填充功能与Photoshop的AI工具相媲美。然而，得益于不断的技术创新与迭代，Midjourney在未来版本中仍具有广阔的提升空间。相较于Photoshop和其他竞品，Midjourney 在简化使用与操作方面仍有待加强。我们期待V6版本能够推出更加用户友好的客户端 App，不仅局限于Discord上的体验。

丰富的用户群体创意，才是Ai发光发热的基础

END

我就知道你“在看”