Qwen-Image-Edit-2509比Nano Banana更好嗎?

Qwen-Image-Edit-2509比Nano Banana更好嗎?

文章目录

  • Qwen-Image-Edit-2509有哪些新功能?
  • 使用Qwen-Image-Edit-2509進行實踐的提示
  • 任務 1:人物 + 人物
  • 任務 2:人物 + 場景
  • 任務 3:人物 + 產品廣告
  • 任務 4:使用關鍵點圖進行姿勢控制
  • 任務 5:向影像新增文字
  • 任務 6:卡通或動漫變體
  • 任務 7:產品海報
  • 評價
  • 小結

Qwen-Image-Edit-2509

我們都應該承認,九月是 Gemini Nano Banana 的月份。每個人都在嘗試這個模型,在社交媒體上釋出古怪的編輯和有趣的自拍。很有可能,你也嘗試過,或者至少在你的動態中瀏覽過十幾個名人混搭和 3D 小雕像的帖子。但是,雖然 Nano Banana 主導了影像生成的休閒方面,但 Qwen 一直在悄悄地升級專業編輯遊戲。就在上個月,該團隊釋出了 Qwen-Image-Edit,現在他們帶著升級版本回來了:Qwen-Image-Edit-2509,專注於一致性、靈活性和控制。與 8 月份的版本相比,新的更新使創作者、開發人員和研究人員的編輯功能更加強大,同時仍然對任何想要嘗試的人開放。

如果您想了解有關上一個模型的更多資訊,請閱讀我們關於 Qwen-Image-Edit 的詳細文章!

Qwen-Image-Edit-2509有哪些新功能?

與上個月的版本相比,此版本引入了四項重大改進:

多影像編輯支援

Qwen-Image-Edit-2509 現在允許您同時編輯多張圖片。該模型使用影像拼接進行訓練,支援以下組合的無縫編輯:

  • 人物 + 人物
  • 人物 + 產品
  • 人物 + 場景

它最適合 1-3 張輸入影像,並且能夠與 ControlNet 地圖(例如用於姿勢變化的關鍵點)完美整合。

增強的單張圖片一致性

在編輯單張圖片時,九月更新重點關注一致性:

  • 人物編輯:人臉在不同姿勢和肖像風格下保持其身份。
  • 產品編輯:徽標和物體保持其外觀,使產品海報更容易生成。
  • 文字編輯:您不僅可以更改文字,還可以精確調整字型、顏色和材質。

原生ControlNet支援

本次更新新增了與 ControlNet 輸入(例如深度圖、邊緣圖和關鍵點圖)的平滑整合,擴充套件了技術和藝術用例的創意控制。

改進的文字 + 影像整合

Qwen-Image-Edit-2509 現在可以無縫地將文字編輯與影像處理融合。例如,設計一張字型、樣式和視覺效果能夠一致互動的海報。

使用Qwen-Image-Edit-2509進行實踐的提示

對於所有這些任務,我都會同時使用 Qwen-Image-Edit-2509 和 Nano Banana 來比較輸出結果,並觀察 Qwen 在每項任務中的表現。

任務 1:人物 + 人物

提示詞:Use image A and image B. Merge them into one photo where both people sit on a park bench. Preserve face identity and natural lighting.”

任務 1:人物 + 人物

Qwen 影像編輯模型的新功能仍然難以保持面部特徵的完整性。如上圖所示,Nano Banana 在保留兩個人的面部特徵方面做得更好。Qwen 還修改了原始影像中的包,而 Nano Banana 則保持不變。

任務 2:人物 + 場景

提示詞:“Place this portrait into a busy Tokyo street at night with neon signs. Keep the face identity and correct skin tone.”

任務 2:人物 + 場景

Qwen 在保留面部表情和整體畫質方面做得非常出色。燈光和整體畫面的融合看起來也不錯。然而,Nano Banana 更進一步,根據照片對背景燈光進行了編輯,使其看起來更加真實。

任務 3:人物 + 產品廣告

提示詞:“Use this portrait and this product image. Make it look like an ad where the person holds the product. Keep product label readable.”

任務 3:人物 + 產品廣告

在這項任務中,我使用相同的提示將模特和產品的影像新增到兩個模型中。Qwen 的輸出效果更好,而 Nano Banana 則只是簡單地將兩張照片放在一起,沒有仔細考慮如何將它們組合在一起。

任務 4:使用關鍵點圖進行姿勢控制

下圖展示瞭如何利用一張影像中的關鍵點姿態圖,將特定姿態遷移到另一張影像中的人物,同時保留其面部特徵。這些示例還展示瞭如何將這項技術與其他複雜的編輯任務(例如更改背景和操作物件)相結合。

任務 4:使用關鍵點圖進行姿勢控制

我在以下提示中使用了 Qwen 的這個新功能:

提示詞:“Use this portrait and this keypoint pose map. Repose the person to match the map while keeping facial identity.”

Qwen Image Edit 明確支援關鍵點引導編輯

Qwen Image Edit 明確支援關鍵點引導編輯。因此,您的草圖 + 關鍵點疊加層能夠完美同步。它知道如何讀取關鍵點圖,然後調整生成條件。如果您想嘗試姿勢、角度、姿態或與地標(例如埃菲爾鐵塔、顧特卜塔、泰姬陵、阿克薩達姆神廟)的互動,您應該堅持使用 Qwen Image Edit(或任何提及“姿勢控制”/“關鍵點調整”的模型)。

然而,Nano Banana 沒有關鍵點圖調整管道。因此,它只是重新傳送您的輸入影像而不進行任何更改:它可以編輯樣式、紋理、背景交換等,但它不會解析或強制執行人體/物體姿勢圖。

任務 5:向影像新增文字

提示詞 :“The girl in the uploaded image is holding a chalk board with the text “Join my GenAI Masterclass to Become an Expert in 2025″ written on it”

任務 5:向影像新增文字

對比兩份回覆,Qwen 的版本明顯更勝一籌。Qwen 版本的文字在黑板上自然排列,與視角完美對齊,看起來就像真的在黑板上一樣。字型風格一致、簡潔、易讀,使資訊傳達得更加清晰。文字與黑板表面無縫銜接,最終效果令人感覺真實逼真。

另一方面,Gemini 的回覆看起來更像是數字疊加。文字的對齊方式與黑板的角度並不完全匹配,字型樣式看起來不像粉筆書寫,更像是標準的電子文字。因此,文字感覺像是貼上在黑板上,而不是融入其中。

任務 6:卡通或動漫變體

提示詞:“Turn this picture into an anime style character while preserving the same face identity and expression.”

任務 6:卡通或動漫變體

兩個結果中,Qwen-Image-Edit-2509 的版本明顯更勝一籌,因為它將人物完全轉化為動漫風格的角色,同時保留了相同的服裝、姿勢和表情,忠實地符合任務提示。而 Nano Banana 的版本看起來與輸入照片幾乎完全相同,幾乎沒有動漫風格,因此它並沒有真正滿足“動漫角色”的要求,感覺更像是輕微的修飾而非變形。

任務 7:產品海報

提示詞:“Make a clean marketable poster for this shoe. Use a plain background. Add the product name at the bottom in bold type saying – SoulShoe”

Qwen-Image-Edit-2509比Nano Banana更好嗎?配圖8

兩者相比,Qwen 的海報更勝一籌,因為它超越了簡單的展示,真正地營銷了產品。發光效果使鞋子脫穎而出,“舒適與時尚的交融”的標語增添了情感吸引力,“限量版”徽章營造出緊迫感,所有這些都讓它看起來像一場精心打造的廣告宣傳。而 Gemini 的作品雖然簡潔專業,但感覺更像是一張簡單的產品目錄圖,而非一張具有市場價值的海報。

評價

Nano Banana 趣味盎然、易於上手,且易於分享;非常適合用於表情包、自拍和社交潮流。而 Qwen 結構清晰、功能多樣且易於製作,對於追求可靠性的創作者、設計師和專業人士來說,它是更佳選擇。

小結

AI 影像模型正在逐月改進。8 月我們釋出了第一個 Qwen Image。9 月我們迎來了這個新版本,它支援多影像,並且一致性更高。下個月,誰知道會發生什麼呢?如果你喜歡嘗試,那就開啟 Qwen Chat,嘗試我分享的提示。從一些簡單的事情開始,比如把自己置於新的背景中。然後過渡到多影像編輯和海報製作。

我會繼續測試並分享有效的方法。如果你嘗試了這些提示中的任何一個,請告訴我你的結果。有時,樂趣就在於驚喜。

評論留言