Grok Imagine：這個新的影片生成模型水平如何？

八月初，Grok 已成為美國、英國和新加坡等主要國家/地區 App Store 下載量最高的應用。雖然 Grok-4 是一款非常出色的法學碩士 (LLM) 課程，但這款聊天機器人缺少了最熱門的 AI 功能之一——影片。不過，埃隆·馬斯克似乎也感受到了這種“錯失恐懼症 (FOMO)”的影響。因此，他和他的團隊剛剛釋出了 Imagine：一款基於 AI 的影片生成功能，並應用於他們的聊天機器人中。

它能與谷歌的 Veo 3 或 OpenAI 的 Sora 媲美嗎？繼續閱讀，解答您的所有疑問。此外，本文章還將指導您瞭解 Imagine 是什麼、如何使用它以及它可以做什麼。

什麼是Grok Imagine？

Grok Imagine 是 X 的 Grok 聊天機器人中最新的影片生成功能，能夠生成影像和影片。它使用簡單的文字提示即可生成高質量的輸出。

Grok Imagine 現在製作*影片*的時間僅為主要競爭對手製作單張圖片所需時間的一半到四分之一！——埃隆·馬斯克

毋庸置疑，Imagine 的速度和激情是毋庸置疑的。它操作簡單，任何具備基本提示技能的人都可以使用 Grok 的 Imagine 將自己的想象變為現實。生成的影片時長為 6 秒，比 Veo 3 製作的影片短，但比 OpenAI 的 Sora 長。

Grok Imagine的主要功能有哪些？

Imagine 的一些主要功能包括：

文字轉影像/影片生成：該模型根據文字提示建立影像和影片。使用者只需提供他們想要的內容的詳細描述，模型即可快速生成內容。
影像轉影片生成：該模型還可以使用上傳的影像作為參考來製作影片，將靜態圖片轉換為動態場景。

影像轉影片生成

音訊整合：影片包含 AI 生成的音軌，可自動與視覺效果同步，完美契合氛圍和主題。這裡沒有靜音片段！
更少限制：想要激發創造力？啟用“Spicy 模式”即可繞過嚴格的篩選，探索更具前衛感、更少審查的輸出。非常適合喜歡突破界限的創作者。但涉及敏感內容時，仍然需要注意。

Grok Imagine 護欄

速度與創意的碰撞：大多數 AI 影片工具都需要等待（1-2 分鐘——對 AI 來說簡直是漫長的等待），而 Imagine 只需一半的時間，就能創造出更具創意的成果。快速並不意味著千篇一律。
語音命令魔法：無需打字——只需說出您的構想。Imagine 的語音支援功能讓您能夠透過自然的語音命令生成影像和影片，讓創作變得如同靈感迸發般輕鬆。

誰可以使用Grok Imagine？

Imagine 目前處於測試階段，僅供以下付費使用者使用：

Super Grok 和 Super Grok Heavy 使用者可以搶先體驗 Imagine 影片生成工具。
X Premium + 和 Premium 使用者沒有資格享受搶先體驗，但他們可以加入候補名單。如果他們是活躍的 X 使用者，則有望很快獲得訪問許可權。

目前，每個帳戶可渲染的影片數量存在限制。Premium、Premium + 和 Super Grok Heavy 使用者的上限分別為 50、100 和 500。

如何訪問Imagine？

要訪問 Grok 的 Imagine，請按以下步驟操作：

下載 Grok/Super Grok 移動應用程式（因為 Imagine 目前僅在移動應用程式中可用）
下載後，使用您的付費帳戶登入
您會在頂部看到一個選項：Ask – Imagine。
點選 Imagine

在文字框中新增您的提示即可開始使用。

嘗試Grok的Imagine功能

現在我們已經瞭解了 Grok 最新的影片生成功能，接下來讓我們測試一下它在以下任務中的表現：

生成產品影片
生成病毒式表情包影片
生成電影鏡頭

任務1：產品影片

提示詞：“A model picks up a lipstick, shaped like a metallic pen, placed on a 90’s retro style restaurant and applies it on her lips and smiles, the focus should be on the lips and the background needs to be of a retro style restaurant, which is slightly blurred. The name of the lipstick – Nude browns by Popper, comes on the screen at the end.”

輸出：

該模型首先會根據你的提示生成各種影像。你可以選擇最喜歡的影像。點選後，你將看到以下選項：

產品影片

您可以透過點選“心形圖示”將圖片標記為收藏。
您可以透過點選“向下箭頭圖示”下載圖片。
您可以透過點選“向上箭頭圖示”分享圖片。

最後，在右側，您會找到“make video”選項，點選它，幾秒鐘後，您將獲得一段根據您的提示製作的影片，其中包含您選擇的圖片。

影片幾乎瞬間生成，畫質也讓我驚喜！它完美地聚焦在口紅上，完全符合我的提示。雖然看得出來這是AI生成的（模型在逼真地塗抹口紅方面有些吃力），但高畫質畫質依然令人眼前一亮。

真正讓我印象深刻的是？提示裡的每一個字都完全按照字面意思出現在影片裡，沒有任何尷尬的拼寫錯誤或誤解。

任務 2：表情包影片

提示詞：”A monkey typing furiously on a laptop while another monkey asks it to come outside, while the first monkey refuses and says – AI Agents are coming to take its job”

輸出：

不出所料，Imagine 生成了多個影像選項供我選擇。然而，與我之前的經驗不同，一些生成的影像包含錯誤的文字——這次的準確率明顯下降。

表情包影片

拼寫有錯誤。最後，在瀏覽了大量生成的影像後，我終於找到了一張文字正確、感覺與我給出的提示相似的圖片。

雖然我的提示裡還有其他問題，但我沒能在一個圖片裡找到。不過，我用來生成影片的圖片做了一個相當有趣的梗。它發出的聲音聽起來就像兩隻猴子在爭吵。總的來說，我喜歡這個影片——它很有趣，也達到了預期目的。

任務 3：電影鏡頭

提示詞：“A girl running through a dark alley, camera running with her, from the top, it starts to rain and she slips and looks back with fear, the last shot remains focused on her face, a cinematic shot.”

輸出：

該工具提供了多種影像選項，但生成的影片並沒有完全符合我的要求。雖然一開始效果很好——捕捉到了我要求的氛圍和鏡頭——但隨著影片的播放，質量明顯下降。AI 生成的偽影變得明顯，瑕疵也一目瞭然。

我懷疑模型表現不佳是因為我的任務包含多個複雜的請求。即便如此，音效還是恰到好處——完美匹配了場景的需求。

Grok Imagine怎麼樣？

我對 Imagine 的看法褒貶不一。Imagine 最棒的兩點是它的速度和生成的影像質量。在影片生成方面，我認為我們很快就會看到它變得更好。目前，該模型落後於 Sora 和 Veo 3 以及像 Hulileo 和 Wan 這樣的中國模型，它們都是影片生成潛力的典範。

隨著任務的詳細程度越來越高，Imagine 的效果也會越來越好，所以在生成影片時一定要儘可能多地提供背景資訊。目前生成的聲音只是普通的聲音；它們與生成的影片不太融合。

小結

Imagine 是一個很棒的模型，但它還有很大的改進空間。鑑於它是 Grok 的第一個影像生成模型，我相信團隊很快就會讓它超越任何現有模型。目前，該模型表現良好，但鑑於市面上有如此多的先進影片生成模型，它確實感覺略顯過時。

話雖如此，請繼續嘗試一下 Imagine。它非常適合快速片段和短影片來展示創意。而且，由於其相當靈活的速率限制，您可以用它真正創造出有意義的東西。

Grok Grok Imagine

Grok Imagine：這個新的影片生成模型水平如何？

文章目录

什麼是Grok Imagine？

Grok Imagine的主要功能有哪些？

誰可以使用Grok Imagine？

如何訪問Imagine？