Grok Imagine:這個新的影片生成模型水平如何?

Grok Imagine:這個新的影片生成模型水平如何?

文章目录

  • 什麼是Grok Imagine?
  • Grok Imagine的主要功能有哪些?
  • 誰可以使用Grok Imagine?
  • 如何訪問Imagine?
  • 嘗試Grok的Imagine功能
  • 任務1:產品影片
  • 任務 2:表情包影片
  • 任務 3:電影鏡頭
  • Grok Imagine怎麼樣?
  • 小結

Grok Imagine

八月初,Grok 已成為美國、英國和新加坡等主要國家/地區 App Store 下載量最高的應用。雖然 Grok-4 是一款非常出色的法學碩士 (LLM) 課程,但這款聊天機器人缺少了最熱門的 AI 功能之一——影片。不過,埃隆·馬斯克似乎也感受到了這種“錯失恐懼症 (FOMO)”的影響。因此,他和他的團隊剛剛釋出了 Imagine:一款基於 AI 的影片生成功能,並應用於他們的聊天機器人中。

它能與谷歌的 Veo 3 或 OpenAI 的 Sora 媲美嗎?繼續閱讀,解答您的所有疑問。此外,本文章還將指導您瞭解 Imagine 是什麼、如何使用它以及它可以做什麼。

什麼是Grok Imagine?

Grok Imagine 是 X 的 Grok 聊天機器人中最新的影片生成功能,能夠生成影像和影片。它使用簡單的文字提示即可生成高質量的輸出。

Grok Imagine 現在製作*影片*的時間僅為主要競爭對手製作單張圖片所需時間的一半到四分之一!——埃隆·馬斯克

毋庸置疑,Imagine 的速度和激情是毋庸置疑的。它操作簡單,任何具備基本提示技能的人都可以使用 Grok 的 Imagine 將自己的想象變為現實。生成的影片時長為 6 秒,比 Veo 3 製作的影片短,但比 OpenAI 的 Sora 長。

Grok Imagine的主要功能有哪些?

Imagine 的一些主要功能包括:

  1. 文字轉影像/影片生成:該模型根據文字提示建立影像和影片。使用者只需提供他們想要的內容的詳細描述,模型即可快速生成內容。
  2. 影像轉影片生成:該模型還可以使用上傳的影像作為參考來製作影片,將靜態圖片轉換為動態場景。

影像轉影片生成

  1. 音訊整合:影片包含 AI 生成的音軌,可自動與視覺效果同步,完美契合氛圍和主題。這裡沒有靜音片段!
  2. 更少限制:想要激發創造力?啟用“Spicy 模式”即可繞過嚴格的篩選,探索更具前衛感、更少審查的輸出。非常適合喜歡突破界限的創作者。但涉及敏感內容時,仍然需要注意。

Grok Imagine 護欄

  1. 速度與創意的碰撞:大多數 AI 影片工具都需要等待(1-2 分鐘——對 AI 來說簡直是漫長的等待),而 Imagine 只需一半的時間,就能創造出更具創意的成果。快速並不意味著千篇一律。
  2. 語音命令魔法:無需打字——只需說出您的構想。Imagine 的語音支援功能讓您能夠透過自然的語音命令生成影像和影片,讓創作變得如同靈感迸發般輕鬆。

誰可以使用Grok Imagine?

Imagine 目前處於測試階段,僅供以下付費使用者使用:

  1. Super Grok 和 Super Grok Heavy 使用者可以搶先體驗 Imagine 影片生成工具。
  2. X Premium + 和 Premium 使用者沒有資格享受搶先體驗,但他們可以加入候補名單。如果他們是活躍的 X 使用者,則有望很快獲得訪問許可權。

目前,每個帳戶可渲染的影片數量存在限制。Premium、Premium + 和 Super Grok Heavy 使用者的上限分別為 50、100 和 500。

如何訪問Imagine?

要訪問 Grok 的 Imagine,請按以下步驟操作:

  1. 下載 Grok/Super Grok 移動應用程式(因為 Imagine 目前僅在移動應用程式中可用)
  2. 下載後,使用您的付費帳戶登入
  3. 您會在頂部看到一個選項:Ask – Imagine。
  4. 點選 Imagine

在文字框中新增您的提示即可開始使用。

嘗試Grok的Imagine功能

現在我們已經瞭解了 Grok 最新的影片生成功能,接下來讓我們測試一下它在以下任務中的表現:

  1. 生成產品影片
  2. 生成病毒式表情包影片
  3. 生成電影鏡頭

任務1:產品影片

提示詞:“A model picks up a lipstick, shaped like a metallic pen, placed on a 90’s retro style restaurant and applies it on her lips and smiles, the focus should be on the lips and the background needs to be of a retro style restaurant, which is slightly blurred. The name of the lipstick – Nude browns by Popper, comes on the screen at the end.

輸出:

該模型首先會根據你的提示生成各種影像。你可以選擇最喜歡的影像。點選後,你將看到以下選項:

產品影片

  • 您可以透過點選“心形圖示”將圖片標記為收藏。
  • 您可以透過點選“向下箭頭圖示”下載圖片。
  • 您可以透過點選“向上箭頭圖示”分享圖片。

最後,在右側,您會找到“make video”選項,點選它,幾秒鐘後,您將獲得一段根據您的提示製作的影片,其中包含您選擇的圖片。

影片幾乎瞬間生成,畫質也讓我驚喜!它完美地聚焦在口紅上,完全符合我的提示。雖然看得出來這是AI生成的(模型在逼真地塗抹口紅方面有些吃力),但高畫質畫質依然令人眼前一亮。

真正讓我印象深刻的是?提示裡的每一個字都完全按照字面意思出現在影片裡,沒有任何尷尬的拼寫錯誤或誤解。

任務 2:表情包影片

提示詞:”A monkey typing furiously on a laptop while another monkey asks it to come outside, while the first monkey refuses and says – AI Agents are coming to take its job”

輸出:

不出所料,Imagine 生成了多個影像選項供我選擇。然而,與我之前的經驗不同,一些生成的影像包含錯誤的文字——這次的準確率明顯下降。

表情包影片

拼寫有錯誤。最後,在瀏覽了大量生成的影像後,我終於找到了一張文字正確、感覺與我給出的提示相似的圖片。

雖然我的提示裡還有其他問題,但我沒能在一個圖片裡找到。不過,我用來生成影片的圖片做了一個相當有趣的梗。它發出的聲音聽起來就像兩隻猴子在爭吵。總的來說,我喜歡這個影片——它很有趣,也達到了預期目的。

任務 3:電影鏡頭

提示詞:“A girl running through a dark alley, camera running with her, from the top, it starts to rain and she slips and looks back with fear, the last shot remains focused on her face, a cinematic shot.”

輸出:

該工具提供了多種影像選項,但生成的影片並沒有完全符合我的要求。雖然一開始效果很好——捕捉到了我要求的氛圍和鏡頭——但隨著影片的播放,質量明顯下降。AI 生成的偽影變得明顯,瑕疵也一目瞭然。

我懷疑模型表現不佳是因為我的任務包含多個複雜的請求。即便如此,音效還是恰到好處——完美匹配了場景的需求。

Grok Imagine怎麼樣?

我對 Imagine 的看法褒貶不一。Imagine 最棒的兩點是它的速度和生成的影像質量。在影片生成方面,我認為我們很快就會看到它變得更好。目前,該模型落後於 Sora 和 Veo 3 以及像 Hulileo 和 Wan 這樣的中國模型,它們都是影片生成潛力的典範。

隨著任務的詳細程度越來越高,Imagine 的效果也會越來越好,所以在生成影片時一定要儘可能多地提供背景資訊。目前生成的聲音只是普通的聲音;它們與生成的影片不太融合。

小結

Imagine 是一個很棒的模型,但它還有很大的改進空間。鑑於它是 Grok 的第一個影像生成模型,我相信團隊很快就會讓它超越任何現有模型。目前,該模型表現良好,但鑑於市面上有如此多的先進影片生成模型,它確實感覺略顯過時。

話雖如此,請繼續嘗試一下 Imagine。它非常適合快速片段和短影片來展示創意。而且,由於其相當靈活的速率限制,您可以用它真正創造出有意義的東西。

評論留言