Veo 3真的如宣傳的那樣強大嗎?

Veo 3真的如宣傳的那樣強大嗎?

谷歌模糊了影片創作中現實與想象的界限。社交媒體上充斥著令人驚歎的影片片段,這些影片擁有完美的唇形同步、音效和動作。所有這些都是由一款人工智慧工具生成的。人們不禁要問:“這是真的嗎?”不,這是 Veo 3!谷歌在 2025 年 Google I/O 開發者大會上釋出的最新成果。它不僅提升了標準,更重新定義了可能性。它結合了視覺保真度、音訊真實感和敘事靈活性,超越了 Runway 和 Sora 等競爭對手,開創了一個只有想象力才能限制敘事的時代。本文將揭示 Veo 3 的影片生成功能,並將其與同時代的產品進行比較。

什麼是Veo 3?

Veo 3 是谷歌最新的人工智慧影片生成器。由 Google DeepMind 開發,Veo 3 可以將簡單的文字或影像提示轉換為影院級的高畫質影片。現在,透過整合原生音訊,它不僅可以建立精美的影像;它還能透過單一提示建立同步聲音、語音對話、背景音樂、自然環境音效和動物叫聲。此外,它結合對現實世界物理、自然光和精準口型同步的理解,創造出逼真的視覺和聽覺輸出。

目前,該功能僅在美國透過 Google 全新 AI 電影製作平臺 Flow 和 Gemini Ultra 訂閱使用者提供。

Veo 3的功能

Veo 3 的功能如下:

  • 原生音訊生成:Veo 3 可從文字或影像輸入生成同步音訊,例如對話、畫外音、音效、環境音和背景音樂。這是 Sora 和 Runway 均不具備的功能。
  • 高品質影院級輸出:Veo 3 可生成清晰逼真的影像,符合真實世界的物理規律,並支援自然光照和精準的唇音同步,使影片更加逼真。
  • 高階提示:它能夠精準地處理冗長的文字指令和動作序列,透過精準的影片輸出呈現使用者所需的細節場景。
  • 影像和風格控制:該系統支援參考影像以確保風格、角色或場景的一致性,從而在影片的視覺外觀和氛圍方面提供更大的創作自由。
  • 攝像機運動和轉場控制:它提供可自定義的攝像機運動,例如平移、縮放和旋轉,以建立動態的影院級運動。

如何使用Veo?

步驟 1. 訂閱 Google AI Ultra 套餐

要訪問 Veo 3,請訂閱 AI Ultra 套餐。該套餐每月收費 249.99 美元,目前僅在美國提供。此套餐包含許多實用工具,例如 Veo 3 強大的影片和音訊生成功能。

步驟 2. 開啟 Gemini 應用

接下來,在您的裝置上開啟 Gemini 應用。這是您使用 Veo 3 和其他 Google AI 工具的首選。

步驟 3. 選擇影片選項

在應用的提示欄中,查詢“video”按鈕;如果找不到,只需點選三個點即可找到更多選項。

步驟 4. 編寫提示並生成影片

現在到了最有趣的部分:輸入您希望影片包含的內容!準備好後,點選“Generate”,讓 Veo 3 發揮您的魔力。

使用Veo 3的其他方式

透過Google Flow

您可以使用 Ultra 套餐中的 Google Flow 作為訪問 Veo 3 的另一種方式。

透過Vertex AI

如果您是企業或開發者,您還可以透過 Google Vertex AI 訪問 Veo 3,具體方式如下:申請訪問許可權、填寫搶先體驗表單,並使用 API 將其整合到您的系統中。

注意:Veo 3 目前僅面向美國個人使用者,但即將在其他國家/地區推出。

Veo 3與競品對比

讓我們將 Veo 3 與 Sora 和 Runway 等其他工具進行比較。

功能特性 Veo 3 Sora(OpenAI) Runway(Gen-3 Alpha)
質量:4K 生成 否(最高1080p) 否(最高1080p,部分支援QHD/2K)
影片時長 8秒(Flow),30秒以上(API/企業) Pro:最多60秒;Plus:最多20秒 免費:最多10秒;付費:15秒;延長:16秒
動畫與現實 現實主義,電影感 現實主義,超現實主義 風格化,藝術性,帶有一定現實感
顏色 電影感,自然,鮮豔 逼真,細緻 藝術性,可定製,鮮豔
音訊 原生同步(對話、音效、音樂) 無原生音訊 僅後期同步,可選音效
解析度 4K 1080p(最高) 1080p(最高),部分支援2K/QHD
資產/角色一致性 是,帶參考和Flow資產管理 部分,需繞行方案 部分,正在持續改善
攝像機控制 高階(平移、傾斜、景深、過渡) 基本 基本至中等
定價與訪問 $249.99/月(AI Ultra,僅限美國);企業版透過Vertex AI $20/月(Plus),$200/月(Pro Beta) $35/月(標準);$144–$1,500/年

在所有可用的 AI 影片生成器中,沒有一款能像 Veo 3 一樣提供真正的原生同步音訊和影院級真實感。Sora 和 Runway 都無法提供 Veo 3 所具備的真正的原生功能。雖然 Sora 確實提供了更長、更逼真的影片,但它也僅限於 1080p,沒有內部音訊,也沒有內建音訊。Runway 價格實惠,在藝術風格上最靈活。另一方面,Sora 和 Runway 迎合了多樣化的創作者群體,並提供較低的價格,這與 Veo 3 等專為專業人士設計的高階尖端工具形成鮮明對比。

親身體驗Veo 3

提示詞:”Inside a tranquil cave temple is a group of Buddhist monks in saffron robes meditating in silence around a central statue of a Buddha. Soft candlelight flickers, softly illuminating the aged stone walls, adorned with faded murals, while shadows dance across the temple space. The ambience is peaceful with low sounds of soft chanting, far-off dripping water, and the soft echo of the cave.”

在石窟寺廟中冥想的僧侶:

Source: Twitter

提示詞: ”A glamorous jazz singer performs on a small stage in a smoky, dimly lit jazz club reminiscent of the 1940’s. She is dressed in a vintage evening gown with sequins, standing near a vintage chrome microphone. Patrons dressed in formal 1940’s attire are seated at round candlelit tables, sipping cocktails, and watching the singer. A live jazz band is playing along with her.“

20 世紀 40 年代爵士俱樂部的歌手:

Source: Twitter

提示詞: ”A vintage CRT television from the 1980’s is the center of a dimly lit retro living room. The television flickers into life with static, then cycles through several channels. Each channel shows a short, distinct clip: a black-and-white cartoon, a 90’s-style music video, a noisy grainy news report, a low-budget cheesy sci-fi movie, and a late-night talk show. 

各種電視節目:

Source: Twitter

小結

Veo 為未來的敘事方式增添了電影般的質感。它是一款無與倫比的 4K 視覺工具,結合原生音訊生成技術,以及對風格和動作的精準掌控,絕對顛覆了遊戲規則。雖然 Sora 和 Runway 已經為創意世界提供了良好的服務,但對於追求真實感、沉浸感和多功能性的專業人士來說,Veo 3 則是一個突破性的產品。

評論留言