Kling 2.1:中國迄今為止最好的影片生成模型

Kling 2.1:中國迄今為止最好的影片生成模型

值此中國影片生成工具 Kling AI 誕生一週年之際,其母公司快手釋出了迄今為止最先進的模型——Kling 2.1。繼 Kling 1.6 和 2.0 大獲成功之後,使用者和創作者們翹首以盼 Kling AI 的下一個重磅成果,如今它終於來了。憑藉先進的影片生成能力以及更佳的連貫性和渲染技巧,Kling 2.1 在 AI 影片生成領域堪稱強勁對手,足以匹敵谷歌 Veo 3 和 OpenAI Sora 等專有模型。本文將探討 Kling 2.1 的功能和影片生成能力,並對比其與 Veo 3 的對比表現。

什麼是Kling 2.1?

Kling 2.1 是由快手開發的一款先進的 AI 驅動影片生成模型。它將參考影像和文字提示轉換為高畫質、影院級的影片,並利用 3D 時空注意力機制和擴散變換器架構等先進技術。Kling 2.1 旨在模擬現實世界的物理和複雜的運動動力學,提供視覺震撼且內容連貫的影片。在前代 Kling 2.0 的基礎上,最新版本引入了增強功能,以滿足初學者和經驗豐富的專業人士的需求。

Kling 2.1的功能

以下是 Kling 2.1 的一些主要功能:

  1. 基於幀的影片生成:與大多數專注於文字到影片生成的影片生成模型不同,Kling 2.1 基於輸入影像作為參考幀來生成影片。
  2. 逼真的運動和物理模擬:利用 3D 時空聯合注意力機制,Kling 2.1 可以精確模擬複雜的運動,確保生成的影片遵循物理定律並展現自然的運動。
  3. 動態面部表情:該模型擅長生成逼真的面部表情和精準的動作,增強角色的真實感,使其更具吸引力。
  4. 多種影片選項:Kling 2.1 支援使用同一提示建立多個影片,為使用者提供更多自由和選擇,無需多次迭代。
  5. AI 驅動的提示:對於那些難以編寫詳細準確的影片生成提示的使用者,該模型提供了一個基於 DeepSeek 的 AI 工具來生成提示。

如何訪問Kling 2.1

Kling 2.1 及其 Master 版本均可在 Kling AI 網站和應用程式上使用。全球使用者只需使用郵箱地址即可註冊,並使用註冊時獲得的免費積分,直接試用這些模型進行影像轉影片生成。請注意,目前這些模型僅可用於影像轉影片生成。

如何使用Kling 2.1

以下是使用 Kling 2.1 和 Kling 2.1 Master 將影像生成影片的方法:

1. 在 Kling AI 上選擇模型

開啟網站後,從頂部的模型選擇下拉選單中選擇 Kling 2.1(或 Kling 2.1 Master)。

在 Kling AI 上選擇模型

 

2. 上傳參考影像

在“image-to-video”選項卡下,選擇“Frames”,然後上傳一張參考影像,用作生成影片的起始幀或結束幀。請注意,Kline 2.1 版本目前不支援“Elements”功能。

上傳參考影像

 

3. 新增提示

您可以選擇新增提示來描述影片,或者新增負面提示來解釋您不希望在影片中出現的內容。您甚至可以使用 DeepSeek 根據您的描述、主題或想法生成詳細的提示。

4. 配置屬性

準備好參考圖片和提示(可選)後,選擇您想要的標準影片還是專業影片(VIP 使用者適用)。然後確定影片時長(5 秒或 10 秒)以及您想要生成的輸出數量(最多 4 個)。請注意,只有 VIP 使用者才能選擇從單個圖片/提示生成多個影片。

5. 生成影片

現在您已完成所有設定,只需點選“Generate”,然後等待模型生成您的影片。在免費版本中,這可能需要長達 120 分鐘。

6. 生成聲音(可選)

影片生成後,Kling 會提供您使用其聲音生成工具新增聲音的選項。您可以在此處新增提示,並生成 4 種不同的聲音和對話以匹配場景。但請注意,該工具目前僅生成中文音訊,並且無法自動與影片唇形同步。生成聲音(可選)

 

Kling 2.1的影片生成功能

使用者紛紛在社交媒體上稱讚 Kling 2.1 能夠生成動作逼真、人物形象生動的影片。讓我們來看看 Kling 2.1 根據不同影像提示生成的幾個影片,看看這款工具究竟有多棒。

1. 超逼真的真人影片

輸入圖片:

啦啦隊女生

提示詞:“A woman is dancing to fast-paced music.”

輸出:

Source: Kling AI Library

2. 動畫遊戲影片

輸入圖片:

跑車

描述:“car in the city racing, 4K ultra realistic high-octane chase. Smooth movement, photorealistic, high quality.”

DeepSeek-generated 提示詞:“A sleek hover-car weaving between towering holographic billboards, blue plasma thrusters igniting, cityscape reflecting off its chrome body, 4K ultr­a realistic, dynamic motion”

輸出:

Source: Kling AI Library

3. 動態動作影片

輸入圖片:

無人機

提示詞:“Cinematic action shot in the style of an action movie with a drone racing through a forest woodland at noon, navigating between trees. Sunlight streaking through leaves, close front follow angle, dynamic movement, high contrast, intense atmosphere, detailed composition.”

負提示詞:“morphing, erratic fluctuation in motion, noisy, bad quality, distorted, poorly drawn, blurry, grainy, low resolution, oversaturated, lack of detail, inconsistent lighting. Wrong anatomy, unnatural facial expressions, unnatural movements, blur, warp, distortion, disfigurement, pixelation, noisy, grainy, overly bright colors, harsh shadows, oversaturated colors, erratic fluctuation, artefacts, glitch, low quality, bad face, transition, morphing, titles, texts, logos, Cartoonish features.”

輸出:

Source: Kling AI Library

Kling 2.1 vs Veo 3 vs Sora:功能對比

說到高階影片生成,我們必須瞭解這款免費工具與谷歌 Veo 3 和 OpenAI Sora 等專有模型相比有多出色。以下是對這三種影片生成模型功能的標準比較。

特性 Kling 2.1 Veo 3 Sora
最長影片時長 3 分鐘 1 分鐘 1 分鐘
解析度 1080p 1080p 1080p
對嘴同步功能
物理模擬
縱橫比靈活性 中等
編輯工具 基本 基本 基本
訪問可用性 全球(測試版) 有限(僅限美國) 有限

Kling 2.1與Veo 3:效能對比

現在,讓我們比較一下目前可用的兩個模型:Kling 2.1 和 Veo 3。

這是我在網上找到的一段使用 Veo 3 生成的影片

我將使用該影片的螢幕截圖作為第一幀參考影像,新增一個描述場景的提示,然後看看 Kling 2.1 會如何處理它。

輸入圖片:

機場登記櫃檯

提示詞:“An American man wearing a blue t-shirt is at the boarding counter at the airport with his pet penguin. The airline staff, lady dressed in blue, does not let him take the penguin on board. He’s frustrated as she tries to explain the situation to him.”

Kling 2.1 生成的影片

現在,讓我們使用 Kling 2.1 為生成的影片新增音訊。

對比分析

Veo 3 生成的影片非常逼真,細節豐富,表情恰當,口型同步效果也非常好。就連動作的流暢性以及對話的清晰度和語調都堪稱一流。總的來說,這是我見過的最好的影片生成 AI 工具之一。

如上所示,Kling 2.1 非常擅長根據參考幀重建影片。它生成的人物和動物都非常逼真,表情和細節都精準到位。作為一款免費工具,它的表現比大多數其他工具都要好。然而,在音訊生成和同步方面,Kling 2.1 的表現卻令人失望。無論是語調還是節奏,都與影片不符。所以我認為這款工具在這方面仍有改進空間。

小結

Kling 2.1 在 AI 影片生成領域展現出極高的潛力。其易於使用的介面、建立連貫影片的高質量以及新增音訊的功能,使其成為目前市面上最優秀的免費 AI 影片生成器之一。其在逼真的運動模擬、面部表情渲染和創意藝術方面的能力使其領先於大多數同類產品。話雖如此,該模型在生成音訊和精準唇形同步方面仍有改進空間。因此,我們期待 Kling AI 的下一個版本能夠解決這些問題。

評論留言