如何使用ElevenLabs AI克隆語音並從文字生成自然語音

如何使用ElevenLabs AI克隆語音並從文字生成自然語音

2023 年,在討論技術時,你不能不談到生成式人工智慧。無論是人工智慧編碼工具、本地法學碩士,還是人工智慧影象生成器,這項技術幾乎已經侵入了一切領域,各家公司也在迅速適應這項新技術。ElevenLabs 就是這樣一家利用人工智慧專門從事語音合成和語音克隆的公司。你可以使用 ElevenLabs AI 從文字生成自然語音,並以近乎完美的準確度克隆你的聲音。請閱讀本教學,瞭解如何做到這一點。

如何使用 ElevenLabs AI 從文字生成自然語音

ElevenLabs 對個人使用者免費開放。在免費級別下,您可以在一個月內從文字中生成多達 10,000 個字元的語音。您還可以生成多種語言和口音的語音。下面是這款人工智慧工具的工作原理:

1. 前往 ElevenLabs 網站(訪問),點選 “Sign up” 建立免費賬戶。

建立ElevenLabs免費賬戶

2. 註冊後,您將進入語音合成頁面。在這裡的 “Settings” 中,您可以預覽不同的語音,並選擇自己喜歡的語音。

選擇自己喜歡的語音

3. 您還可以在下方選擇音訊模式。如果文字為英文,請選擇 “Eleven Monolingual v1“;如果文字為其他語言,包括英語、德語、印地語、西班牙語、義大利語、法語、葡萄牙語或波蘭語,請選擇 “Eleven Multilingual v1″。

選擇 "Eleven Monolingual v1"

4. 最後,輸入下面的文字,點選 “Generate“,ElevenLabs AI 就會將您的文字轉換為語音。

將您的文字轉換為語音

5. 在這裡,我用 Sam 的聲音從樣本文字中生成了語音。您可以點選 “Download” 按鈕,獲取 MP3 格式的生成語音。

獲取 MP3 格式的生成語音

6. 您還可以輸入不同語言的文字,它也能完美地生成語音。請確保從下拉選單中選擇 “Multilingual” 模式。

選擇 "Multilingual" 模式

7. 你還可以使用 ElevenLabs AI 克隆自己的聲音,我們在下面進行了演示。不過,你可以從Voice Library中新增不同口音的語音樣本。

使用 ElevenLabs AI 克隆自己的聲音

8. 點選所選語音旁的 “Add to VoiceLab“。例如,我在這裡新增的是一個英國口音的年輕男聲。

新增的是一個英國口音的年輕男聲

9. 現在,只需從下拉選單中選擇語音並生成語音。這樣就完成了。

選擇語音並生成語音

如何使用 ElevenLabs AI 克隆語音?

你可能已經在 Instagram 和 TikTok 上看到過有人使用語音克隆技術,讓奧巴馬、德雷克等知名人士隨意說話。ElevenLabs 曾經免費提供語音克隆服務,但現在你需要支付 5 美元才能建立多達 10 個自定義語音。如果你不想付費,可以使用 PlayHT(訪問)免費克隆你的聲音。在本文中,我將使用 ElevenLabs AI 克隆我的聲音。

1. 要使用 ElevenLabs AI 克隆語音,請點選頂部的 “Voice Lab”。然後點選 “Add Generative or Cloned Voice“。

Voice Lab

2. 接下來,點選 “Instant Voice Cloning“。

立即克隆語音

3. 在此,為您的聲音命名。然後,上傳您錄製的音訊。確保錄音中沒有大聲的背景噪音。建議上傳至少 5 分鐘的音訊,以便更好地進行語音合成。在下面寫一段描述,然後點選 “Add Voice” 按鈕。

上傳您錄製的音訊

4. 幾秒鐘後,你的語音就會被克隆出來,可以隨時使用。點選 “Use“,即可使用它將文字轉換為語音。

將文字轉換為語音

5. 在此,確保您的語音已在下拉選單中被選中。現在,新增文字,然後點選 “Generate“。合成語音和生成音訊需要幾秒鐘的時間。現在還可以下載音訊。

合成語音和生成音訊

在我看來,儘管上傳了 5 分鐘的音訊檔案,但 ElevenLabs AI 在克隆我的聲音方面做得並不好。也許,我需要新增更多的音訊樣本並再次訓練模型。或者,這可能是因為人工智慧模型以英語(美國)輸出,而不是針對印度口音進行本地化。另外,在我的音訊樣本中,有一些背景噪音,可能降低了質量。儘管如此,這是一個令人興奮的人工智慧專案,我們將繼續跟蹤語音合成領域的所有新進展。

評論留言