編輯點評:AI語音智能識別克隆工具
開源免費的AI語音克隆工具,只需要5秒鐘就可以輕松克隆出你的聲音,MockingBird軟件很神奇,可以根據任意文字克隆出你的聲音,聽起來就像是你在說這段文字一樣,很多用戶覺得安裝麻煩,特意分享MockingBird綠色整合版,歡迎免費下載。
軟件特色
一個實時克隆中文聲音的AI工具,只需5秒,就能用AI 技術來模擬聲音來生成任意語音內容。程序依賴Python、Pytorch、FFmpeg等庫,如下快速開始文檔有詳細介紹。可以下載預訓練好的合成模型(synthesizer),也可訓練自己的合成模型。從體驗和視頻demo上看,確實能復制目標用戶的音色,不過生成的效果也不是特別理想,可能需要針對性的訓練效果會更好些。
操作步驟
1.record,錄入聲音
2.自動加載模型
3.寫一段文本
4.等待生成
5.播放、導出錄音文件
綠色版說明
綠色整合版,無需手動安裝python,開箱即用,打開運行.bat即可
五秒克隆你的聲音
已整合訓練好的模型,不需要特別高的配置和IT水平
環境要求
python3.7及以上
理論支持Windows 7及以上 (建議 win8+,過老版本不保證兼容性)
親測win2012,win10完美運行
如果在用 pip 方式安裝的時候出現 ERROR: Could not find a version that satisfies the requirement torch==1.9.0+cu102 (from versions: 0.1.2, 0.1.2.post1, 0.1.2.post2) 這個錯誤可能是 python 版本過低,3.9 可以安裝成功。
軟件亮點
1、中文 支持普通話并使用多種中文數據集進行測試:aidatatang_200zh, magicdata, aishell3, biaobei, MozillaCommonVoice, data_aishell 等
2、PyTorch 適用于 pytorch,已在 1.9.0 版本(最新于 2021 年 8 月)中測試,GPU Tesla T4 和 GTX 2060
3、 Windows + Linux 可在 Windows 操作系統和 linux 操作系統中運行(蘋果系統M1版也有社區成功運行案例)
4、Easy & Awesome 僅需下載或新訓練合成器(synthesizer)就有良好效果,復用預訓練的編碼器/聲碼器,或實時的HiFi-GAN作為vocoder
5、Webserver Ready 可伺服你的訓練結果,供遠程調用。
安裝教程
請勾選add python to path,否則需要手動配置環境變量
請保持網絡暢通,若斷網報錯請重新執行安裝依賴.bat
使用教程
1.browse選擇一段3-15秒的語音,wav格式,最好單聲道,吐字清晰,沒有雜音,不宜過長
親測網課直播錄屏,發語音,在安靜條件錄音等音質較好,而在公共環境比如舞臺,KTV等錄音音質較差
不是所有語音都能夠完美克隆,親測在網課放老師的聲音以假亂真,但像麥小兜派蒙雷米等蘿莉音效果不理想
可以使用音頻編輯工具例如au進行預處理降噪
如圖所示,頻譜規則的音頻克隆效果較好
2.在右上角輸入文本,僅支持中文,不要有阿拉伯數字,英文請使用諧音自行解決哈
3.選擇vocoder,推薦Griffin-Lim,點擊Synthesize and vocode試聽,之后點擊export導出音頻
Android RMX1991支持( 0 ) 蓋樓(回復)