GPT-SoVITS
GPT-SoVITS,强大的本地语音克隆工具! 下载,模型,整合包,教程,在线,github,webui,api
标签:ai音频GPT-SoVITS-webui GPT-SoVITS使用 GPT-SoVITS教程 GPT-SoVITS整合包GPT-SoVITS下载,模型,整合包,教程,在线,github,webui,api,强大的本地语音克隆工具
简介
GPT-sovits 是一款功能强大的本地语音克隆工具,它基于深度学習技術,能够生成与目标人物声音非常相似的音频,你仅需提供一分鐘的语音就能够很好的辨識訓练,生成非常相近的语音模型。訓练的模型可以下次直接调用,后期输入文本即可生成与模型十分相似的语音,非常强大。軟體适用于各种应用場景,如虚擬代言人、语音助手、有声讀物等。透過使用GPT-sovits,用户可以轻松地生成高质量的语音音频,滿足各种需求。

GPT-SoVITS是一个開源的TTS專案,只需要1分鐘的音频文件就可以克隆声音,支持將汉语、英语、日语三种语言的文本轉為克隆声音,作者已测試,部署很方便,訓练速度很快,效果很好。專案發布不到1个月就有了13.3k star。
主要功能和特色
GPT-sovits 功能特点:
1. 语音合成:添加要模擬的人声音频文件到軟體中辨識訓练,然后手动修改辨識的文字校准,就可以訓练成效果十分出色的语音模型。后期可以將文本轉换為语音,生成与目标人物声音非常相似的音频。
2. 语音克隆:根据用户提供的目标人物的语音样本,学習并模仿其语音特征,从而實现语音克隆。这使得用户可以創建出与目标人物声音非常相似的虚擬代言人或其他应用場景。
3. 多语言支持:目前仅對中文进行了测試,其它语言请自行测試,可以根据自己的需求選择合适的语言进行语音合成和克隆。
4. 安全可靠:GPT-sovits 完全本地化運行,無需任何联网,这就完全杜絕了隐私泄露等問题。

GPT-sovits 使用方法
1. 軟體免安装,下载后解压,双擊打開 go-webui.bat 自动弹出本地网页,在这个网页中进行操作;
2. 在 前置資料集獲取 功能页面中,可以去除音频中的背景音樂或者其它雜音,如果是純淨人声可以直接跳过。在運行过程中,会弹出文本校對页面,可以對人声和辨識的文本文字进行校對,手动修改达到完美匹配;
3. 在 TTS 功能页面中,設置三个*号的输入框,其它默认即可;

更新内容
这个專案發布之后,獲得了比較高的關注,所以更新也比較活跃。这段时间已經有了不少更新!
20240121更新
1-config添加is_share,诸如colab等場景可以將此改為True,来使得webui映射到公网
2-WebUI添加英文系統英文翻译适配
3-cmd-asr自动判斷是否已自帶damo模型,如不在默认目錄上將从modelscope自帶下载
4-SoVITS訓练報错ZeroDivisionError 尝試修复(过濾长度0的样本等)
5-清理TEMP資料夾快取音频等文件
6-大幅削弱合成音频包含参考音频結尾的問题
20240122更新
1-修复过短输出文件返回重复参考音频的問题。
2-經测試,英文日文訓练原生支持(日文訓练需要根目錄不含非英文等特殊字符)。
3-音频路徑检查。如果尝試讀取输入错的路徑報错路徑不存在,而非ffmpeg错誤。
20240123更新
1-解决hubert提取nan導致SoVITS/GPT訓练報错ZeroDivisionError的問题
2-支持推理界面快速切换模型
3-優化模型文件排序邏輯
4-中文分词使用jieba_fast代替jieba
20240126更新
1-支持输出文本中英混合、日英混合
2-输出可選切分模式
3-修复uvr5讀取到目錄自动跳出的問题
4-修复多个换行導致推理報错
5-去除推理界面大量冗余log
6-支持mac訓练推理
7-自动辨識不支持半精度的卡强制單精度。cpu推理下强制單精度。
20240128更新
1-修复數字轉汉字念法問题
2-修复句首少量字容易吞字的問题
3-透過限制排除不合理的参考音频长度
4-修复GPT訓练不保存ckpt的問题
5-完善Dockerfile的下载模型流程
20240129更新
1-16系等半精度訓练有問题的顯卡把訓练配置改為單精度訓练
2-测試更新可用的colab版本
3-修复git clone modelscope funasr仓库+老版本funasr導致接口不對齊報错的問题
20240130更新
1-所有涉及路徑的地方双引号自动去除,小白复制路徑帶双引号不会報错
2-修复中英文标点切割問题和句首句尾补标点的問题
3-增加按标点符号切分
上面有详細的更新說明,
對我来說特别有用的是,它支持中英混合生成了。
另外對英语和日语的訓练都完善了,啥时候定制个某老師的声音?
还有后台日志好像简洁清楚多了。
推理界面支持切换模型,让使用更加便捷了。
其他还有很多細節我就不复述了。
全网最熱💫AI音频工具
✨1.Mubert
無版權免費音樂,根据输入文字立即生成,还可以提供样本自动生成。
✨2. Runway
输入文字就可以直接生成影片,强大的AI影片制作工具,绿幕抠像、影片合成等,功能还是比較齊全的。只需点擊几下即可立即从任何影片中删除背景。
✨3. LALAL AI
可以快速透過AI將声音进行分离,能够从歌曲中移除人声,伴奏,还有各种樂器声音,从而獲得独立的音軌。还能將和背景噪声消除,值得推荐!
✨4. Pictory
可將文字内容一键轉變成短影片。
✨5. Endel
AI智能个性化白噪音,可以透過位置、環境、和心率在类的信息来創建个性化背景音樂,帮助您集中注意力、放松和睡眠!
✨6.Deepbrain
文字即可轉化為逼真的影片,只需 5 分鐘,可將时间和成本減少 80%!
数据评估
本站ai工具百寶箱提供的GPT-SoVITS都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由ai工具百寶箱实际控制,在2025年10月12日 下午2:19收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,ai工具百寶箱不承担任何责任。
