ai声音训练一般多少步合适 (ai声音训练文稿)

admin 2024-11-19 45 0

本文目录导航:

ai声音训练一般多少步合适

3步。

准备数据集,训练模型,本地进行推理模型重绘歌曲。

1、准备数据集:声音模型对数据集的要求比较苛刻,因为声音越优质,越干净,效果一定越好。

所以没有杂音、没有乱七八糟的混响等等的干声是必须的,而且音域越广越好。

2、训练模型:因为声音模型训练是不会自动停止的,每几千步就会给你保存一个模型,所以我们可以让他自动保存最新的10个模型让我们来选一个最好的。

3、本地进行推理模型重绘歌曲:声音重绘的原理是用模型的音色替换人声,所以正常我们想替歌声的话,是需要把伴奏和人声分离,用模型推理替换人声,把推理完的人声文件和伴奏合在一起,形成一首完整的歌。

ai声音训练一般多少步合适 (ai声音训练文稿)

我把我的声音训练成了AI模型,并让它唱了一首歌...(附超全面教程,你奶奶看了都会用)

曾经的五音不全,如今却在AI的助力下绽放音乐光彩。

探索声音的边界,我用So-VITS-SVC这款不再维护的工具,让AI成为我的私人唱腔导师,演绎了经典曲目《富士山下》。

AI的声音技术,SVC与TTS如Bark和PaddleSpeech,它们的成熟让技术触手可及。

AI艺术的领域涵盖了视觉、听觉等多种模态,声音合成正崭露头角。

打造这款独特嗓音,我精心策划了四步曲:首先,挑选无杂质的高品质音频资料,派蒙语音整合包是不错的选择;接着,登上云端,通过Autodl平台租赁强大的V100 32GB显卡资源,直到训练顺利;在服务器上进行数据上传,阿里云盘作为数据传输的桥梁,设置好安全密码;然后,进入控制台,JupyterLab的直观界面让操作变得简单。

预处理数据,调整参数,生成关键配置文件。

划分数据集,保存配置,开始训练大戏。

训练过程中,我密切关注每步后的本地推理,模型存放在autodl-tmp/so-vits-svc4/logs/44k,每800步生成一次。

训练结束后,下载模型和配置文件到本地进行下一步操作。

推荐使用UVR5工具,分离伴奏与人声,从QQ音乐获取音频,通过UVR5的神奇力量去除混响。

在WebUI上,选择本地模型,调整音频效果,最后通过F0均值滤波,音乐转化大功告成。

这个项目历时百小时,成果背后的艰辛与乐趣并存。

集成包和案例数据集,只需通过公众号轻松获取。

AI音乐的时代来临,但它并不能替代那些技艺精湛的艺术家。

正如《西部世界》所言,进化中的错误赋予了生命独特的魅力。

AI虽精确无误,却无法复制人类的创新与情感。

创作不易,但每一次尝试都是对艺术的致敬,期待你的关注与支持,感恩有你同行。

训练自己的声音模型,效果超级逼真,最牛的开源声音克隆项目 GPT-SoVITS

声音克隆项目GPT-SoVITS是一个开源工具,它可以帮助您训练属于您自己的声音模型,效果逼真,操作简便,非常值得一试。

首先,您需要安装GPT-SoVITS,如果您的电脑是Windows系统,可以从/lj1995/G...下载整合包并解压,运行即可。

对于Linux或Mac系统,建议您参照项目说明进行安装。

接下来,我们进入训练阶段。

整个流程包含多个步骤,但操作起来并不复杂。

第一步是准备音频样本,确保声音清晰、无伴奏。

然后,进行音频切分、语音识别(ASR)、文本校对、训练集格式化以及模型训练。

每一步都至关重要,确保准确性和高效性。

在音频切分阶段,您可以利用“0-前置数据集获取工具”进行操作。

只需填写样本音频文件路径和输出根目录,然后点击“开启语音切割”按钮。

几秒后,音频切割完成。

接着,进行语音识别(ASR)阶段,只需要修改输入文件夹路径即可。

等待时间可能较长,因为需要下载语音识别模型,但执行过程会分析并识别每段音频的文本。

文本校对阶段,您需要填写标注文件路径,并勾选是否开启打标WebUI。

在新打开的页面上,校对每段语音对应的文本,修正识别错误的文字,保存修改结果。

训练集格式化阶段,您需要填写实验/模型名、文本标注文件路径,并点击“开启一键三连”按钮,等待进程结束。

在声音模型训练阶段,点击“微调训练”标签,无需修改参数,点击“开启SoVITS训练”和“开启GPT训练”按钮,等待训练完成。

这个过程可能会比较慢,因为它涉及多轮训练。

完成模型训练后,您就可以使用自己的模型了。

点击“推理”标签,刷新模型路径并选择训练好的模型。

在推理页面上,您可以上传参考音频,选择音频对应的文本,输入想要合成的文本,然后点击“合成语音”按钮,等待输出结果。

现在,您已经成功使用GPT-SoVITS训练了自己的声音模型。

这是一个强大的工具,能够帮助您实现声音克隆,适用于多种场景。

您可以访问/RVC-Boss/GPT...获取更多信息和示例。

总结起来,GPT-SoVITS提供了一个简单且高效的平台,让您能够轻松创建和使用个性化的声音模型。

赶快尝试一下吧!

评论(0)