设为首页
收藏本站
开启辅助访问
切换到窄版
登录
立即注册
只需一步,快速开始
首页
BBS
剑灵怀旧服
Unity
美术资源
UE
全套源码
其他内容
奖励任务
分享
Share
每日任务中心
搜索
搜索
怀旧插件
怀旧脚本数据
怀旧攻略
公益服开服通知
AI工具分享
Unity插件
Unity问题答疑
Unity学习教程
Unity AI算法
Unity源码
其他美术文件
MAY文件
3D Max
FBX模型
UE技术讨论
UE学习视频
UE源码
网站源代码
手机游戏源代码
PC游戏
游戏捏脸
其他插件
OFFER摸吧
魔兽地图
单机游戏
本版
帖子
用户
爱开源网
»
首页
›
数字人
›
人工智能
›
基于so-vits-svc语音模型实现AI翻唱歌曲
返回列表
发新帖
基于so-vits-svc语音模型实现AI翻唱歌曲
[复制链接]
1140
|
0
|
2023-8-23 11:48:00
|
显示全部楼层
|
阅读模式
目次
获取数据集
开始练习
开始推理(翻唱)
获取数据集
工具整合包泉源
【AI翻唱/SoVITS 4.0】手把手教你老婆唱歌给你听~无需设置环境的当地练习/推理教程[懒人整合包]_哔哩哔哩_bilibili
https://www.bilibili.com/video/BV1H24y187Ko/?spm_id_from=333.1007.top_right_bar_window_custom_collection.content.click&vd_source=bd7513aedfc5a6d9d2da276ca29e3cb5
音频泉源
QQ音乐-HQ高品质下载
zutomayo的歌曲列表
Dear Mr [F]
去和声、混响、切片按上面教程来就好了
已得到数据集
当地硬件程度有限,上云端GPU服务器练习
【so-vits-svc】手把手教你老婆唱歌_哔哩哔哩_bilibili
https://www.bilibili.com/video/BV1vM4y1S7zB/?vd_source=bd7513aedfc5a6d9d2da276ca29e3cb5
AutoDL上选一个好显卡,镜像为up的改进版(加了webui和增补了很多表明)
资源清单
显卡:A5000,cuda版本11.6
镜像:so-vits-svc-webui
按readme.ipynb步调走,末了开始练习
开始练习
练习的相干细节(config.json)
关于练习过程几个指标的关系参考如下
(167条消息) so-vits-svc3.0 中文详细安装、练习、推理利用教程_Sucial的博客-CSDN博客
https://blog.csdn.net/Sucial/article/details/129104472
上面最多语音说话人的语音数可以明白为练习集巨细,也就是说练习集越大,batch_size越小,练习就越快,但练习集比力大时,batch_size调太小推测有大概会对练习结果产生影响
一次处理惩罚数据集的数目:batch_size
如果数据集比力小,则保举设置得小一点,比如我这次练习只是看成测试,数据集只用了一首歌,切成了12份,数据集巨细就只有12,batch_size就只设置成了2,如果设置得太大会导致练习好久都练习不出一个模型,batch_size太大听说也比力吃显存,保举设置成12以内,数据集很大再调高点
练习速率:learning_rate
按readme说两者要成正比,我batch_size调成了2,learning_rate调成了0.000033,练习速率不是看epoch的打印快慢,可以参照输出模型的快慢大概输出评估信息的快慢
隔多久输出一次评估信息:log_interval
注意不是代表打印多少次epoch,数据集越小、batch_size越大必要越多的epoch才气输出一次评估信息
下方是评估信息,各个浮点数的值越小代表丧失越小,结果越好,不太认识可以不管
隔多久输出一次模型:eval_interval
注意不是代表打印多少次epoch,数据集越小、batch_size越大必要越多的epoch才气输出一次模型,输出模型就是log/44k目次下的那些G_开头的pth文件,D_开头的不能用
修改后的config.json如下
QA
停止后继承练习
So-VITS-SVC 4.0 练习/推理常见报错和Q&A - 哔哩哔哩 (bilibili.com)
https://www.bilibili.com/read/cv22206231/
练习不出模型
个人记录VITS利用题目(先发一些,持续摸索) - 哔哩哔哩 (bilibili.com)
https://www.bilibili.com/read/cv22071912/
开始推理(翻唱)
按改进版镜像中的readme利用webui来推理
Webui中只能转换wav文件,其他格式控制台报错要求我们先装ffmpeg把其他格式转成wav,那些可调参数似乎还不能改,改了就转不成了
为了不爆现存,我当地将歌曲(米泽园的POWDER SNOW)先用UVR分成人声和bgm,将人声用AU切分成每段最长1分钟,一段段传到webui上转换后再下回当地
然后再利用AU将多段音频合成完备一段人声(复制音频粘贴到另一段音频后面),还要利用混淆音轨将完备人声和前面的bgm分别拉进两段音轨里并对齐开头
右键混音会话为新建文件,左侧工作区多了一个音频
双击后全选整段音频右键生存,即可得到末了的完备AI音频
来源:
https://blog.csdn.net/qq_55891741/article/details/129922907
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
返回列表
发新帖
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
用户耕耘
23
主题
0
回帖
69
积分
注册会员
注册会员, 积分 69, 距离下一级还需 281 积分
注册会员, 积分 69, 距离下一级还需 281 积分
积分
69
加好友
发消息
回复楼主
返回列表
Omniverse
人工智能
其他
图文推荐
非绿色-黑鳍自动换角色组队吃药自动没疲劳刷金
2024-09-21
绿色-剑灵怀旧完整主线(10月更新)有韩服
2024-09-12
非绿色-定制AI全自动黑鳍V1.2
2024-09-14
剑灵三系精修端 星术咒3鬼3 T2 饰品属性外观
2023-08-16
Unity 超级马里奥
2023-08-22
热门排行
1
非绿色-黑鳍自动换角色组队吃药自动没疲劳
2
非绿色-定制AI全自动黑鳍V1.2
3
绿色-剑灵怀旧完整主线(10月更新)有韩服
4
剑灵三系精修端 星术咒3鬼3 T2 饰品属性外
5
Unity 超级马里奥
6
AI绘画stable-diffusion-webui指定GPU运行
7
非绿色-武神塔合集
8
非绿色-使用教程攻略
9
非绿色 3号自动切线 黑骑 钓鱼 蓝蛙
10
绿色-黑鳍脚本合集