【AI速報】VITS湊あくあモデルが完成 [638148915]
■ このスレッドは過去ログ倉庫に格納されています
实时唱歌功能也有所改善,减少吞音,基本可用了
但是延迟不稳定可能会有些对不上拍子,需要后续优化
【sovits4.0大礼包】低延迟实时变声器,即开即用 含AI阿夸、狐狸、船长模型
https://www.bilibili.com/video/BV16g4y1376m/
基于So-VITS-SVC阿夸歌曲合成模型 - 腾讯微云
https://share.weiyun.com/8cc1MTtZ 中国人が日本語で歌わせてるけど調教?いるか知らんけどどうやって調整してんだろ
俺らが中国語のボカロ作ろうに正解が分からんわ
>>5
ほぼ治ってるね
これとか
【AI歌唱】So-VITS v4.0最終版「V2」が公開、ついに肉声と同じレベルに到達
https://www.youtube.com/watch?v=XgYfVyFR6e8 100%裁判で負けるだろうしこんなんこんなんやってどうすんの
前半飛ばしていいから「实时的延迟和效果演示」のところだけ見ろ
飛ぶぞ
>>7
============================================免责声明====================================================
为避免可能的法律纠纷和道コ风险,使用者在使用该整合包前,请务必仔细阅读本条款,继续使用即代表理解并同意该声明,如有异议,请立即停止使用并删除本整合包。
1. 本整合包修改自diff-svc项目(https://github.com/prophesier/diff-svc),根据仓库作者要求,由此项目产出的任何结果公开发表(包括但不限于视频网站投稿),需注明原作者及代码来源(即前面的项目地址)。
2. 在使用本整合包时,必须根据知情同意原则取得数据集音声来源的授权许可,并根据授权协议条款规定使用数据集。
3. 禁止使用该整合包对公众人物、政治人物或其他容易引起争议的人物进行模型训练。使用本整合包产出和传输的信息需符合中国法律、国际公约的规定、符合公序良俗。不将本整合包以及与之相关的服务用作非法用途以及非正当用途。
4. 禁止将本整合包用于血腥、暴力、性相关、或侵犯他人合法权利的用途。
5. 任何发布到视频平台的基于diff-svc制作的视频,都必须要在简介明确指明用于变声器转换的输入源歌声、音频,例如:使用他人发布的视频/音频,通过分离的人声作为输入源进行转换的,必须要给出明确的原视频、音乐链接;若使用是自己的人声,或是使用其他歌声合成引フ合成的声音作为输入源进行转换的,也必须在简介加以说明。
因使用者违反上述条款中的任意一条或多条而造成的一切后果,均由使用者本人承担,与整合包作者、项目作者无关,特此声明。
========================================================================================================= ニコニコにもチラホラ上がってるな
音MADが誰でも作れるようになりそう なんか結局操作難しそうじゃん
文章入力したら自然な発声で読み上げてくれるレベルになったらまた教えてくれよ 導入するのに凄い高いグラボとか必要なのかなこれも
玄田哲章さんに歌うたわせたり小説読ませたいんよ
要求VRAM5GBか… 有名声優のエロ音声作って欲しいわ
伊ヶ崎綾香のあだると放送局辺りを元ネタにして名前だけ変えて欲しい コイカツの音声が置き換えられるレベルになったら起こしてくれ すげぇもうお面被ってるだけのババアは不要だな
原点回帰したVの時代が来るわ
>>25
正式名称「VITS文本转语音生成模型」((Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech))
VITS 语音合成完全端到端TTS的里程碑
https://blog.csdn.net/Terry_ZzZzZz/article/details/120458064
So-VITS-SVCの解説動画
【AI语音合成】基于VITS模型的优妮先辈语音合成
https://www.bilibili.com/video/BV1jY4y1c7JF
so-vits-svc 革命性突破最强声音克隆,终于可以用自己的声音播稿了
https://www.bilibili.com/video/BV1iL411y7Z5/
論文
用于端到端文本到语音的具有对抗学习的条件变分自动编码器(Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech)
https://arxiv.org/abs/2106.06103
論文の解説動画
论文分享会 | 用于端到端文本到语音的具有对抗学习的条件变分自编码器
https://www.bilibili.com/video/BV1QB4y1U7ZK/ ■ このスレッドは過去ログ倉庫に格納されています