X



音声自動生成AI「MoeGoe」スレ★10 [386780362]
■ このスレッドは過去ログ倉庫に格納されています
0002ケ 晟鉉 (オッペケ Srdf-OB67)2022/11/25(金) 18:36:21.82ID:nbIi2f9sr?2BP(1000)

正式名称「VITS文本转语音生成模型」((Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech))

GitHub - CjangCjengh-MoeGoe- Executable file for VITS inference
https://github.com/CjangCjengh/MoeGoe

MoeGoe_GUI
https://github.com/CjangCjengh/MoeGoe_GUI

Moe TTS And Voice Conversion Using VITS Model
https://huggingface.co/spaces/skytnt/moe-tts

MoeGoeリリースノート
https://github.com/CjangCjengh/MoeGoe/releases

MoeGoe製作者のCjangCjengh氏
CjangCjengh
https://space.bilibili.com/35285881

github
vits: Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech
https://github.com/jaywalnut310/vits

GitHub - innnky-vits-japanese- 端到端语音合成模型VITS,日语数据训练
https://github.com/innnky/vits-japanese

GitHub - Francis-Komizu-Sovits- An implementation of the combination of Soft-VC and VITS
https://github.com/Francis-Komizu/Sovits

GitHub - luoyily-MoeTTS- Speech synthesis model -inference GUI repo for galgame characters based on Tacotron2, Hifigan and VI
https://github.com/luoyily/MoeTTS

GitHub - Francis-Komizu-VITS- ACG Text-to-Speech
https://github.com/Francis-Komizu/VITS

VITS 语音合成完全端到端TTS的里程碑
https://blog.csdn.net/Terry_ZzZzZz/article/details/120458064

moegoegui更新と感情控制模型の説明動画
2890人模型更新+使用方法介绍
https://www.bilibili.com/video/BV1mP4y1y7iU/
0003ケ 晟鉉 (オッペケ Srdf-OB67)2022/11/25(金) 18:36:52.07ID:nbIi2f9sr?2BP(1000)

零基础炼丹秘籍 - 为自己喜爱的角色训练TTS(文字转语音)模型
TTS (text to speech) model for your favorite character
https://www.bilibili.com/read/mobile?id=17826415

デモページ
Audio Samples from "Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech"
https://jaywalnut310.github.io/vits-demo/index.html

VITS_TXT_to_Audio
https://github.com/alphanemeless/VITS_TXT_to_Audio

VITS长音声生成工具 为你的小说,添加AI配音吧!(可可萝老师讲解)
https://www.bilibili.com/video/BV11d4y1r7cT/

論文
用于端到端文本到语音的具有对抗学习的条件变分自动编码器(Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech)
https://arxiv.org/abs/2106.06103

論文の解説動画
论文分享会 | 用于端到端文本到语音的具有对抗学习的条件变分自编码器
https://www.bilibili.com/video/BV1QB4y1U7ZK/
0004ケ 晟鉉 (オッペケ Srdf-OB67)2022/11/25(金) 18:37:46.86ID:nbIi2f9sr?2BP(1000)

喜怒哀楽による読み上げの変化をパラメータ化しツール化

VITS情感控制语音合成

解説動画
可控制情感的绫地宁宁语音合成!基于VITS模型
https://www.bilibili.com/video/BV1Vg411h7of/

GitHub - audeering-w2v2-how-to- How to use our public wav2vec2 dimensional emotion model
https://github.com/audeering/w2v2-how-to

VITS情感控制语音合成
https://github.com/innnky/emotional-vits

感情を数字で指定できる、参数がパラメータ、样本がカタログのこと
「使用情感样本id作为情感参数」→「情感样本ID」

デモページ
nene-emotion
https://huggingface.co/spaces/innnky/nene-emotion
0005ケ 晟鉉 (オッペケ Srdf-OB67)2022/11/25(金) 18:38:14.87ID:nbIi2f9sr?2BP(1000)

「vits 模型」で検索すれば配布されてるデータセットが結構出てくるが消えるのが早い、気になるデータセットがあれば早めにダウンロードしておいても良さそうだ

百度网盘(Baidu Drive)からダウンロードするには百度垢が必須
百度アカウント開設方法↓

このアプリをインスコ後、国コードで日本を選んでSMS認証すれば完了
https://adersaytech.com/tech-event/how-to-register-baidu-account.html
0006ケ 晟鉉 (オッペケ Srdf-OB67)2022/11/25(金) 18:38:41.93ID:nbIi2f9sr?2BP(1000)

※百度网盘版は全て削除済み、嫌儲ディスコで再配布中

荒らし対策として、サーバーのメンバーに登録してから10分以上経過していないアカウントはチャットの参加を弾いているので予めご了承ください
参加後自動で弾かれた場合、recaptcha認証とアカウントのメール認証ができているか確認して下さい
recaptchaからの通知はDMで来るので、DM設定を許可にして下さい

嫌儲DISCORD部 - DISBOARD-
https://disboard.org/ja/server/313289774440120332

ラブライブ全キャラデータセット

LL全员语音模型 - 百度网盘(Baidu Drive)
パスワード r5k0
https://pan.baidu.com/s/1vHXah-GhzN31W6IkY6z6bQ

パスワード p2cn
https://pan.baidu.com/s/1vHXah-GhzN31W6IkY6z6bQ

パスワード mivq
zip解凍用パスワード LLSIFAS
https://pan.baidu.com/s/1jwvOmIvWjxFYR3EeQfjcdA

【【VITS】基于emotion-vits的LL全员语音模型】
https://www.bilibili.com/video/BV1jY411o7vv

Lovelive-VITS-JPZH Copied
https://huggingface.co/spaces/CarlDennis/Lovelive-VITS-JPZH

マギレコキャラ10人分のデータセット

パスワード mgrc

VITS的魔法纪录10人模型 - 百度网盘
https://pan.baidu.com/s/1ieZ9bisRPb6k7Nl-AH3hBg?pwd=mgrc
基于VITS的魔法纪录10人模型
https://www.bilibili.com/video/BV1Ne4y1y7uT/

ウマ娘
トウカイテイオー
ハルウララ
マチカネフクキタル
マチカネタンホイザ

パスワード wzsq

帝宝乌拉拉福来诗宝四人模型 -百度网盘
https://pan.baidu.com/s/1RsC-3WJfbv3pn7egGepcMA?pwd=wzsq

プリコネなかよし部データセット

パスワード znzk

好朋友部三人模型 - 百度网盘
https://pan.baidu.com/s/1A20m3NtIsxj_bjnU_6UlXw?pwd=znzk
0007ケ 晟鉉 (オッペケ Srdf-OB67)2022/11/25(金) 18:39:11.29ID:nbIi2f9sr?2BP(1000)

関連動画
プリコネキャラにごめゆいを言わせる動画、音声はすべて自動生成
【AI语音合成】用VITS给优衣说对不起 公主连接17人模型
https://www.bilibili.com/video/BV1S24y1d74C/

なかよし部に中国語で喋らせる動画
【语音合成】基于VITS的好朋友部三人语音合成模型
https://www.bilibili.com/video/BV1JD4y167sQ

ルイズに喋らせる動画
【AI语音合成/VITS】来感受随时可以被钉宫辱骂的快感吧!
https://www.bilibili.com/video/BV1BP411G7P8/

ウマ娘&原神の声色再現動画
【AI语音合成】赛马娘&原神的中日结合模型尝试
https://www.bilibili.com/video/BV1UG4y1W7Ji/

VITS文本转语音生成模型の解説動画
【AI语音合成】基于VITS模型的优妮先辈语音合成
https://www.bilibili.com/video/BV1jY4y1c7JF
0008ケ 晟鉉 (オッペケ Srdf-OB67)2022/11/25(金) 18:39:36.70ID:nbIi2f9sr?2BP(1000)

〜MoeGoeの使い方〜

MoeGoeダウンロードして
https://github.com/CjangCjengh/MoeGoe/releases/tag/v3.0.1

MoeGoe_GUIダウンロードして
https://github.com/CjangCjengh/MoeGoe_GUI/releases/tag/v3.0.2

ここのリンクからモデルとコンフィグファイルをセットでダウンロードできたが削除済、
嫌儲ディスコで再配布中 ファイル名 baohan_2890min_model

(Japanese & English & Korean & Chinese→Voistockの箇所)
GitHub - CjangCjengh-TTSModels
https://github.com/CjangCjengh/TTSModels#voistock

MoeGoe_GUI.exeを起動、MoeGoe.exeの位置とモデル(模型pth)、コンフィグ(配置・json)を指定したら
文本に文章入れて正規表現に変換できたら下のプルダウンメニューからキャラ名選んで保存ボタンで保存

MoeGoeリリースノート
https://github.com/CjangCjengh/MoeGoe/releases
0009ケ 晟鉉 (オッペケ Srdf-OB67)2022/11/25(金) 18:40:35.96ID:nbIi2f9sr?2BP(1000)

MoeGoeローカルWebアプリバージョン
WebApp_MoeGoe
https://github.com/tasrr/WebApp_MoeGoe

MoeGoe_GUI日本語版
https://uploader.cc/s/rnt23lz3jv3bn9rygir7d8hlc98wlyir7sw8dn18ijkwo48bnnvefnwse2jltc5t.zip
https://greta.5ch.net/test/read.cgi/poverty/1668689965/82

日本語アクセント補正版
https://github.com/tasrr/WebApp_MoeGoe
https://greta.5ch.net/test/read.cgi/poverty/1668163297/90

基本がJA無しでチェックを入れた場合にJA付けますんver
https://uploader.cc/s/9lk9mgvbqd2akkbdvvu0pywr76pfh7z6osv54y9jmnevd4t5drvmykk4kuwu9b61.zip
https://greta.5ch.net/test/read.cgi/poverty/1668949664/53

※重要※/models/にフォルダ作ってモデルファイルを置いてないと使えませんver
※モデル変更時、本家でクリアしてる部分を強引に残すようにしたんで不具合あるかも
・モデル変更時の初回生成は少し時間掛かります
・Ctrl+→
 チェックある時は[JA]付けて、チェック入って無い時に[JA]があったら勝手に消します
https://uploader.cc/s/gkvfnftcz4hrujlh5i1t48a68oc41811mfc5xsxx7lrgasrkqczimmalj4pj46ql.zip
https://greta.5ch.net/test/read.cgi/poverty/1668949664/60

GUI_KAIファイルがとっ散らかっちゃってるんでまとめましたver
追加はデフォルトフォルダを変更出来るようにした位です
https://uploader.cc/s/g8t3tv9esr551uy8bddqnu345xdkgedn58vmrugwe83fjsh7hg58uevkw58lbqp6.zip

【デフォルトのフォルダを変えたい場合】
※今まで通りで良い場合は不要です
ルート(MoeGoe.exeがあるフォルダ)にcurrentpath.txtってテキストファイルを作って「モデルフォルダへのパス」と「音声出力先パス」を2行で書き加えてね
↓こんな感じ
https://i.imgur.com/DmM60VO.jpg
https://i.imgur.com/FpvAqZG.jpg

https://greta.5ch.net/test/read.cgi/poverty/1669210173/28

Voistock の config.json、最初の方の
text_cleaners:["cjke_cleaners2"],

text_cleaners:["japanese_cleaners2"],
に書き換えると[JA]が不要になる
0010ケ 晟鉉 (オッペケ Srdf-OB67)2022/11/25(金) 18:41:11.40ID:nbIi2f9sr?2BP(1000)

ラブライブモデルをGUIに読み込ませると話者タブが全部数字になるバグ有
解決法は嫌儲ディスコにあります
0011ケ 晟鉉 (オッペケ Srdf-OB67)2022/11/25(金) 18:41:32.08ID:nbIi2f9sr?2BP(1000)

moegoe開発者グループ

纸片人魔法交流群 - QQ群聊

第1群·702724269(満員)

第2群·768432324(加入時にモデレータによる審査あり)

第3群·546637589(加入時にモデレータによる審査あり)
0012ケ 晟鉉 (オッペケ Srdf-OB67)2022/11/25(金) 18:41:59.96ID:nbIi2f9sr?2BP(1000)

各キャラごとの声質に寄せつつ、日本語以外にも英語中国語韓国語で音声を生成することも可能なようだ

https://i.imgur.com/xvOmV0y.png
https://i.imgur.com/1nHgIjd.png
https://i.imgur.com/yvYkW6E.png
https://i.imgur.com/S9FjVrm.png
https://i.imgur.com/KgZo70z.png
https://i.imgur.com/kINKEVU.png

包含2890名动画角色的VITS语音合成模型
https://www.bilibili.com/video/BV1P8411Y7v5/

ラブライブ全キャラ音声データセットが音声自動生成AI「MoeGoe」用に公開され話題に
https://www.youtube.com/watch?v=BtG99EOwuWE

githubで公開されている音声自動生成AI、日本のアニメキャラ2890名分の音声を学習素材に超速度で進化中
https://www.youtube.com/watch?v=aoq97CT0MUs

音声自動生成AI"MoeGoe"によるボイスドラマ
https://www.youtube.com/watch?v=4agKYtUWstU
0013番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW cfd2-0Ame)2022/11/25(金) 18:50:07.34ID:U7Dogz3y0
GoeMon
0014番組の途中ですがアフィサイトへの転載は禁止です (アウアウウー Sa3b-x7Cn)2022/11/25(金) 18:51:01.41ID:ocsYBZUTa
AbeGoe
0016番組の途中ですがアフィサイトへの転載は禁止です (スッップ Sd02-L6m6)2022/11/25(金) 18:53:01.38ID:6GIqt3Rnd
ほー
0017番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW 4e23-oCuK)2022/11/25(金) 18:54:59.85ID:vdnDPOwD0
>>14
これ早く作れ
0020番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ a234-Nwcx)2022/11/25(金) 19:48:23.42ID:HjaAYPDv0
モデル名をGUIで日本語表示できるやつってどこで変換できるの?
0022番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW 52e6-YsL3)2022/11/25(金) 19:54:05.42ID:Gmc9Le8M0
スレ立て乙
だけど、AIイラストみたいに毎日のように進化してるとかじゃないとレスしようがないよな
0023ケ 晟鉉 (ワッチョイ ef4e-RrTy)2022/11/25(金) 20:09:05.83ID:T/jLiorN0
音声自動生成AI「MoeGoe」スレ★9
https://greta.5ch.net/test/read.cgi/poverty/1669295415/

音声自動生成AI「MoeGoe」スレ★8
https://greta.5ch.net/test/read.cgi/poverty/1669210173/

githubで公開されている音声自動生成AI、日本のアニメキャラ2890名分の音声を学習素材に超速度で進化中★7
https://greta.5ch.net/test/read.cgi/poverty/1668949664/

githubで公開されている音声自動生成AI、日本のアニメキャラ2890名分の音声を学習素材に超速度で進化中★6
https://greta.5ch.net/test/read.cgi/poverty/1668689965/

githubで公開されている音声自動生成AI、日本のアニメキャラ2890名分の音声を学習素材に超速度で進化中★5
https://greta.5ch.net/test/read.cgi/poverty/1668430601/

githubで公開されている音声自動生成AI、日本のアニメキャラ2890名分の音声を学習素材に超速度で進化中★4
https://greta.5ch.net/test/read.cgi/poverty/1668163297/

githubで公開されている音声自動生成AI、日本のアニメキャラ2890名分の音声を学習素材に超速度で進化中★3
https://greta.5ch.net/test/read.cgi/poverty/1667913400/

githubで公開されている音声自動生成AI、日本のアニメキャラ2890名分の音声を学習素材に超速度で進化中★2
https://greta.5ch.net/test/read.cgi/poverty/1667651561/

githubで公開されている音声自動生成AI、日本のアニメキャラ2890名分の音声を学習素材に超速度で進化中
https://greta.5ch.net/test/read.cgi/poverty/1667389094/
0025ケ 晟鉉 (ワッチョイ ef4e-RrTy)2022/11/25(金) 21:36:14.62ID:T/jLiorN0
>>24
ディスコでモデル作ってる人がいる
0026ケ 晟鉉 (ワッチョイ ef4e-RrTy)2022/11/25(金) 21:36:56.64ID:T/jLiorN0
総本山たるテンセント鯖内でvtbを学習元にしたデータセットが開発されてる
0027ケ 晟鉉 (ワッチョイ ef4e-RrTy)2022/11/25(金) 21:46:43.04ID:T/jLiorN0
テンセント鯖内で新しいモデルが出ていたのでディスコで共有します

情感识别模型w2
ファイル名 w2v2-L-robust-12.6bc4a7fd-1.1.0.zip
0029ケ 晟鉉 (ワッチョイ ef4e-FINd)2022/11/25(金) 22:58:05.19ID:T/jLiorN0?2BP(1000)

[JA]保守[JA]
0030番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ d74e-YRAI)2022/11/26(土) 08:36:05.27ID:eRui5dv40?2BP(1000)

[JA]保守[JA]
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況