X



音声自動生成AI「MoeGoe」&「Gal Voice」スレ★16 [386780362]
■ このスレッドは過去ログ倉庫に格納されています
0002ケ 晟鉉 (ワッチョイ 4c4e-IRQi)垢版2022/12/03(土) 16:19:54.98ID:jIcfWLox0?2BP(1000)

※百度网盘版は全て削除済み、嫌儲ディスコで再配布中

荒らし対策として、サーバーのメンバーに登録してから10分以上経過していないアカウントはチャットの参加を弾いているので予めご了承ください
参加後自動で弾かれた場合、recaptcha認証とアカウントのメール認証ができているか確認して下さい
recaptchaからの通知はDMで来るので、DM設定を許可にして下さい

嫌儲DISCORD部 - DISBOARD-
https://disboard.org/ja/server/313289774440120332

ラブライブ全キャラデータセット

LL全员语音模型 - 百度网盘(Baidu Drive)
パスワード r5k0
https://pan.baidu.com/s/1vHXah-GhzN31W6IkY6z6bQ

パスワード p2cn
https://pan.baidu.com/s/1vHXah-GhzN31W6IkY6z6bQ

パスワード mivq
zip解凍用パスワード LLSIFAS
https://pan.baidu.com/s/1jwvOmIvWjxFYR3EeQfjcdA

【【VITS】基于emotion-vits的LL全员语音模型】
https://www.bilibili.com/video/BV1jY411o7vv

Lovelive-VITS-JPZH Copied
https://huggingface.co/spaces/CarlDennis/Lovelive-VITS-JPZH

マギレコキャラ10人分のデータセット

パスワード mgrc

VITS的魔法纪录10人模型 - 百度网盘
https://pan.baidu.com/s/1ieZ9bisRPb6k7Nl-AH3hBg?pwd=mgrc
基于VITS的魔法纪录10人模型
https://www.bilibili.com/video/BV1Ne4y1y7uT/

ウマ娘
トウカイテイオー
ハルウララ
マチカネフクキタル
マチカネタンホイザ

パスワード wzsq

帝宝乌拉拉福来诗宝四人模型 -百度网盘
https://pan.baidu.com/s/1RsC-3WJfbv3pn7egGepcMA?pwd=wzsq

プリコネなかよし部データセット

パスワード znzk

好朋友部三人模型 - 百度网盘
https://pan.baidu.com/s/1A20m3NtIsxj_bjnU_6UlXw?pwd=znzk
0003ケ 晟鉉 (ワッチョイ 4c4e-IRQi)垢版2022/12/03(土) 16:20:49.15ID:jIcfWLox0?2BP(1000)

ディスコで再配布しているモデルとデータセット

●2890人モデル
●情感识别模型w2(感情つきVITSデータセット)
●ラブライブ全キャラデータセット
●マギレコキャラ10人分のデータセット
●ウマ娘キャラ4人分のデータセット
●プリコネなかよし部データセット
●音声自動生成AI『Gal Voice 1.3.0』
0004ケ 晟鉉 (ワッチョイ 4c4e-IRQi)垢版2022/12/03(土) 16:21:13.90ID:jIcfWLox0?2BP(1000)

ラブライブ全キャラ音声データセットが音声自動生成AI「MoeGoe」用に公開され話題に
https://www.youtube.com/watch?v=BtG99EOwuWE

githubで公開されている音声自動生成AI、日本のアニメキャラ2890名分の音声を学習素材に超速度で進化中
https://www.youtube.com/watch?v=aoq97CT0MUs

音声自動生成AI"MoeGoe"によるボイスドラマ
https://www.youtube.com/watch?v=4agKYtUWstU
0005ケ 晟鉉 (ワッチョイ 4c4e-IRQi)垢版2022/12/03(土) 16:21:26.51ID:jIcfWLox0?2BP(1000)

各キャラごとの声質に寄せつつ、日本語以外にも英語中国語韓国語で音声を生成することも可能なようだ

https://i.imgur.com/xvOmV0y.png
https://i.imgur.com/1nHgIjd.png
https://i.imgur.com/yvYkW6E.png
https://i.imgur.com/S9FjVrm.png
https://i.imgur.com/KgZo70z.png
https://i.imgur.com/kINKEVU.png

包含2890名动画角色的VITS语音合成模型
https://www.bilibili.com/video/BV1P8411Y7v5/
0006番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW 460d-+nB1)垢版2022/12/03(土) 16:21:52.40ID:VN/b2e9D0
なんでこんなにパートスレ行ってるんだよ
0007ケ 晟鉉 (ワッチョイ 4c4e-IRQi)垢版2022/12/03(土) 16:22:03.96ID:jIcfWLox0?2BP(1000)

2890名分のデータセットの場所はこちら

注意
本页面提供的所有模型及其衍生物严禁商用!
请自行承担使用模型而造成的一切后果!

skytnt-moe-tts at main
https://huggingface.co/spaces/skytnt/moe-tts/tree/main/saved_model/15

GitHub - CjangCjengh-TTSModels
https://github.com/CjangCjengh/TTSModels#voistock

Japanese & English & Korean & Chinese

Voistockの箇所
0008ケ 晟鉉 (ワッチョイ 4c4e-IRQi)垢版2022/12/03(土) 16:22:20.07ID:jIcfWLox0?2BP(1000)

正式名称「VITS文本转语音生成模型」((Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech))

GitHub - CjangCjengh-MoeGoe- Executable file for VITS inference
https://github.com/CjangCjengh/MoeGoe

MoeGoe_GUI
https://github.com/CjangCjengh/MoeGoe_GUI

Moe TTS And Voice Conversion Using VITS Model
https://huggingface.co/spaces/skytnt/moe-tts

MoeGoeリリースノート
https://github.com/CjangCjengh/MoeGoe/releases

MoeGoe製作者のCjangCjengh氏
CjangCjengh
https://space.bilibili.com/35285881

github
vits: Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech
https://github.com/jaywalnut310/vits

GitHub - innnky-vits-japanese- 端到端语音合成模型VITS,日语数据训练
https://github.com/innnky/vits-japanese

GitHub - Francis-Komizu-Sovits- An implementation of the combination of Soft-VC and VITS
https://github.com/Francis-Komizu/Sovits

GitHub - luoyily-MoeTTS- Speech synthesis model -inference GUI repo for galgame characters based on Tacotron2, Hifigan and VI
https://github.com/luoyily/MoeTTS

GitHub - Francis-Komizu-VITS- ACG Text-to-Speech
https://github.com/Francis-Komizu/VITS

VITS 语音合成完全端到端TTS的里程碑
https://blog.csdn.net/Terry_ZzZzZz/article/details/120458064

moegoegui更新と感情控制模型の説明動画
2890人模型更新+使用方法介绍
https://www.bilibili.com/video/BV1mP4y1y7iU/
0009ケ 晟鉉 (ワッチョイ 4c4e-IRQi)垢版2022/12/03(土) 16:23:33.22ID:jIcfWLox0?2BP(1000)

デモページ
Audio Samples from "Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech"
https://jaywalnut310.github.io/vits-demo/index.html

VITS_TXT_to_Audio
https://github.com/alphanemeless/VITS_TXT_to_Audio

VITS长音声生成工具 为你的小说,添加AI配音吧!(可可萝老师讲解)
https://www.bilibili.com/video/BV11d4y1r7cT/

論文
用于端到端文本到语音的具有对抗学习的条件变分自动编码器(Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech)
https://arxiv.org/abs/2106.06103

論文の解説動画
论文分享会 | 用于端到端文本到语音的具有对抗学习的条件变分自编码器
https://www.bilibili.com/video/BV1QB4y1U7ZK/

学習法1
GitHub - IceKyrin-sovits_guide- sovits各版本介绍及一键colab
https://github.com/IceKyrin/sovits_guide

学習法2
零基础炼丹秘籍 - 为自己喜爱的角色训练TTS(文字转语音)模型
TTS (text to speech) model for your favorite character
https://www.bilibili.com/read/mobile?id=17826415
0010ケ 晟鉉 (ワッチョイ 4c4e-IRQi)垢版2022/12/03(土) 16:23:44.97ID:jIcfWLox0?2BP(1000)

喜怒哀楽による読み上げの変化をパラメータ化しツール化

VITS情感控制语音合成

解説動画
可控制情感的绫地宁宁语音合成!基于VITS模型
https://www.bilibili.com/video/BV1Vg411h7of/

GitHub - audeering-w2v2-how-to- How to use our public wav2vec2 dimensional emotion model
https://github.com/audeering/w2v2-how-to

VITS情感控制语音合成
https://github.com/innnky/emotional-vits

感情を数字で指定できる、参数がパラメータ、样本がカタログのこと
「使用情感样本id作为情感参数」→「情感样本ID」

デモページ
nene-emotion
https://huggingface.co/spaces/innnky/nene-emotion
0011ケ 晟鉉 (ワッチョイ 4c4e-IRQi)垢版2022/12/03(土) 16:24:24.98ID:jIcfWLox0?2BP(1000)

「vits 模型」で検索すれば配布されてるデータセットが結構出てくるが消えるのが早い、気になるデータセットがあれば早めにダウンロードしておいても良さそうだ

百度网盘(Baidu Drive)からダウンロードするには百度垢が必須
百度アカウント開設方法↓

このアプリをインスコ後、国コードで日本を選んでSMS認証すれば完了
https://adersaytech.com/tech-event/how-to-register-baidu-account.html
0012ケ 晟鉉 (ワッチョイ 4c4e-IRQi)垢版2022/12/03(土) 16:25:00.56ID:jIcfWLox0?2BP(1000)

MoeGoeの関連動画
プリコネキャラにごめゆいを言わせる動画、音声はすべて自動生成
【AI语音合成】用VITS给优衣说对不起 公主连接17人模型
https://www.bilibili.com/video/BV1S24y1d74C/

なかよし部に中国語で喋らせる動画
【语音合成】基于VITS的好朋友部三人语音合成模型
https://www.bilibili.com/video/BV1JD4y167sQ

ルイズに喋らせる動画
【AI语音合成/VITS】来感受随时可以被钉宫辱骂的快感吧!
https://www.bilibili.com/video/BV1BP411G7P8/

ウマ娘&原神の声色再現動画
【AI语音合成】赛马娘&原神的中日结合模型尝试
https://www.bilibili.com/video/BV1UG4y1W7Ji/

VITS文本转语音生成模型の解説動画
【AI语音合成】基于VITS模型的优妮先辈语音合成
https://www.bilibili.com/video/BV1jY4y1c7JF

Gal Voiceの関連動画
【用游戏角色的声音向qq好友发消息[Gal Voice 1.3.0更新]】
https://www.bilibili.com/video/BV1m84y1B7NW/
0014番組の途中ですがアフィサイトへの転載は禁止です (アウアウウー Sa83-nF8M)垢版2022/12/03(土) 16:27:41.82ID:dr5mvPCLa?2BP(1000)

これってさ 解説動画とかに使えないのかな?
0015ケ 晟鉉 (ワッチョイ 4c4e-IRQi)垢版2022/12/03(土) 16:28:18.89ID:jIcfWLox0?2BP(1000)

音声自動生成AI『Gal-Voice』
GitHub - TheKOG-Gal-Voice-Bot
https://github.com/TheKOG/Gal-Voice-Bot

Gal-Voice GUI
Gal Voice - 百度网盘(Baidu Drive)
https://pan.baidu.com/s/14RmT8HcGgeEDiBJU60MLEw

テンセントQQの開発者鯖

KOG技术交流群 - QQ群聊
https://i.imgur.com/JKb0ObB.jpg
https://i.imgur.com/VAoaYvF.jpg
https://i.imgur.com/p47p410.jpg

第1群·853240792

第2群·783966336

第3群·613525127(加入時に数学のテストあり)
0016ケ 晟鉉 (ワッチョイ 4c4e-IRQi)垢版2022/12/03(土) 16:28:39.45ID:jIcfWLox0?2BP(1000)

〜MoeGoeの使い方〜

MoeGoeダウンロードして
https://github.com/CjangCjengh/TTSModels
https://github.com/CjangCjengh/MoeGoe/releases/tag/v3.0.1

MoeGoe_GUIダウンロードして
https://github.com/CjangCjengh/MoeGoe_GUI/releases/tag/v3.0.2

ここのリンクからモデルとコンフィグファイルをセットでダウンロードして
skytnt-moe-tts at main
https://huggingface.co/spaces/skytnt/moe-tts/tree/main/saved_model/15

(Japanese & English & Korean & Chinese→Voistockの箇所)
GitHub - CjangCjengh-TTSModels
https://github.com/CjangCjengh/TTSModels#voistock

MoeGoe_GUI.exeを起動、MoeGoe.exeの位置とモデル(模型pth)、コンフィグ(配置・json)を指定したら
文本に文章入れて正規表現に変換できたら下のプルダウンメニューからキャラ名選んで保存ボタンで保存

MoeGoeリリースノート
https://github.com/CjangCjengh/MoeGoe/releases

MoeGoeローカルWebアプリバージョン
WebApp_MoeGoe
https://github.com/tasrr/WebApp_MoeGoe

MoeGoe_GUI日本語版
https://uploader.cc/s/rnt23lz3jv3bn9rygir7d8hlc98wlyir7sw8dn18ijkwo48bnnvefnwse2jltc5t.zip
https://greta.5ch.net/test/read.cgi/poverty/1668689965/82

日本語アクセント補正版
https://github.com/tasrr/WebApp_MoeGoe
https://greta.5ch.net/test/read.cgi/poverty/1668163297/90

基本がJA無しでチェックを入れた場合にJA付けますんver
https://uploader.cc/s/9lk9mgvbqd2akkbdvvu0pywr76pfh7z6osv54y9jmnevd4t5drvmykk4kuwu9b61.zip
https://greta.5ch.net/test/read.cgi/poverty/1668949664/53

※重要※/models/にフォルダ作ってモデルファイルを置いてないと使えませんver
※モデル変更時、本家でクリアしてる部分を強引に残すようにしたんで不具合あるかも
・モデル変更時の初回生成は少し時間掛かります
・Ctrl+→
 チェックある時は[JA]付けて、チェック入って無い時に[JA]があったら勝手に消します
https://uploader.cc/s/gkvfnftcz4hrujlh5i1t48a68oc41811mfc5xsxx7lrgasrkqczimmalj4pj46ql.zip
https://greta.5ch.net/test/read.cgi/poverty/1668949664/60

GUI_KAIファイルがとっ散らかっちゃってるんでまとめましたver
追加はデフォルトフォルダを変更出来るようにした位です
https://uploader.cc/s/g8t3tv9esr551uy8bddqnu345xdkgedn58vmrugwe83fjsh7hg58uevkw58lbqp6.zip

【デフォルトのフォルダを変えたい場合】
※今まで通りで良い場合は不要です
ルート(MoeGoe.exeがあるフォルダ)にcurrentpath.txtってテキストファイルを作って「モデルフォルダへのパス」と「音声出力先パス」を2行で書き加えてね
↓こんな感じ
https://i.imgur.com/DmM60VO.jpg
https://i.imgur.com/FpvAqZG.jpg
https://greta.5ch.net/test/read.cgi/poverty/1669210173/28

Voistock の config.json、最初の方の
text_cleaners:["cjke_cleaners2"],

text_cleaners:["japanese_cleaners2"],
に書き換えると[JA]が不要になる
0017ケ 晟鉉 (ワッチョイ 4c4e-IRQi)垢版2022/12/03(土) 16:32:21.75ID:jIcfWLox0?2BP(1000)

音声自動生成AI『Gal Voice 1 3 0』が公開、開発規模は総勢2500人
GitHub - TheKOG-Gal-Voice-Bot
https://github.com/TheKOG/Gal-Voice-Bot

Gal-Voice GUI
Gal Voice - 百度网盘(Baidu Drive)
https://pan.baidu.com/s/14RmT8HcGgeEDiBJU60MLEw

【用游戏角色的声音向qq好友发消息[Gal Voice 1.3.0更新]】
https://www.bilibili.com/video/BV1m84y1B7NW

テンセントQQの開発者鯖

KOG技术交流群 - QQ群聊
第1群·853240792

第2群·783966336

第3群·613525127(加入時に数学のテストあり)
0018番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW 8b8f-nflQ)垢版2022/12/03(土) 16:35:50.49ID:YU+/5WML0
廃業or死亡した声優の声とかなら使うリスク低くなるかもな
0020番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ cea6-4FAg)垢版2022/12/03(土) 16:55:29.55ID:CcYjaJnx0
フェネック本宮さんのVOICEPEAK 彩澄りりせ予約したよ
楽しみがフェネックっぽい

https://www.ah-soft.com/voice/ririse/index.html
0021番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW f21b-/Uej)垢版2022/12/03(土) 17:51:27.66ID:50WODmQO0
スレ立て続ける必要ある?
鄧 晟鉉の目的はなんだ?
0022番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW ee56-Y+6g)垢版2022/12/03(土) 18:11:52.53ID:yYzaN1140
自分の録音した声変換するやつ使って見たけど
使えるキャラはそんなに多くないのな
そのうち追加されるん?
0023番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW 7441-JiyJ)垢版2022/12/03(土) 18:29:57.60ID:9g7dvwoo0
>>20
1万超えかあ
0025番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW 9bd2-+CjD)垢版2022/12/04(日) 06:37:04.92ID:IxULrazL0
リアルタイムにこのクラスのチェンジ出来る時代は5年10年先だろうな
0026番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ be34-7/+2)垢版2022/12/04(日) 10:26:37.95ID:oTk5Wijo0
Colab Proに入ってもあんまり快適にならない
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況