githubで公開されている音声自動生成AI、日本のアニメキャラ2890名分の音声を学習素材に超速度で進化中★6 [386780362]
■ このスレッドは過去ログ倉庫に格納されています
前スレ
githubで公開されている音声自動生成AI、日本のアニメキャラ2890名分の音声を学習素材に超速度で進化中★5
https://greta.5ch.net/test/read.cgi/poverty/1668430601/
2890名分のデータセットの場所はこちら
GitHub - CjangCjengh-TTSModels
https://github.com/CjangCjengh/TTSModels#voistock
Japanese & English & Korean & Chinese
↓
Voistockの箇所
正式名称「VITS文本转语音生成模型」((Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech))
github
vits: Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech
https://github.com/jaywalnut310/vits
GitHub - innnky-vits-japanese- 端到端语音合成模型VITS,日语数据训练
https://github.com/innnky/vits-japanese
GitHub - Francis-Komizu-Sovits- An implementation of the combination of Soft-VC and VITS
https://github.com/Francis-Komizu/Sovits
GitHub - luoyily-MoeTTS- Speech synthesis model -inference GUI repo for galgame characters based on Tacotron2, Hifigan and VI
https://github.com/luoyily/MoeTTS
GitHub - Francis-Komizu-VITS- ACG Text-to-Speech
https://github.com/Francis-Komizu/VITS
VITS 语音合成完全端到端TTS的里程碑
https://blog.csdn.net/Terry_ZzZzZz/article/details/120458064
GitHub - CjangCjengh-MoeGoe- Executable file for VITS inference
https://github.com/CjangCjengh/MoeGoe
MoeGoe_GUI
https://github.com/CjangCjengh/MoeGoe_GUI
Moe TTS And Voice Conversion Using VITS Model
https://huggingface.co/spaces/skytnt/moe-tts
MoeGoeリリースノート
https://github.com/CjangCjengh/MoeGoe/releases
MoeGoe製作者のCjangCjengh氏
CjangCjengh
https://space.bilibili.com/35285881
moegoegui更新と感情控制模型の説明動画
2890人模型更新+使用方法介绍
https://www.bilibili.com/video/BV1mP4y1y7iU/ AIが自動生成するイラストが、数年で劇的に進化していて驚嘆「AIは既に私たちを超えている」「絵師が血ヘド吐く勢い」と話題に - Togetter
すげい…。
https://i.imgur.com/ioVi1fS.png
零基础炼丹秘籍 - 为自己喜爱的角色训练TTS(文字转语音)模型
TTS (text to speech) model for your favorite character
https://www.bilibili.com/read/mobile?id=17826415
デモページ
Audio Samples from "Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech"
https://jaywalnut310.github.io/vits-demo/index.html
VITS_TXT_to_Audio
https://github.com/alphanemeless/VITS_TXT_to_Audio
VITS长音声生成工具 为你的小说,添加AI配音吧!(可可萝老师讲解)
https://www.bilibili.com/video/BV11d4y1r7cT/
論文
用于端到端文本到语音的具有对抗学习的条件变分自动编码器(Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech)
https://arxiv.org/abs/2106.06103
論文の解説動画
论文分享会 | 用于端到端文本到语音的具有对抗学习的条件变分自编码器
https://www.bilibili.com/video/BV1QB4y1U7ZK/
喜怒哀楽による読み上げの変化をパラメータ化しツール化
VITS情感控制语音合成
解説動画
可控制情感的绫地宁宁语音合成!基于VITS模型
https://www.bilibili.com/video/BV1Vg411h7of/
GitHub - audeering-w2v2-how-to- How to use our public wav2vec2 dimensional emotion model
https://github.com/audeering/w2v2-how-to
VITS情感控制语音合成
https://github.com/innnky/emotional-vits
感情を数字で指定できる、参数がパラメータ、样本がカタログのこと
「使用情感样本id作为情感参数」→「情感样本ID」
デモページ
nene-emotion
https://huggingface.co/spaces/innnky/nene-emotion
〜MoeGoeの使い方〜
MoeGoeダウンロードして
https://github.com/CjangCjengh/MoeGoe/releases/tag/v3.0.0
MoeGoe_GUIダウンロードして
https://github.com/CjangCjengh/MoeGoe_GUI/releases/tag/v3.0.2
ここのリンクからモデルとコンフィグファイルをセットでダウンロードして
(Japanese & English & Korean & Chinese→Voistockの箇所)
GitHub - CjangCjengh-TTSModels
https://github.com/CjangCjengh/TTSModels#voistock
MoeGoe_GUI.exeを起動、MoeGoe.exeの位置とモデル(模型pth)、コンフィグ(配置・json)を指定したら
文本に文章入れて正規表現に変換できたら下のプルダウンメニューからキャラ名選んで保存ボタンで保存
MoeGoeリリースノート
https://github.com/CjangCjengh/MoeGoe/releases
MoeGoeのローカルWebアプリバージョン
WebApp_MoeGoe
https://github.com/tasrr/WebApp_MoeGoe
MoeGoe_GUI日本語版
https://uploader.cc/s/vnge4iqwvgv8aywn1ohlgnoy55w8aahy0cjut6c9nekdog9cdwhruejgrtirraqn.zip はやみんの声で喘がせてくれ
FE無双で喘いでるからその音声を参考にしてくれ
「vits 模型」で検索すれば配布されてるデータセットが結構出てくるが消えるのが早い、気になるデータセットがあれば早めにダウンロードしておいても良さそうだ
百度网盘(Baidu Cloud)からダウンロードするには百度垢が必須
百度アカウント開設方法↓
このアプリをインスコ後、国コードで日本を選んでSMS認証すれば完了
https://adersaytech.com/tech-event/how-to-register-baidu-account.html
↓のデータセットはまだダウンロード可能!!!!!!!!!!!!!!!!!!
ラブライブ全キャラデータセット
パスワード r5k0
LL全员语音模型
https://pan.baidu.com/s/1vHXah-GhzN31W6IkY6z6bQ
【【VITS】基于emotion-vits的LL全员语音模型】
https://www.bilibili.com/video/BV1jY411o7vv
Lovelive-VITS-JPZH Copied
https://huggingface.co/spaces/CarlDennis/Lovelive-VITS-JPZH ボイスコミック程度なら一人で制作できちゃいそうなのか? 可愛い声に読み上げさせてる生主いるけどそういうのに使えたりするのかな
【嫌儲ディスコで下記モデルデータ配布中】
荒らし対策として、サーバーのメンバーに登録してから10分以上経過していないアカウントはチャットの参加を弾いているので予めご了承ください
参加後自動で弾かれた場合、recaptcha認証とアカウントのメール認証ができているか確認して下さい
嫌儲DISCORD部 - DISBOARD-
https://disboard.org/ja/server/313289774440120332
マギレコキャラ10人分のデータセット
パスワード mgrc
VITS的魔法纪录10人模型 - 百度网盘
https://pan.baidu.com/s/1ieZ9bisRPb6k7Nl-AH3hBg?pwd=mgrc
基于VITS的魔法纪录10人模型
https://www.bilibili.com/video/BV1Ne4y1y7uT/
ウマ娘
トウカイテイオー
ハルウララ
マチカネフクキタル
マチカネタンホイザ
パスワード wzsq
帝宝乌拉拉福来诗宝四人模型 -百度网盘
https://pan.baidu.com/s/1RsC-3WJfbv3pn7egGepcMA?pwd=wzsq
プリコネなかよし部データセット
パスワード znzk
好朋友部三人模型 - 百度网盘
https://pan.baidu.com/s/1A20m3NtIsxj_bjnU_6UlXw?pwd=znzk
関連動画
プリコネキャラにごめゆいを言わせる動画、音声はすべて自動生成
【AI语音合成】用VITS给优衣说对不起 公主连接17人模型
https://www.bilibili.com/video/BV1S24y1d74C/
なかよし部に中国語で喋らせる動画
【语音合成】基于VITS的好朋友部三人语音合成模型
https://www.bilibili.com/video/BV1JD4y167sQ
ルイズに喋らせる動画
【AI语音合成/VITS】来感受随时可以被钉宫辱骂的快感吧!
https://www.bilibili.com/video/BV1BP411G7P8/
ウマ娘&原神の声色再現動画
【AI语音合成】赛马娘&原神的中日结合模型尝试
https://www.bilibili.com/video/BV1UG4y1W7Ji/
VITS文本转语音生成模型の解説動画
【AI语音合成】基于VITS模型的优妮先辈语音合成
https://www.bilibili.com/video/BV1jY4y1c7JF DLsiteで活躍してるネット声優が風俗落ちしてまうやん😭 初期ミクさんくらいカタコトでしょ?
それでもすごいけど
Voistock の config.json、最初の方の
text_cleaners:["cjke_cleaners2"],
を
text_cleaners:["japanese_cleaners2"],
に書き換えると[JA]が不要になる
ラブライブ全キャラデータセットダウンロードしてる
https://i.imgur.com/RHOf2zL.png
rarファイルってどうやって共有するの? ローカルで動かしたいんだけど導入方法解説してるサイトとかない?
>>32
〜MoeGoeの使い方〜
MoeGoeダウンロードして
https://github.com/CjangCjengh/MoeGoe/releases/tag/v3.0.0
MoeGoe_GUIダウンロードして
https://github.com/CjangCjengh/MoeGoe_GUI/releases/tag/v3.0.2
ここのリンクからモデルとコンフィグファイルをセットでダウンロードして
(Japanese & English & Korean & Chinese→Voistockの箇所)
GitHub - CjangCjengh-TTSModels
https://github.com/CjangCjengh/TTSModels#voistock
MoeGoe_GUI.exeを起動、MoeGoe.exeの位置とモデル(模型pth)、コンフィグ(配置・json)を指定したら
文本に文章入れて正規表現に変換できたら下のプルダウンメニューからキャラ名選んで保存ボタンで保存
MoeGoe_GUIに更新が来ています
v3.0.2
novelaiのディスコを間借りしてチャンネル作ってもらった
https://discord.gg/fMrgTQbxe8
[JA]保守[JA] ちょっと前に見たけど皆口裕子いなかったんだよなぁ
早く追加してくれ
Gigazineの記事
文字を入力するだけで「萌え声」を簡単一発生成してくれる「Moe TTS」
https://gigazine.net/news/20221114-moe-tts/ エモーションの場合は前処理でボイスデータをwavから変換する作業が発生するみたいで処理にすげー時間かかるのな
大量キャラをモデルにするタイプは多分対応できんなこれ
ラブライブ全キャラデータセット
百度网盘からダウンロードできたので、ディスコで再配布中
llmodel.rar 755MB 日本国内はともかく各国配信版はもうこれでいいと思う
あっちの視聴者だって母国語でも日本のオリジナルに近い声で聞けた方が嬉しいやろ >>45
二次創作のセリフ読ませて匿名で投げる遊び >>1
女子アナでも
同じことできんかな🥺
某局の巨乳さんに
変態台詞を吐かせたい🥺 >>41
やってみたけどイントネーションがイマイチだなあ
これなら男が喋ったのを好みのキャラの声に変える方がいいけどそんなアプリやWebサービスないよな 今井麻美のボイス素材28000ファイル持ってるんだけど海外サイトならアップロードしても問題ないのか? 政府がWeb3とか言ってっから
こういうの中国に持っていかれんだわ 課金版使っててもGPUやメモリが過負荷なわけでもないのに、学習が止まる時があるのが謎だ
たまにBOT確認のチェックが出るけどあれのせいか? 194エポックでGPU上限に達した
12時間待ったらまた続きから出来るのん? pro版使ってるんだけどプレミアムのGPUに変更するとCUDAエラーになるのおま環なんだろうか >>57
学習の途中経過が自分のgoogleドライブに保存されてない?
別のセッションで始めた場合もそこから再開できるはず。
てか1000円課金した方がどう考えても快適だよ データセットは消滅するからまた設置せねばならんのか 途中保存で生成されるG.pthとconfig.jsonがあれば続きから可能
前処理やり直すの面堂ではあるけど 課金版とか学習とかさっぱり分からん
誰か解説サイト使ってくれ vtuberの声も特徴ありまくりだから
作ってみたいわ 前スレの日本語GUIを作ってる方にお願いがある
文章打ち込んで、Enter(何のキーでもいい)押したら
[JA]を入力、音声削除、音声再合成、音声再生って自動的にやってくれるように改造できないでしょうか… 実用レベルまで進化したらこれ使った個人制作エロゲー量産されそうだな
>>70
本页面提供的所有模型及其衍生物严禁商用!
请自行承担使用模型而造成的一切后果!
GitHub - CjangCjengh-TTSModels
https://github.com/CjangCjengh/TTSModels これ音声の合成楽しむならテキスト書き起こししないほうがいいんだろうか
テキスト書き起こしをすると合成で台詞が崩壊する気がする
逆にfilelistに音声情報だけ入力して空欄とかにしてると声だけ記録して変なクセがつかないような >>68
https://i.imgur.com/BOpRfXW.jpg
https://uploader.cc/s/70cjmoz8gmh6ge0g08uh6pkg32hhjv5d9pp1pn2qybe4g73vax74b8pqb6lorjo6.zip
画像のような状態(音声ファイル.wavまで入力済み)でチェックボックスにチェック入れた後にテキストボックスをフォーカスしてCtrl+→でJAを前後に追加して削除再合成再生まで行います
キーが妙なのはテキストボックスに影響が少ない範囲のキーが思い浮かばなかった(エンターとかだと漢字変換で再生しちゃうから)
rshiftにしようとしたら認識してくれなかったから
正直めっちゃ使いにくいし、本家がマルチタスクで裏にあるコマンドラインを打ってるだけって仕様上、間違った操作とか待ちのタイミングでタスクが残ったりする可能性があるから実用に耐えないかもしれない
個人的には使用は非推奨 新バージョンに合わせたKaiって↑と↓のショートカットだったり、パラメータの数値デフォルト変更の要素なくなってる?
タコ規制でスレが建てられないです
★6が落ちたら誰か次スレを建てて、ディスコで報告して下さい >>74
ごめんそんなの追加したこと自体普通に忘れてわw後でやっとく ipaって読み上げ出来る?
('A', 'ei˥'),
('B', 'biː˥'),
('C', 'siː˥'),
('D', 'tiː˥'),
('E', 'iː˥'),
('F', 'e˥fuː˨˩'),
('G', 'tsiː˥'),
('H', 'ɪk̚˥tsʰyː˨˩'),
('I', 'ɐi˥'),
('J', 'tsei˥'),
('K', 'kʰei˥'),
('L', 'e˥llou˨˩'),
('M', 'ɛːm˥'),
('N', 'ɛːn˥'),
('O', 'ou˥'),
('P', 'pʰiː˥'),
('Q', 'kʰiːu˥'),
('R', 'aː˥lou˨˩'),
('S', 'ɛː˥siː˨˩'),
('T', 'tʰiː˥'),
('U', 'juː˥'),
('V', 'wiː˥'),
('W', 'tʊk̚˥piː˥juː˥'),
('X', 'ɪk̚˥siː˨˩'),
('Y', 'waːi˥'),
('Z', 'iː˨sɛːt̚˥') >>76
あんま変わらん気がする
ぼちぼち学習されて作ってる人増えてきてそうだし学習面の情報共有したい
っ とか 混ぜるのよくないんだろうか エロじゃなきゃ意味ないよ
数年前はYou Tube隠語エロamsr上がってたよな https://uploader.cc/s/rnt23lz3jv3bn9rygir7d8hlc98wlyir7sw8dn18ijkwo48bnnvefnwse2jltc5t.zip
MoeGoe_GUI改で忘れてた機能を復活
・デフォルトパラメーター設定テキスト
・Ctrl+↑↓でアクセント入力
・Ctrl+→で再生まで自動化(チェックボックスは無くしました。誤操作に注意)
・実験的お遊び機能追加
自分の声等の音声ファイルをHuBURT-VITSでルイズに変換した後、2800名モデルとかに音声変換機能
https://i.imgur.com/t3iRdQI.png
【必須】https://github.com/CjangCjengh/TTSModelsからHuBERT-VITSの3ファイルをDLして/models/Louise/フォルダに入れてね
・変換2回挟んでるんで遅いです
・/outputsフォルダにtmp.wavってファイルが出来るんでいらなくなったら手動で削除してね
・めっちゃクオリティ低いです※重要
https://uploader.cc/s/vntwtcup2ksoumpisvleqk0uclrxnhx810kxx4hv1olliu3tti3krh6mzvjt8ify.mp4 /wavs/〇〇/001.wav|
これを自動で入力してくれるソフトとか無いの?
レスは出来ますが
タコ規制でスレが建てられないです
★6が落ちた場合、誰か次スレを建てて下さい 同人漫画読みながらそのキャラ声優の声で再生させるの
>>82
ID:45oajGYm0様へ
スレが落ちた時用に、嫌儲ディスコにも入ってほしいです
あとデータセットの再配布もしています
https://disboard.org/ja/server/313289774440120332 オンラインのエクセルでも使ったほうが楽な気がするよ >>82
これ使って自分の好きなAV女優の声を数秒毎に切りまくって学習させればいいの? >>96
これどこが変わったかってわかりますか?
実際に中身見たけどようわからん かなり頻繁に「商用利用は禁止だぞ」と釘を刺される
https://i.imgur.com/ZUYbeny.jpg
「我向(日本)网友们无数次发了"禁止商用"的警告」
(I have issued a warning of "no commercial use" to my netizens countless times.)
↓
Kagarino「不要在disite或者dmm之类看到同人作品用就好」
(Don't see the works of others in disite or dmm. Just use them.)
3063957986「正确的,只要发出了警告,如果再有人用出问题,就与您无关了」
(Correct, as long as a warning is issued, if anyone uses it again, it has nothing to do with you.) >>97
まずファイルの更新日付が2日前だから更新されてないと思うよ >>1
これ進化したら声優いなくなるよな
んでこれからはボカロPみたいな奴がアニメの声をAI調整する時代に これってトレーニングの方法tacotron以外でわかる人いる
>>100
ありがとうございます
>>102
ディスコで同じ話題出てます
再掲
嫌儲ディスコで再配布しているデータセット一覧
ラブライブ全キャラデータセット
LL全员语音模型
https://pan.baidu.com/s/1vHXah-GhzN31W6IkY6z6bQ
マギレコキャラ10人分のデータセット
VITS的魔法纪录10人模型 - 百度网盘
https://pan.baidu.com/s/1ieZ9bisRPb6k7Nl-AH3hBg
ウマ娘キャラ4人分のデータセット
トウカイテイオー
ハルウララ
マチカネフクキタル
マチカネタンホイザ
帝宝乌拉拉福来诗宝四人模型 -百度网盘
https://pan.baidu.com/s/1RsC-3WJfbv3pn7egGepcMA
プリコネなかよし部データセット
好朋友部三人模型 - 百度网盘
https://pan.baidu.com/s/1A20m3NtIsxj_bjnU_6UlXw
百度网盘(Baidu Drive)版のデータセットは全て消滅しています 1回作ったモデルに追加は多分できないんじゃないかな
自作してて試したけど数が一致しないとかエラー出たわ
できるならやりたいけども
>>107
"包含2890名动画角色的VITS语音合成模型"接下来,你们有角色模型追加计划吗?难道,为止2890名就完成呵?
"VITS speech synthesis model with 2890 animated characters" next, do you have an additional plan for the character model? Is it possible that the 2890 places have been completed so far?
Please answer the question.
https://i.imgur.com/xbRGyej.jpg
https://i.imgur.com/9BLgZxr.jpg
この質問への回答↓
估计也不会加了
It is estimated that it will not be added.
想用别的数据覆盖到所有音,初步运行100多次,音色还没有完全确定然后换成其他的会好一些吗
If you want to cover all the tones with other data, it will be better to run it for more than 100 times initially, but the timbre has not been completely determined and then replaced with other ones.
在没玩vits不是有个优鸭行步态的网页,那个语音更多
Without playing vits, there is not a web page with excellent duck gait, which has more voice.
此前把数据切了十几分,发现就是有一块不对各种报错,扔了就好了,想继续尝试下一步
Before that, I cut the data for more than ten points, and found that there was an incorrect piece of error. Just throw it away. I want to continue to try the next step.
vits自作モデル育ててる人が増えてきた ラブライブ全キャラにconfig.jsonなくない? >>117
muse_tricolor_b.jsonがそう >>118
llmodel.rarの中になくない? 鄧さん新しくラブライブのデータが公開されているのでダウンロードお願いします これ本気で完成度高いモデル作ろうと思ったら音声素材1000個は必要らしいな
>>122
URLどれ? >>125
絵描きAIみたいに生成した中で出来の良いやつを素材として再利用とかできないのかな
ラブライブ全キャラデータセットのjsonファイルが更新
ディスコで配布中
パスワード p2cn
LL全员语音模型
https://pan.baidu.com/s/1zFngR7uU9qc7HgXsj1p81Q 構図指示すればそれっぽいの描いてくれるソフトみたいに、声吹き込んだらそれと似た抑揚で読んでくれるのとかできそう
>>129
それmoe ttsでできるよ
ラブライブ全キャラデータセット
755MBrarの方更新きてた
多分これの中にあると思う
今ダウンロード中
終わったらディスコに上げます
パスワード mivq
LL全员语音模型 - 百度网盘(Baidu Drive)
https://pan.baidu.com/s/1jwvOmIvWjxFYR3EeQfjcdA voistockのリスト、まどかマギカの中に物語シリーズのキャラが混じってたりしてるのなんかムチャクチャだな そのラブライブのやつ声聞いたところそんなに回してなさそうな感じなんだけどな
MoegoeじゃなくてEmotionVitsで使う前提なのかもしれんが
>>131
zip解凍用パスワード
LLSIFAS ■ このスレッドは過去ログ倉庫に格納されています