githubで公開されている音声自動生成AI、日本のアニメキャラ2890名分の音声を学習素材に超速度で進化中★6 [386780362]
■ このスレッドは過去ログ倉庫に格納されています
前スレ
githubで公開されている音声自動生成AI、日本のアニメキャラ2890名分の音声を学習素材に超速度で進化中★5
https://greta.5ch.net/test/read.cgi/poverty/1668430601/
2890名分のデータセットの場所はこちら
GitHub - CjangCjengh-TTSModels
https://github.com/CjangCjengh/TTSModels#voistock
Japanese & English & Korean & Chinese
↓
Voistockの箇所
正式名称「VITS文本转语音生成模型」((Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech))
github
vits: Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech
https://github.com/jaywalnut310/vits
GitHub - innnky-vits-japanese- 端到端语音合成模型VITS,日语数据训练
https://github.com/innnky/vits-japanese
GitHub - Francis-Komizu-Sovits- An implementation of the combination of Soft-VC and VITS
https://github.com/Francis-Komizu/Sovits
GitHub - luoyily-MoeTTS- Speech synthesis model -inference GUI repo for galgame characters based on Tacotron2, Hifigan and VI
https://github.com/luoyily/MoeTTS
GitHub - Francis-Komizu-VITS- ACG Text-to-Speech
https://github.com/Francis-Komizu/VITS
VITS 语音合成完全端到端TTS的里程碑
https://blog.csdn.net/Terry_ZzZzZz/article/details/120458064
GitHub - CjangCjengh-MoeGoe- Executable file for VITS inference
https://github.com/CjangCjengh/MoeGoe
MoeGoe_GUI
https://github.com/CjangCjengh/MoeGoe_GUI
Moe TTS And Voice Conversion Using VITS Model
https://huggingface.co/spaces/skytnt/moe-tts
MoeGoeリリースノート
https://github.com/CjangCjengh/MoeGoe/releases
MoeGoe製作者のCjangCjengh氏
CjangCjengh
https://space.bilibili.com/35285881
moegoegui更新と感情控制模型の説明動画
2890人模型更新+使用方法介绍
https://www.bilibili.com/video/BV1mP4y1y7iU/ AIが自動生成するイラストが、数年で劇的に進化していて驚嘆「AIは既に私たちを超えている」「絵師が血ヘド吐く勢い」と話題に - Togetter
すげい…。
https://i.imgur.com/ioVi1fS.png
零基础炼丹秘籍 - 为自己喜爱的角色训练TTS(文字转语音)模型
TTS (text to speech) model for your favorite character
https://www.bilibili.com/read/mobile?id=17826415
デモページ
Audio Samples from "Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech"
https://jaywalnut310.github.io/vits-demo/index.html
VITS_TXT_to_Audio
https://github.com/alphanemeless/VITS_TXT_to_Audio
VITS长音声生成工具 为你的小说,添加AI配音吧!(可可萝老师讲解)
https://www.bilibili.com/video/BV11d4y1r7cT/
論文
用于端到端文本到语音的具有对抗学习的条件变分自动编码器(Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech)
https://arxiv.org/abs/2106.06103
論文の解説動画
论文分享会 | 用于端到端文本到语音的具有对抗学习的条件变分自编码器
https://www.bilibili.com/video/BV1QB4y1U7ZK/
喜怒哀楽による読み上げの変化をパラメータ化しツール化
VITS情感控制语音合成
解説動画
可控制情感的绫地宁宁语音合成!基于VITS模型
https://www.bilibili.com/video/BV1Vg411h7of/
GitHub - audeering-w2v2-how-to- How to use our public wav2vec2 dimensional emotion model
https://github.com/audeering/w2v2-how-to
VITS情感控制语音合成
https://github.com/innnky/emotional-vits
感情を数字で指定できる、参数がパラメータ、样本がカタログのこと
「使用情感样本id作为情感参数」→「情感样本ID」
デモページ
nene-emotion
https://huggingface.co/spaces/innnky/nene-emotion
〜MoeGoeの使い方〜
MoeGoeダウンロードして
https://github.com/CjangCjengh/MoeGoe/releases/tag/v3.0.0
MoeGoe_GUIダウンロードして
https://github.com/CjangCjengh/MoeGoe_GUI/releases/tag/v3.0.2
ここのリンクからモデルとコンフィグファイルをセットでダウンロードして
(Japanese & English & Korean & Chinese→Voistockの箇所)
GitHub - CjangCjengh-TTSModels
https://github.com/CjangCjengh/TTSModels#voistock
MoeGoe_GUI.exeを起動、MoeGoe.exeの位置とモデル(模型pth)、コンフィグ(配置・json)を指定したら
文本に文章入れて正規表現に変換できたら下のプルダウンメニューからキャラ名選んで保存ボタンで保存
MoeGoeリリースノート
https://github.com/CjangCjengh/MoeGoe/releases
MoeGoeのローカルWebアプリバージョン
WebApp_MoeGoe
https://github.com/tasrr/WebApp_MoeGoe
MoeGoe_GUI日本語版
https://uploader.cc/s/vnge4iqwvgv8aywn1ohlgnoy55w8aahy0cjut6c9nekdog9cdwhruejgrtirraqn.zip はやみんの声で喘がせてくれ
FE無双で喘いでるからその音声を参考にしてくれ
「vits 模型」で検索すれば配布されてるデータセットが結構出てくるが消えるのが早い、気になるデータセットがあれば早めにダウンロードしておいても良さそうだ
百度网盘(Baidu Cloud)からダウンロードするには百度垢が必須
百度アカウント開設方法↓
このアプリをインスコ後、国コードで日本を選んでSMS認証すれば完了
https://adersaytech.com/tech-event/how-to-register-baidu-account.html
↓のデータセットはまだダウンロード可能!!!!!!!!!!!!!!!!!!
ラブライブ全キャラデータセット
パスワード r5k0
LL全员语音模型
https://pan.baidu.com/s/1vHXah-GhzN31W6IkY6z6bQ
【【VITS】基于emotion-vits的LL全员语音模型】
https://www.bilibili.com/video/BV1jY411o7vv
Lovelive-VITS-JPZH Copied
https://huggingface.co/spaces/CarlDennis/Lovelive-VITS-JPZH ボイスコミック程度なら一人で制作できちゃいそうなのか? 可愛い声に読み上げさせてる生主いるけどそういうのに使えたりするのかな
【嫌儲ディスコで下記モデルデータ配布中】
荒らし対策として、サーバーのメンバーに登録してから10分以上経過していないアカウントはチャットの参加を弾いているので予めご了承ください
参加後自動で弾かれた場合、recaptcha認証とアカウントのメール認証ができているか確認して下さい
嫌儲DISCORD部 - DISBOARD-
https://disboard.org/ja/server/313289774440120332
マギレコキャラ10人分のデータセット
パスワード mgrc
VITS的魔法纪录10人模型 - 百度网盘
https://pan.baidu.com/s/1ieZ9bisRPb6k7Nl-AH3hBg?pwd=mgrc
基于VITS的魔法纪录10人模型
https://www.bilibili.com/video/BV1Ne4y1y7uT/
ウマ娘
トウカイテイオー
ハルウララ
マチカネフクキタル
マチカネタンホイザ
パスワード wzsq
帝宝乌拉拉福来诗宝四人模型 -百度网盘
https://pan.baidu.com/s/1RsC-3WJfbv3pn7egGepcMA?pwd=wzsq
プリコネなかよし部データセット
パスワード znzk
好朋友部三人模型 - 百度网盘
https://pan.baidu.com/s/1A20m3NtIsxj_bjnU_6UlXw?pwd=znzk
関連動画
プリコネキャラにごめゆいを言わせる動画、音声はすべて自動生成
【AI语音合成】用VITS给优衣说对不起 公主连接17人模型
https://www.bilibili.com/video/BV1S24y1d74C/
なかよし部に中国語で喋らせる動画
【语音合成】基于VITS的好朋友部三人语音合成模型
https://www.bilibili.com/video/BV1JD4y167sQ
ルイズに喋らせる動画
【AI语音合成/VITS】来感受随时可以被钉宫辱骂的快感吧!
https://www.bilibili.com/video/BV1BP411G7P8/
ウマ娘&原神の声色再現動画
【AI语音合成】赛马娘&原神的中日结合模型尝试
https://www.bilibili.com/video/BV1UG4y1W7Ji/
VITS文本转语音生成模型の解説動画
【AI语音合成】基于VITS模型的优妮先辈语音合成
https://www.bilibili.com/video/BV1jY4y1c7JF DLsiteで活躍してるネット声優が風俗落ちしてまうやん😭 初期ミクさんくらいカタコトでしょ?
それでもすごいけど
Voistock の config.json、最初の方の
text_cleaners:["cjke_cleaners2"],
を
text_cleaners:["japanese_cleaners2"],
に書き換えると[JA]が不要になる
ラブライブ全キャラデータセットダウンロードしてる
https://i.imgur.com/RHOf2zL.png
rarファイルってどうやって共有するの? ローカルで動かしたいんだけど導入方法解説してるサイトとかない?
>>32
〜MoeGoeの使い方〜
MoeGoeダウンロードして
https://github.com/CjangCjengh/MoeGoe/releases/tag/v3.0.0
MoeGoe_GUIダウンロードして
https://github.com/CjangCjengh/MoeGoe_GUI/releases/tag/v3.0.2
ここのリンクからモデルとコンフィグファイルをセットでダウンロードして
(Japanese & English & Korean & Chinese→Voistockの箇所)
GitHub - CjangCjengh-TTSModels
https://github.com/CjangCjengh/TTSModels#voistock
MoeGoe_GUI.exeを起動、MoeGoe.exeの位置とモデル(模型pth)、コンフィグ(配置・json)を指定したら
文本に文章入れて正規表現に変換できたら下のプルダウンメニューからキャラ名選んで保存ボタンで保存
MoeGoe_GUIに更新が来ています
v3.0.2
novelaiのディスコを間借りしてチャンネル作ってもらった
https://discord.gg/fMrgTQbxe8
[JA]保守[JA] ちょっと前に見たけど皆口裕子いなかったんだよなぁ
早く追加してくれ
Gigazineの記事
文字を入力するだけで「萌え声」を簡単一発生成してくれる「Moe TTS」
https://gigazine.net/news/20221114-moe-tts/ エモーションの場合は前処理でボイスデータをwavから変換する作業が発生するみたいで処理にすげー時間かかるのな
大量キャラをモデルにするタイプは多分対応できんなこれ
ラブライブ全キャラデータセット
百度网盘からダウンロードできたので、ディスコで再配布中
llmodel.rar 755MB 日本国内はともかく各国配信版はもうこれでいいと思う
あっちの視聴者だって母国語でも日本のオリジナルに近い声で聞けた方が嬉しいやろ >>45
二次創作のセリフ読ませて匿名で投げる遊び >>1
女子アナでも
同じことできんかな🥺
某局の巨乳さんに
変態台詞を吐かせたい🥺 >>41
やってみたけどイントネーションがイマイチだなあ
これなら男が喋ったのを好みのキャラの声に変える方がいいけどそんなアプリやWebサービスないよな 今井麻美のボイス素材28000ファイル持ってるんだけど海外サイトならアップロードしても問題ないのか? 政府がWeb3とか言ってっから
こういうの中国に持っていかれんだわ 課金版使っててもGPUやメモリが過負荷なわけでもないのに、学習が止まる時があるのが謎だ
たまにBOT確認のチェックが出るけどあれのせいか? 194エポックでGPU上限に達した
12時間待ったらまた続きから出来るのん? pro版使ってるんだけどプレミアムのGPUに変更するとCUDAエラーになるのおま環なんだろうか >>57
学習の途中経過が自分のgoogleドライブに保存されてない?
別のセッションで始めた場合もそこから再開できるはず。
てか1000円課金した方がどう考えても快適だよ データセットは消滅するからまた設置せねばならんのか 途中保存で生成されるG.pthとconfig.jsonがあれば続きから可能
前処理やり直すの面堂ではあるけど 課金版とか学習とかさっぱり分からん
誰か解説サイト使ってくれ vtuberの声も特徴ありまくりだから
作ってみたいわ 前スレの日本語GUIを作ってる方にお願いがある
文章打ち込んで、Enter(何のキーでもいい)押したら
[JA]を入力、音声削除、音声再合成、音声再生って自動的にやってくれるように改造できないでしょうか… 実用レベルまで進化したらこれ使った個人制作エロゲー量産されそうだな
>>70
本页面提供的所有模型及其衍生物严禁商用!
请自行承担使用模型而造成的一切后果!
GitHub - CjangCjengh-TTSModels
https://github.com/CjangCjengh/TTSModels これ音声の合成楽しむならテキスト書き起こししないほうがいいんだろうか
テキスト書き起こしをすると合成で台詞が崩壊する気がする
逆にfilelistに音声情報だけ入力して空欄とかにしてると声だけ記録して変なクセがつかないような >>68
https://i.imgur.com/BOpRfXW.jpg
https://uploader.cc/s/70cjmoz8gmh6ge0g08uh6pkg32hhjv5d9pp1pn2qybe4g73vax74b8pqb6lorjo6.zip
画像のような状態(音声ファイル.wavまで入力済み)でチェックボックスにチェック入れた後にテキストボックスをフォーカスしてCtrl+→でJAを前後に追加して削除再合成再生まで行います
キーが妙なのはテキストボックスに影響が少ない範囲のキーが思い浮かばなかった(エンターとかだと漢字変換で再生しちゃうから)
rshiftにしようとしたら認識してくれなかったから
正直めっちゃ使いにくいし、本家がマルチタスクで裏にあるコマンドラインを打ってるだけって仕様上、間違った操作とか待ちのタイミングでタスクが残ったりする可能性があるから実用に耐えないかもしれない
個人的には使用は非推奨 新バージョンに合わせたKaiって↑と↓のショートカットだったり、パラメータの数値デフォルト変更の要素なくなってる?
タコ規制でスレが建てられないです
★6が落ちたら誰か次スレを建てて、ディスコで報告して下さい >>74
ごめんそんなの追加したこと自体普通に忘れてわw後でやっとく ipaって読み上げ出来る?
('A', 'ei˥'),
('B', 'biː˥'),
('C', 'siː˥'),
('D', 'tiː˥'),
('E', 'iː˥'),
('F', 'e˥fuː˨˩'),
('G', 'tsiː˥'),
('H', 'ɪk̚˥tsʰyː˨˩'),
('I', 'ɐi˥'),
('J', 'tsei˥'),
('K', 'kʰei˥'),
('L', 'e˥llou˨˩'),
('M', 'ɛːm˥'),
('N', 'ɛːn˥'),
('O', 'ou˥'),
('P', 'pʰiː˥'),
('Q', 'kʰiːu˥'),
('R', 'aː˥lou˨˩'),
('S', 'ɛː˥siː˨˩'),
('T', 'tʰiː˥'),
('U', 'juː˥'),
('V', 'wiː˥'),
('W', 'tʊk̚˥piː˥juː˥'),
('X', 'ɪk̚˥siː˨˩'),
('Y', 'waːi˥'),
('Z', 'iː˨sɛːt̚˥') >>76
あんま変わらん気がする
ぼちぼち学習されて作ってる人増えてきてそうだし学習面の情報共有したい
っ とか 混ぜるのよくないんだろうか エロじゃなきゃ意味ないよ
数年前はYou Tube隠語エロamsr上がってたよな https://uploader.cc/s/rnt23lz3jv3bn9rygir7d8hlc98wlyir7sw8dn18ijkwo48bnnvefnwse2jltc5t.zip
MoeGoe_GUI改で忘れてた機能を復活
・デフォルトパラメーター設定テキスト
・Ctrl+↑↓でアクセント入力
・Ctrl+→で再生まで自動化(チェックボックスは無くしました。誤操作に注意)
・実験的お遊び機能追加
自分の声等の音声ファイルをHuBURT-VITSでルイズに変換した後、2800名モデルとかに音声変換機能
https://i.imgur.com/t3iRdQI.png
【必須】https://github.com/CjangCjengh/TTSModelsからHuBERT-VITSの3ファイルをDLして/models/Louise/フォルダに入れてね
・変換2回挟んでるんで遅いです
・/outputsフォルダにtmp.wavってファイルが出来るんでいらなくなったら手動で削除してね
・めっちゃクオリティ低いです※重要
https://uploader.cc/s/vntwtcup2ksoumpisvleqk0uclrxnhx810kxx4hv1olliu3tti3krh6mzvjt8ify.mp4 /wavs/〇〇/001.wav|
これを自動で入力してくれるソフトとか無いの? ■ このスレッドは過去ログ倉庫に格納されています