githubで公開されている音声自動生成AI、日本のアニメキャラ2890名分の音声を学習素材に超速度で進化中★2 [386780362]

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-dYLF) · 2022/11/05(土) 21:32:41.32

githubで公開されている音声自動生成AI、日本のアニメキャラ2890名分の音声を学習素材に超速度で進化中
https://www.youtube.com/watch?v=aoq97CT0MUs

各キャラごとの声質に寄せつつ、日本語以外にも英語中国語韓国語で音声を生成することも可能なようだ

https://i.imgur.com/xvOmV0y.png
https://i.imgur.com/1nHgIjd.png
https://i.imgur.com/yvYkW6E.png
https://i.imgur.com/S9FjVrm.png
https://i.imgur.com/KgZo70z.png
https://i.imgur.com/kINKEVU.png

包含2890名动画角色的VITS语音合成模型
https://www.bilibili.com/video/BV1P8411Y7v5/

前スレ
githubで公開されている音声自動生成AI、日本のアニメキャラ2890名分の音声を学習素材に超速度で進化中
https://greta.5ch.net/test/read.cgi/poverty/1667389094/

2022/11/06(日) 19:11:23.57

C:直下ではどう？

2022/11/06(日) 19:24:47.44

一度エラー出ると再起しなきゃいけないのっておま環？
なかなかめんどい

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-KQvO) · 2022/11/06(日) 19:26:02.79

ダメだね

2022/11/06(日) 19:26:23.78

AIのエロ絵と同じでエロボイスも行けるんか？？？

2022/11/06(日) 19:36:21.28

ちょっとわかんねェ

2022/11/06(日) 19:36:51.53

アニメ化してないマンガやラノベの台詞を読ませるのが楽しい

2022/11/06(日) 19:40:25.85

東山さんのボイスデータは無いの？

2022/11/06(日) 19:49:00.86

あるよ

2022/11/06(日) 19:51:40.58

まじすか。どこすか

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-KQvO) · 2022/11/06(日) 20:09:01.08

MoeGoeダウンロードして
https://github.com/CjangCjengh/MoeGoe/releases/tag/v3.0.0
MoeGoe_GUIダウンロードして
https://github.com/CjangCjengh/MoeGoe_GUI/releases/tag/v3.0.0
ここのリンクからモデルとコンフィグファイルをセットでダウンロードして
https://github.com/CjangCjengh/TTSModels

MoeGoe_GUI.exeを起動、MoeGoe.exeの位置とモデル(模型pth)、コンフィグ(配置・json)を指定したら
文本に文章入れて正規表現に変換できたら下のプルダウンメニューからキャラ名選んで保存ボタンで保存

2022/11/06(日) 20:09:32.27

Vtuber版も作れそうだな
生配信やらボイスが豊富だしな

2022/11/06(日) 20:10:35.14

>>261
[JA]んっ...んっ...んっ...んっ...んっ...[JA]

キスしてるように聞こえるゾ

2022/11/06(日) 20:10:51.12

>>101
助かる🥺

2022/11/06(日) 20:14:18.19

第2弾
https://youtu.be/AikaJisOAMc

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-KQvO) · 2022/11/06(日) 20:17:52.71

非常に申し訳ないが
誰か
moegoe起動してモデルとコンフィグファイルをセットして話して選んで保存押すところまで動画で撮ってあげてくれないか？

2022/11/06(日) 20:25:15.40

はい
https://youtu.be/dieXP_fRlSI

2022/11/06(日) 20:27:34.46

>>41
言うてこういうの使いたがるの倫理観無視の同人とか個人制作の動画とかだろ
別に読み上げるだけなら専用のソフト使えばいいだけだし

2022/11/06(日) 20:33:48.66

日本語喋らせると中国訛りが激しいのは中国語のイントネーションを優先してるのか

2022/11/06(日) 20:35:44.01

イントネーションをいじれるソフトてないんけ？

2022/11/06(日) 20:39:00.58

>>271
第一弾のうるさいですねえの面倒くさそうな感じってどうやって車べせた？
不愉快そうな感じが難しい

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-KQvO) · 2022/11/06(日) 20:42:36.90

保存するときのexplorerの画面の下の方の

ファイルの種類(T) 音频文件(*wav)

これがワシの環境だと何故か表示されないみたい
(*wav)の表示がない

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-KQvO) · 2022/11/06(日) 20:47:42.27

拡張子の選択肢に.wavが出てこない
https://i.imgur.com/j87v15c.png

2022/11/06(日) 21:13:14.49

パラメータ設定をいじって、どうぞ

MURと化したしんちゃん
https://uploader.cc/s/59q551o4qlwwl5hk24ygvojpnmi8m0ioctvn7qlbkpq2i3m94dlnl5i46okp2ljf.wav

2022/11/06(日) 21:14:40.60

シンボリック入力を駆使すればなんとかなりそう？

[JA]そ-う-だ-よ-...[JA]
[JA]おまえ、さっきおらきがえてるときちらちらみてただろ、うそつけぜったいみてたぞ[JA]
[JA]みたけりゃみせてやるよ[JA]

2022/11/06(日) 21:26:40.09

やっぱりこういうのは権利関係の常識や良心が無いチャイナが強いわ

2022/11/06(日) 21:27:19.79

>>271
ルフィ違和感なくて草

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-KQvO) · 2022/11/06(日) 21:30:26.57

嫌儲ディスコのAI板でbaiduのウマ娘・プリコネ・マギレコデータセット持ってる方がいらしたので
再配布するそうです

2022/11/06(日) 21:36:56.69

>>277
うるさいですねは既にある音源
https://www.youtube.com/watch?v=icfrL7jdWfU

2022/11/06(日) 21:45:38.06

>>284
2980人の方にウマ娘いるけど何か違うの？

2022/11/06(日) 21:46:45.83

>>285
なんだそうだったのか
あんな流暢に出せるのかと思ったわ

2022/11/06(日) 21:47:08.42

［JA］いれてもじぇーえーって読み上げるだけなんだがなんでなん(・x・)

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-KQvO) · 2022/11/06(日) 21:48:16.25

カッコを全角でやるからじゃない？
[JA]

2022/11/06(日) 21:49:07.06

第3弾
https://youtu.be/fZj0L3KwPvM

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-KQvO) · 2022/11/06(日) 21:49:13.47

>>286
作った人が違う
少人数分のモデルデータのほうが品質が高いようだ

2022/11/06(日) 21:54:03.21

半角だけどなぁ
>>281のやつコピペしてもじぇーえー読み上げる

2022/11/06(日) 22:00:43.25

>>291
なるほどサンクス

2022/11/06(日) 22:05:18.05

>>292
なんでかわからんけどToLOVEるとルイズの方はJAなしで日本語いけるけど2980人の方はJAないとだめだった

2022/11/06(日) 22:05:20.06

>>290
イントネーションがどうしても中国語風になっちゃうね

2022/11/06(日) 22:07:51.09

>>294
なるほど先駆す

2022/11/06(日) 22:14:41.65

日本語設定しかないのは[JA]いれても意味ないんじゃないかい？

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-KQvO) · 2022/11/06(日) 22:35:31.94

この動画のとおりにやってみて
https://www.bilibili.com/video/BV1P8411Y7v5/

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-KQvO) · 2022/11/06(日) 23:02:10.21

/N/ は撥音（「ん」）
/Q/ は促音（「っ」）
長音は -
↑ ↓ でアクセント

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-KQvO) · 2022/11/06(日) 23:02:22.85

寝る
また明日

2022/11/07(月) 04:26:46.61

あやねるのDeepfakeが完全体になって出てきそう

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-KQvO) · 2022/11/07(月) 05:25:18.78

★保守★

2022/11/07(月) 06:07:46.86

>>195
reCAPTCHAの認証がそもそも出ないんだよね
DMで送られてくるだろ

2022/11/07(月) 06:10:06.44

パーフェクト安倍晋三作れ

2022/11/07(月) 06:13:06.93

中華訛りは時々変だところで声が高くなるのが特徴か

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-KQvO) · 2022/11/07(月) 06:17:14.76

>>303
アプリからやってみて

2022/11/07(月) 06:17:22.41

>>279
それ初めて見た
ちなワイは[JA]あほ[JA]で文字を囲んでも、
そのあと声を選んでから変換？で　a↑ho　とかなるはずだが、そいつができないでいる
[clear]になる
■■ズ単体のではできたのに2000人のができないから何か問題あるので歯とは思うが
.pthと.jsonは一緒のフォルダに入れておかないとあかんのかなぁ

2022/11/07(月) 06:20:08.48

これ生成時CPU使ってるのかな？
AIイラスト生成でグラボ買い替えたけどCPUも買い替えた方が良さそう

2022/11/07(月) 06:53:26.26

ちなみにtor使ってる！分割でテスト中！（イキッ
の奴さ、yelpとかいうやつ
それやると無能な働き者が分割ファイルにミスがあったりであとで修正あとで修正の繰り返しになってクソ時間ドブになるから
やらんでいいで

2022/11/07(月) 08:06:44.19

分割はまぁいいや

それよりも、清理文本から清理を押すと
操作可能なプログラムまたはバッチファイルとして認識されませんになるんだよな
清理本文を押さなくても保存はできるのはわかったが、
402のは[JA]いれても入れなくても保存ができない
というか入れないときは右側にエラーコード吐くな
全バージョン試すのは面倒だ
やめだやめだ

2022/11/07(月) 08:12:35.21

ディスコでウマ頂いたけどこっちの方が全然再現度高いね

2022/11/07(月) 08:21:26.39

>>310
無能はお前だったな

2022/11/07(月) 08:25:24.08

>>312
本人きちゃった感じですか？
ワイは自分を有能なんて一言も書いてないけどなぁ
無能ワイちゃんやで
それとワイが他の奴を無能呼ばわりするとは話は別や
これ、詭弁やで
ワイには詭弁はきかんよーｗｗｗｗｗｗｗｗｗｗｗｗ

2022/11/07(月) 08:38:41.18

繰り返しておくと、無駄に分割すると
今度は結合の仕方が分かりませんとかいう輩が出てくるのがまず１つと、
調子乗ってアップするも抜けがあったりそのまま音信普通だったり待たせようとする輩が出てくる
むしろこれらのせいで効率性が下がる、ワイらの時間は有限なんやで
しかもいま一般的に普及している回線速度から考えてもそこまでする必要性はない

2022/11/07(月) 09:01:42.75

ちゃ・ちゅ・ちょは音素でどう表現しますか

2022/11/07(月) 09:03:09.93

本物のVチューバーが誕生するのか

2022/11/07(月) 09:18:36.36

シンボリックってどうやって使うんだ
プロのひと教えて

2022/11/07(月) 09:53:25.78

第4弾
https://youtu.be/KCvokPNAoLo

2022/11/07(月) 09:54:08.79

>>317
とりあえず記号を入れまくって聞きまくるしかない

2022/11/07(月) 11:47:44.52

読んでくれなくはないけど
濁音とか半濁音の認識が低い気がする

2022/11/07(月) 12:06:19.98

https://uploader.cc/s/jo6xo1258p9h7aq8ajqo0bfhcrpptw2pndes7tmdm0mxcubxaehrxf294w3bvenf.wav
よくわからんから上下だけで作ってみた
罪悪感すごいわ
しょせんAIなんだけど、もう変なことは言わせないようにしよう

2022/11/07(月) 12:29:53.22

イントネーションおかしいからテキストからの合成は諦めて、同人音声をボイスチェンジャーしてみようと思ったら、これ元音声の声優もリスト内から選ぶ必要あるのか

2022/11/07(月) 12:32:48.59

>>321
俺は本名を名乗らせてからエロいことばかり言わせて爆笑してるわw
うｐしたら訴えられそう

2022/11/07(月) 12:42:49.44

オスマン青野さんじゃなくて島田さんなのか
ブロリーMADには使えそうだけど

2022/11/07(月) 13:52:18.05

>>322
これ自分の声の録音からでもやらせてほしいよな
どうにかしたらできないのかな

2022/11/07(月) 15:47:38.21

https://uploader.cc/s/jnnz8cvnq4zmmy9zm05b7mllbo7ypwfjwcd6tlsh3mvzd7d6hvpcld0lp9cyruhs.wav
マ、ママーッ!!

2022/11/07(月) 17:45:00.40

保守🌟

2022/11/07(月) 18:56:58.48

まぁ人間がやる物まねも学習だからね

2022/11/07(月) 19:11:28.76

早く種ちゃんボイスをブラウザ上で遊べるようにして

2022/11/07(月) 19:16:42.28

せっかくの素晴らしい技術なのにえっちなセリフ作るセンスがなかった

2022/11/07(月) 19:20:45.73

え？どういうこと？
シンギュラリティはじまったってこと？

2022/11/07(月) 19:20:54.39

昔、嫁コレって架空の設定で版権キャラとイチャイチャできるボイスを聴けるアプリがあって結構費やしてたんだが
同じようなことを自作でできるの素晴らしいよ

2022/11/07(月) 19:26:26.97

>>332
保存してた膨大なデータが生かせるのか
じょしらくのボイス欲しいんだよなあ

2022/11/07(月) 19:28:35.39

>>330
パラメータを上から
1.0
0.2
0.2
くらいにすると作りやすい
記号らしきものを挟むと色々捗るけど説明が殆どないので試行錯誤が必要

2022/11/07(月) 19:30:50.48

>>333
じょしらくは持ってなかった気がするけどサ終する前に持ってたキャラのボイスデータは抽出してこっそり保存してるから追加学習とか自前でできるんなら再利用したいわ

2022/11/07(月) 19:33:04.54

>>325
ここのsoft VCは？
https://huggingface.co/spaces/skytnt/moe-tts

2022/11/07(月) 19:34:40.93

野沢雅子死んでもでぇじょうぶだな

2022/11/07(月) 19:41:51.02

エロボイス作り放題な上にシチュエーションも自由だから
マジで抜ける、中国っぽい感じをどう隠せるかがコツかな？

2022/11/07(月) 19:50:39.58

マジで第一の難所は恥ずかしさだな
誰かに見られてるわけでもないけど変なセリフを入力するのは結構恥ずかしい

2022/11/07(月) 20:02:12.07

記号使ったら文章内で急に読む速度が速くなったりするのとかも防げたりするん？

2022/11/07(月) 20:04:34.66

>>338
イントネーション中国人ぽい単語の一字をひらがな→カタカナにしたり漢字にしたりするとよくなる場合あるで

2022/11/07(月) 20:11:27.69

>>340
この文字言えてないなと思ったら↑とか↓でアクセントつけるかな

2022/11/07(月) 20:16:10.30

アクセント指定しても効果ない気がする

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-KQvO) · 2022/11/07(月) 20:22:21.08

これ有効活用できない？

('A', 'ei˥'),
('B', 'biː˥'),
('C', 'siː˥'),
('D', 'tiː˥'),
('E', 'iː˥'),
('F', 'e˥fuː˨˩'),
('G', 'tsiː˥'),
('H', 'ɪk̚˥tsʰyː˨˩'),
('I', 'ɐi˥'),
('J', 'tsei˥'),
('K', 'kʰei˥'),
('L', 'e˥llou˨˩'),
('M', 'ɛːm˥'),
('N', 'ɛːn˥'),
('O', 'ou˥'),
('P', 'pʰiː˥'),
('Q', 'kʰiːu˥'),
('R', 'aː˥lou˨˩'),
('S', 'ɛː˥siː˨˩'),
('T', 'tʰiː˥'),
('U', 'juː˥'),
('V', 'wiː˥'),
('W', 'tʊk̚˥piː˥juː˥'),
('X', 'ɪk̚˥siː˨˩'),
('Y', 'waːi˥'),
('Z', 'iː˨sɛːt̚˥')

2022/11/07(月) 20:23:41.34

実際の声優の声まんまだと問題になりそうだけど
声ちょっといじったらどうしようもなくね？

2022/11/07(月) 20:32:38.04

>>345
ワイも、出力ちょっと弄ればいいのに、と思ったけど
AI絵のようにそれっぽい別物を作りたいんじゃなくて、
オタクたちは「あの人のあの声」「そのもの」が欲しいんだろうな

この辺、AI絵師の流れとちょっと違うな

2022/11/07(月) 20:41:39.68

パラメータの上は言う速度（上げれば上げるほど遅くなる）
真ん中と下は下げれば下げるほどピッチの上がり下がりが低くなる
（低くし過ぎると謎の電子音が出たりする、中国感がなくなる？）

2022/11/07(月) 20:50:39.42

うーん

2022/11/07(月) 21:00:18.56

自分は1.0と0.5と0.01をベースでやってる

2022/11/07(月) 21:25:51.29

ボイロボイボみたく簡単に調整出来る様になればいいのにな

2022/11/07(月) 21:32:19.60

GUI版、保存前にプレビュー出来るとええんだけどな

2022/11/07(月) 21:33:33.32

↑↓～以外のシンボリックの使い方誰かわかる？
変化が感じ取れない

2022/11/07(月) 21:40:04.07

>>351
一度は保存するけど、微調整はテキスト編集後に左下の再生成した後に再生でプレビューできない？気に入らんかったら削除ボタン押せば残らんし。

2022/11/07(月) 21:57:30.42

>>352
「.」は言葉を区切る、連続で使用可能
「-」はゆっくり言うのに適している　　例：「だ-い-す-き」
「!」は強調して言う、「?」は疑問符、「!?」のようにすれば驚く感じに
前のレスであったけど、カタカナに変えるのも効果アリ？

でもまだ細かい所は分からない、１文字ずつ音程とかを変えるやつがないので難しい
毎回ちょっと音声の出し方が違うので現状ガチャりつつ調整するしかない？

2022/11/07(月) 22:40:45.83

音程調節機能と特定の部分だけ再生成する機能ほしいよなぁ

2022/11/07(月) 22:44:27.39

AIはともかくMoeGoeはまだ手加えられる要素多そうではある

2022/11/08(火) 02:46:48.44

水瀬いのりとか特徴ある声はほぼ完璧やね
少女終末旅行のチトを再現できてる

2022/11/08(火) 03:43:49.50

セックスしてもいいのは一つだけ！のアレ
https://uploader.cc/s/mf1u664qhg9lkllfql7ltrwcd96s3ystl3kq8k8fx0d18zqss62mr3ibjm4r6td6.wav
https://uploader.cc/s/sofpr2rf1zw0kshmt0x8jphf042ou2bp1sgd8dd2648sg3nql71mpno3vcp7jvto.wav
https://uploader.cc/s/5k0sczklkbmstph6mfrw0m9uluo2c81bs2vfc5n3gj1urs2evie4qae9rxcn0iei.wav
https://uploader.cc/s/y5jiyd7yin2080qmpvbvf0g1cm9mumh3ee94snruajikfsts9ws1h4jh3f4q13qb.wav