githubで公開されている音声自動生成AI、日本のアニメキャラ2890名分の音声を学習素材に超速度で進化中★7 [386780362]

**鄧晟鉉** (HappyBirthday! ef4e-FINd) · 2022/11/20(日) 22:07:44.79

前スレ
githubで公開されている音声自動生成AI、日本のアニメキャラ2890名分の音声を学習素材に超速度で進化中★6
https://greta.5ch.net/test/read.cgi/poverty/1668689965/

2022/11/21(月) 18:47:17.15

エポック数上げたらよくなるのかな

2022/11/21(月) 18:49:27.72

3～10秒の音源が理想と見たが1秒未満の掛け声とかそういうのってカットしたほうがいいんだろうか

2022/11/21(月) 19:06:28.18

>>68
なるべく間に空白が入る音源もあまり入れないほうがいいらしい

2022/11/21(月) 19:57:52.54

>>69
トリミングして小分けするほうがいいか
でもそうなると短いボイスになってしまうな

**鄧晟鉉** (ﾜｯﾁｮｲ ef4e-FINd) · 2022/11/21(月) 20:52:25.08

モデル育ててる人は嫌儲ディスコにも進捗上げてほしい

2022/11/21(月) 21:03:04.00

上げました

2022/11/21(月) 21:10:22.71

これを綾波レイに喋らせろ

わたくしがですね、わたくしがですね、ホームページ、ホームページからですね、わたしが
森とっぅも学園のホームページに対してわたしが隠ぺいしようがないじゃないですか。
そういうイメージ操作はねえ、やめるべきですよ？そういうことをしてるからですね、
国民の信頼をうることが、みなさんはできないんです。これはっきりと申し上げてね、
はっきりと申し上げて、いいですか、で、
そういうですねえ、そういう、すいませんちょっと野次はやめていただけますか？たいせつなところなんですから。こういうですね、
こういうたいせつな議論をしているときに、
正確な議論をするべきなんですよ。で、そのなかでですね、そのなかで、この、お、えー、
先方がですね、家内の、あの、おー、ぅ、えー、名誉校長という、ホームページのページを
ですね、隠ぺいしたという言い方はですね、
これは取り消して、まず取り消して、え、っう、いっい、ぃ隠ぺいというものをですね
まずわたしに質問する前に、じゃあ取り消してください。何度も何度も断ったというのは
ですね、安倍晋三小学校について申し上げたわけであります。それと、隠ぺいというのは
ですね、これは失礼ですよ！で、あなたたちはすぐにそうやってレッテル貼りをしようとしている。この問題についてもですね、まるで、
まるでわたしが関与しているがごとくの、
ずーっとそういうですね、えーイメージ操作をこの予算委員会のテレビつきしつ（ママ）の
時間を使ってですね、えんえんと繰り返していますが、みなさんそれが得意だし、それしかないのかもしれない。それしか、ま、ないのかもしれませんが、隠ぺいというのはですね、
隠ぺいというのはー、隠ぺいというのは
じゃあ、わたくしが隠ぺいしたんですか？

2022/11/21(月) 22:58:10.71

２８９０名の奴消えたらしい
まあその前に落としてエロボイス量産してるけどね

2022/11/22(火) 01:24:10.59

ちょっと後回しにしてるとすぐモデル消えちゃうんだな

2022/11/22(火) 10:06:54.65

https://i.imgur.com/wTIIXXI.png
VitsでトレーニングさせてみるけどTacotron2と比べても圧倒的に学習に時間かかるなこれ
これであの中国訛なら正直骨折り損

2022/11/22(火) 10:28:19.41

凄いな
自分はまずbilibiliの動画引っ張ってきてプライベートでつべに上げて自動翻訳かけるところから始めないと…

2022/11/22(火) 10:36:49.10

ゼロベースからの学習だから、まず言葉の形成からってのがしんどい感じ
ある程度学習してあるところから始められたら音声覚えさせるだけでいけそうな気はするんだけど

2022/11/22(火) 10:41:21.99

>>76
Epoch数云々より音源足りてない状態で学習しても延々と訛りとれないよ
完全に訛り取るには最低でも500個以上は音源用意する必要ある

2022/11/22(火) 10:44:19.59

>>79
まじか350個（15分ほど）で試しにまわしてみたがデータセット追加せなならんな

2022/11/22(火) 10:53:33.34

>>80
プリコネのユニとか完成度の高いモデルは音源1000とか用意してるみたいだ
Epochは2000辺りでほぼノイズなくなるけど学習に30時間とかかかるね

2022/11/22(火) 10:57:03.55

colab proは買い切りのやつで十分？

2022/11/22(火) 11:07:05.71

今までNGで無理だったあんな声優やこんな声優の声でエロが作れるってこと？
素材全部AIなゲームが生まれるじゃん

2022/11/22(火) 12:45:12.24

音源の数が必要なのなら20秒の台詞をカットして分割とかで数作れるけど
どういう形がベストなんだろ

2022/11/22(火) 12:53:54.57

数作しか出演してないマイナー声優でも自分で作れます？

2022/11/22(火) 12:57:21.23

AVやエロゲのエロボイスを普通の素人系のエロボイスに置き換えたいんやが

2022/11/22(火) 12:57:45.67

いつ亡くなってもでえじょうぶだ

2022/11/22(火) 13:18:55.26

>>84
一世代前？のデータセット基準では２秒～6秒ぐらいらしい
3~4秒が一番適切らしい

2022/11/22(火) 13:23:09.68

>>88
10秒には納めようとしてたけどもうちょい切っていいわけか

2022/11/22(火) 16:30:08.82

BGMもない方がいいのかえ

2022/11/22(火) 16:46:04.35

絵のやつもそうだけど
こういうのって著作権的にどうなんだろうな。
元声を素材にしてイジっているなら問題ないのかね

2022/11/22(火) 16:55:40.72

一応アニメ音源とかから取るときは使いたい音声をある程度まとめてボーカルリムーバーAIに食わせてBGMカットしてるな
まあでも音源としては微妙だろうから極力そういうの入れないほうがいいんだろうけど

2022/11/22(火) 17:54:03.06

>>91
学習に使用するのもそこから生成するのも何の権利も侵害しないんだってさ
将来的に契約とか法律とか変わるかもしれないけど今のところ

**鄧晟鉉** (ﾜｯﾁｮｲ ef4e-RrTy) · 2022/11/22(火) 19:53:49.65

[JA]保守[JA]

2022/11/22(火) 21:21:20.16

Discordに入っても次の日にはBANされる
俺の日頃の行いが悪いんか？
メール認識はしている

**鄧晟鉉** (ﾜｯﾁｮｲ ef4e-RrTy) · 2022/11/22(火) 22:59:58.58

>>95
botから通知が来るはず
あとrecaptcha認証も必須

2022/11/23(水) 00:18:29.42

>>96
ヒントありがとうございます
botから通知が来る様子がないので暫く様子見ます

2022/11/23(水) 01:06:42.75

声優の音声データはSEなし版があるDLsiteの音声作品から集めてきたら精度上がりそう
でもSEなし版も同梱してるところ電撃G'zマガジンくらいで他にほとんどねえんだよな

2022/11/23(水) 01:08:15.72

BGM音声分離ツールとかである程度はいけそう

2022/11/23(水) 01:25:42.02

演じてない声優音声は意外と探すの大変なんだよね
オーディオコメンタリーの音声だけ切り取れたらいい感じに使えそうだけど多分本編音声も混ざるだろうから難しいか
ラジオMCとかが綺麗な音源で取れたらよさげか

2022/11/23(水) 01:52:42.33

一回公開されたものだし今度表に出て来た時はえぐい進化してる可能性あるな

2022/11/23(水) 03:30:36.30

スレ見るのめんどうでディスコしか見てなかったけど頭のいい人多くて嫌儲ってこんなすごいところだったんやなあ
ひさしぶりに知的好奇心で脳汁でてる

2022/11/23(水) 10:50:31.82

ディスコでキートン山田さんのモデルを公開しました

2022/11/23(水) 10:52:09.83

外人「HeyJAP！ナカニダサントイテってなんだい？」

2022/11/23(水) 10:52:30.19

鄧さん頑張ってるな

2022/11/23(水) 10:52:58.42

死んだ声優で作れよ・・・

2022/11/23(水) 10:53:44.70

声優の音声利用って金取られるから流行れば声優事務所の小遣い稼ぎ先か

2022/11/23(水) 10:56:00.10

商用にする場合大元の学習システムから作り直さないとダメじゃね
開発者も商用にするなって言ってるし

2022/11/23(水) 12:24:38.60

https://i.imgur.com/ipy4tok.mp4
学習システムはピッコマ？のエンジニアが作ったOSSだとおもうだで

2022/11/23(水) 13:07:00.70

MoeGoe自体ももう少し閉じる的なことディスコにあったけど
Colabのノートブックとかは自分のドライブにコピーしとけば安泰なのかな？

2022/11/23(水) 13:10:08.43

>>110
ColabのノートはGit経由でDLしてるだろうから安泰じゃないんじゃない？

2022/11/23(水) 13:27:58.10

フォークした奴って元の奴が消えても生きてる？

2022/11/23(水) 14:09:30.32

>>100
ニュース番組とかどうかなBGMのほぼないんじゃね
字幕もついてるし

2022/11/23(水) 14:15:47.61

>>110
一部ドライブからダウンロードしてるファイルもあるからptとか
それも保存してちょっと手直しは必要じゃね

2022/11/23(水) 14:20:26.57

げーマジか
そういやノートブックの途中でどっかからダウンロードはしてるな…そこが消えたらアウトなのか

**鄧晟鉉** (ﾜｯﾁｮｲ ef4e-RrTy) · 2022/11/23(水) 16:32:11.99

亀だが
>>57
音声自動生成AI「MoeGoe」スレ★8

これで行きます

**鄧晟鉉** (ﾜｯﾁｮｲ ef4e-FINd) · 2022/11/23(水) 21:02:24.44

[JA]保守[JA]