githubで公開されている音声自動生成AI、日本のアニメキャラ2890名分の音声を学習素材に超速度で進化中★7 [386780362]

■ このスレッドは過去ログ倉庫に格納されています
0001ケ 晟鉉 (HappyBirthday! ef4e-FINd)2022/11/20(日) 22:07:44.79ID:O3hTz2Sw0HAPPY●?2BP(2000)

前スレ
githubで公開されている音声自動生成AI、日本のアニメキャラ2890名分の音声を学習素材に超速度で進化中★6
https://greta.5ch.net/test/read.cgi/poverty/1668689965/

0067番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ a234-Nwcx)2022/11/21(月) 18:47:17.15ID:VfO/dT1/0
エポック数上げたらよくなるのかな

3~10秒の音源が理想と見たが1秒未満の掛け声とかそういうのってカットしたほうがいいんだろうか

>>68
なるべく間に空白が入る音源もあまり入れないほうがいいらしい

>>69
トリミングして小分けするほうがいいか
でもそうなると短いボイスになってしまうな

0071ケ 晟鉉 (ワッチョイ ef4e-FINd)2022/11/21(月) 20:52:25.08ID:oyhQLKw30?2BP(1000)

モデル育ててる人は嫌儲ディスコにも進捗上げてほしい

0072番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ a234-Nwcx)2022/11/21(月) 21:03:04.00ID:VfO/dT1/0
上げました

0073番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ a7c9-stRS)2022/11/21(月) 21:10:22.71ID:esUK5fPL0
これを綾波レイに喋らせろ


わたくしがですね、わたくしがですね、ホームページ、ホームページからですね、 わたしが
森とっぅも学園のホームページに対してわたしが隠ぺいしようがないじゃないですか。
そういうイメージ操作はねえ、やめるべきですよ? そういうことをしてるからですね、
国民の信頼をうることが、みなさんはできないんです。 これはっきりと申し上げてね、
はっきりと申し上げて、いいですか、で、
そういうですねえ、 そういう、すいませんちょっと野次はやめていただけますか? たいせつなところなんですから。 こういうですね、
こういうたいせつな議論をしているときに、
正確な議論をするべきなんですよ。 で、そのなかでですね、そのなかで、この、お、えー、
先方がですね、家内の、あの、おー、 ぅ、えー、名誉校長という、ホームページのページを
ですね、隠ぺいしたという言い方はですね、
これは取り消して、まず取り消して、え、っう、いっい、ぃ隠ぺいというものをですね
まずわたしに質問する前に、じゃあ取り消してください。 何度も何度も断ったというのは
ですね、安倍晋三小学校について申し上げたわけであります。 それと、隠ぺいというのは
ですね、これは失礼ですよ! で、あなたたちはすぐにそうやってレッテル貼りをしようとしている。 この問題についてもですね、まるで、
まるでわたしが関与しているがごとくの、
ずーっとそういうですね、 えーイメージ操作をこの予算委員会のテレビつきしつ(ママ)の
時間を使ってですね、 えんえんと繰り返していますが、みなさんそれが得意だし、それしかないのかもしれない。 それしか、ま、ないのかもしれませんが、隠ぺいというのはですね、
隠ぺいというのはー、 隠ぺいというのは
じゃあ、わたくしが隠ぺいしたんですか?

2890名の奴消えたらしい
まあその前に落としてエロボイス量産してるけどね

ちょっと後回しにしてるとすぐモデル消えちゃうんだな

0076番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ 623b-TaOI)2022/11/22(火) 10:06:54.65ID:RWcvY1I90
https://i.imgur.com/wTIIXXI.png
VitsでトレーニングさせてみるけどTacotron2と比べても圧倒的に学習に時間かかるなこれ
これであの中国訛なら正直骨折り損

凄いな
自分はまずbilibiliの動画引っ張ってきてプライベートでつべに上げて自動翻訳かけるところから始めないと…

ゼロベースからの学習だから、まず言葉の形成からってのがしんどい感じ
ある程度学習してあるところから始められたら音声覚えさせるだけでいけそうな気はするんだけど

>>76
Epoch数云々より音源足りてない状態で学習しても延々と訛りとれないよ
完全に訛り取るには最低でも500個以上は音源用意する必要ある

0080番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ 623b-TaOI)2022/11/22(火) 10:44:19.59ID:RWcvY1I90
>>79
まじか350個(15分ほど)で試しにまわしてみたがデータセット追加せなならんな

>>80
プリコネのユニとか完成度の高いモデルは音源1000とか用意してるみたいだ
Epochは2000辺りでほぼノイズなくなるけど学習に30時間とかかかるね

0082番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ a234-Nwcx)2022/11/22(火) 10:57:03.55ID:8EP7ukC30
colab proは買い切りのやつで十分?

今までNGで無理だったあんな声優やこんな声優の声でエロが作れるってこと?
素材全部AIなゲームが生まれるじゃん

音源の数が必要なのなら20秒の台詞をカットして分割とかで数作れるけど
どういう形がベストなんだろ

0085番組の途中ですがアフィサイトへの転載は禁止です (ベーイモ MM9e-stRS)2022/11/22(火) 12:53:54.57ID:cG0fXWv1M
数作しか出演してないマイナー声優でも自分で作れます?

0086番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ 3b05-zHbW)2022/11/22(火) 12:57:21.23ID:JP41W18i0
AVやエロゲのエロボイスを普通の素人系のエロボイスに置き換えたいんやが

0087番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ 42d1-stRS)2022/11/22(火) 12:57:45.67ID:46UaW2R10
いつ亡くなってもでえじょうぶだ

0088番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ 623b-TaOI)2022/11/22(火) 13:18:55.26ID:RWcvY1I90
>>84
一世代前?のデータセット基準では2秒~6秒ぐらいらしい
3~4秒が一番適切らしい

>>88
10秒には納めようとしてたけどもうちょい切っていいわけか

0090番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ a234-Nwcx)2022/11/22(火) 16:30:08.82ID:8EP7ukC30
BGMもない方がいいのかえ

絵のやつもそうだけど
こういうのって著作権的にどうなんだろうな。
元声を素材にしてイジっているなら問題ないのかね

一応アニメ音源とかから取るときは使いたい音声をある程度まとめてボーカルリムーバーAIに食わせてBGMカットしてるな
まあでも音源としては微妙だろうから極力そういうの入れないほうがいいんだろうけど

>>91
学習に使用するのもそこから生成するのも何の権利も侵害しないんだってさ
将来的に契約とか法律とか変わるかもしれないけど今のところ

0094ケ 晟鉉 (ワッチョイ ef4e-RrTy)2022/11/22(火) 19:53:49.65ID:50LzigQJ0
[JA]保守[JA]

0095番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW 5205-grd7)2022/11/22(火) 21:21:20.16ID:Y6s8NVbg0
Discordに入っても次の日にはBANされる
俺の日頃の行いが悪いんか?
メール認識はしている

0096ケ 晟鉉 (ワッチョイ ef4e-RrTy)2022/11/22(火) 22:59:58.58ID:50LzigQJ0
>>95
botから通知が来るはず
あとrecaptcha認証も必須

0097番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW 5205-grd7)2022/11/23(水) 00:18:29.42ID:rW6J9snj0
>>96
ヒントありがとうございます
botから通知が来る様子がないので暫く様子見ます

声優の音声データはSEなし版があるDLsiteの音声作品から集めてきたら精度上がりそう
でもSEなし版も同梱してるところ電撃G'zマガジンくらいで他にほとんどねえんだよな

BGM音声分離ツールとかである程度はいけそう

演じてない声優音声は意外と探すの大変なんだよね
オーディオコメンタリーの音声だけ切り取れたらいい感じに使えそうだけど多分本編音声も混ざるだろうから難しいか
ラジオMCとかが綺麗な音源で取れたらよさげか

一回公開されたものだし今度表に出て来た時はえぐい進化してる可能性あるな

スレ見るのめんどうでディスコしか見てなかったけど頭のいい人多くて嫌儲ってこんなすごいところだったんやなあ
ひさしぶりに知的好奇心で脳汁でてる

0103番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ a234-Nwcx)2022/11/23(水) 10:50:31.82ID:mCf9cN5h0
ディスコでキートン山田さんのモデルを公開しました

0104番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW efde-BvMp)2022/11/23(水) 10:52:09.83ID:uBRlz4Xl0
外人「HeyJAP!ナカニダサントイテってなんだい?」

0105番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ 563a-0dwM)2022/11/23(水) 10:52:30.19ID:0Oq07ATd0
鄧さん頑張ってるな

死んだ声優で作れよ・・・

0107番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ 574e-stRS)2022/11/23(水) 10:53:44.70ID:HuAaqnjW0
声優の音声利用って金取られるから流行れば声優事務所の小遣い稼ぎ先か

商用にする場合大元の学習システムから作り直さないとダメじゃね
開発者も商用にするなって言ってるし

0109番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ 623b-TaOI)2022/11/23(水) 12:24:38.60ID:FfGIf19O0
https://i.imgur.com/ipy4tok.mp4
学習システムはピッコマ?のエンジニアが作ったOSSだとおもうだで

MoeGoe自体ももう少し閉じる的なことディスコにあったけど
Colabのノートブックとかは自分のドライブにコピーしとけば安泰なのかな?

0111番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ 623b-TaOI)2022/11/23(水) 13:10:08.43ID:FfGIf19O0
>>110
ColabのノートはGit経由でDLしてるだろうから安泰じゃないんじゃない?

フォークした奴って元の奴が消えても生きてる?

>>100
ニュース番組とかどうかなBGMのほぼないんじゃね
字幕もついてるし

>>110
一部ドライブからダウンロードしてるファイルもあるからptとか
それも保存してちょっと手直しは必要じゃね

げーマジか
そういやノートブックの途中でどっかからダウンロードはしてるな…そこが消えたらアウトなのか

0116ケ 晟鉉 (ワッチョイ ef4e-RrTy)2022/11/23(水) 16:32:11.99ID:kfkhJiZi0
亀だが
>>57
音声自動生成AI「MoeGoe」スレ★8

これで行きます

0117ケ 晟鉉 (ワッチョイ ef4e-FINd)2022/11/23(水) 21:02:24.44ID:kfkhJiZi0?2BP(1000)

[JA]保守[JA]

■ このスレッドは過去ログ倉庫に格納されています