githubで公開されている音声自動生成AI、日本のアニメキャラ2890名分の音声を学習素材に超速度で進化中★7 [386780362]
■ このスレッドは過去ログ倉庫に格納されています
前スレ
githubで公開されている音声自動生成AI、日本のアニメキャラ2890名分の音声を学習素材に超速度で進化中★6
https://greta.5ch.net/test/read.cgi/poverty/1668689965/ 3~10秒の音源が理想と見たが1秒未満の掛け声とかそういうのってカットしたほうがいいんだろうか >>68
なるべく間に空白が入る音源もあまり入れないほうがいいらしい >>69
トリミングして小分けするほうがいいか
でもそうなると短いボイスになってしまうな
モデル育ててる人は嫌儲ディスコにも進捗上げてほしい これを綾波レイに喋らせろ
わたくしがですね、わたくしがですね、ホームページ、ホームページからですね、 わたしが
森とっぅも学園のホームページに対してわたしが隠ぺいしようがないじゃないですか。
そういうイメージ操作はねえ、やめるべきですよ? そういうことをしてるからですね、
国民の信頼をうることが、みなさんはできないんです。 これはっきりと申し上げてね、
はっきりと申し上げて、いいですか、で、
そういうですねえ、 そういう、すいませんちょっと野次はやめていただけますか? たいせつなところなんですから。 こういうですね、
こういうたいせつな議論をしているときに、
正確な議論をするべきなんですよ。 で、そのなかでですね、そのなかで、この、お、えー、
先方がですね、家内の、あの、おー、 ぅ、えー、名誉校長という、ホームページのページを
ですね、隠ぺいしたという言い方はですね、
これは取り消して、まず取り消して、え、っう、いっい、ぃ隠ぺいというものをですね
まずわたしに質問する前に、じゃあ取り消してください。 何度も何度も断ったというのは
ですね、安倍晋三小学校について申し上げたわけであります。 それと、隠ぺいというのは
ですね、これは失礼ですよ! で、あなたたちはすぐにそうやってレッテル貼りをしようとしている。 この問題についてもですね、まるで、
まるでわたしが関与しているがごとくの、
ずーっとそういうですね、 えーイメージ操作をこの予算委員会のテレビつきしつ(ママ)の
時間を使ってですね、 えんえんと繰り返していますが、みなさんそれが得意だし、それしかないのかもしれない。 それしか、ま、ないのかもしれませんが、隠ぺいというのはですね、
隠ぺいというのはー、 隠ぺいというのは
じゃあ、わたくしが隠ぺいしたんですか? 2890名の奴消えたらしい
まあその前に落としてエロボイス量産してるけどね ちょっと後回しにしてるとすぐモデル消えちゃうんだな https://i.imgur.com/wTIIXXI.png
VitsでトレーニングさせてみるけどTacotron2と比べても圧倒的に学習に時間かかるなこれ
これであの中国訛なら正直骨折り損 凄いな
自分はまずbilibiliの動画引っ張ってきてプライベートでつべに上げて自動翻訳かけるところから始めないと… ゼロベースからの学習だから、まず言葉の形成からってのがしんどい感じ
ある程度学習してあるところから始められたら音声覚えさせるだけでいけそうな気はするんだけど >>76
Epoch数云々より音源足りてない状態で学習しても延々と訛りとれないよ
完全に訛り取るには最低でも500個以上は音源用意する必要ある >>79
まじか350個(15分ほど)で試しにまわしてみたがデータセット追加せなならんな >>80
プリコネのユニとか完成度の高いモデルは音源1000とか用意してるみたいだ
Epochは2000辺りでほぼノイズなくなるけど学習に30時間とかかかるね 今までNGで無理だったあんな声優やこんな声優の声でエロが作れるってこと?
素材全部AIなゲームが生まれるじゃん 音源の数が必要なのなら20秒の台詞をカットして分割とかで数作れるけど
どういう形がベストなんだろ 数作しか出演してないマイナー声優でも自分で作れます? AVやエロゲのエロボイスを普通の素人系のエロボイスに置き換えたいんやが >>84
一世代前?のデータセット基準では2秒~6秒ぐらいらしい
3~4秒が一番適切らしい >>88
10秒には納めようとしてたけどもうちょい切っていいわけか 絵のやつもそうだけど
こういうのって著作権的にどうなんだろうな。
元声を素材にしてイジっているなら問題ないのかね 一応アニメ音源とかから取るときは使いたい音声をある程度まとめてボーカルリムーバーAIに食わせてBGMカットしてるな
まあでも音源としては微妙だろうから極力そういうの入れないほうがいいんだろうけど >>91
学習に使用するのもそこから生成するのも何の権利も侵害しないんだってさ
将来的に契約とか法律とか変わるかもしれないけど今のところ Discordに入っても次の日にはBANされる
俺の日頃の行いが悪いんか?
メール認識はしている >>95
botから通知が来るはず
あとrecaptcha認証も必須 >>96
ヒントありがとうございます
botから通知が来る様子がないので暫く様子見ます 声優の音声データはSEなし版があるDLsiteの音声作品から集めてきたら精度上がりそう
でもSEなし版も同梱してるところ電撃G'zマガジンくらいで他にほとんどねえんだよな 演じてない声優音声は意外と探すの大変なんだよね
オーディオコメンタリーの音声だけ切り取れたらいい感じに使えそうだけど多分本編音声も混ざるだろうから難しいか
ラジオMCとかが綺麗な音源で取れたらよさげか 一回公開されたものだし今度表に出て来た時はえぐい進化してる可能性あるな スレ見るのめんどうでディスコしか見てなかったけど頭のいい人多くて嫌儲ってこんなすごいところだったんやなあ
ひさしぶりに知的好奇心で脳汁でてる 外人「HeyJAP!ナカニダサントイテってなんだい?」 声優の音声利用って金取られるから流行れば声優事務所の小遣い稼ぎ先か 商用にする場合大元の学習システムから作り直さないとダメじゃね
開発者も商用にするなって言ってるし https://i.imgur.com/ipy4tok.mp4
学習システムはピッコマ?のエンジニアが作ったOSSだとおもうだで MoeGoe自体ももう少し閉じる的なことディスコにあったけど
Colabのノートブックとかは自分のドライブにコピーしとけば安泰なのかな? >>110
ColabのノートはGit経由でDLしてるだろうから安泰じゃないんじゃない? >>100
ニュース番組とかどうかなBGMのほぼないんじゃね
字幕もついてるし >>110
一部ドライブからダウンロードしてるファイルもあるからptとか
それも保存してちょっと手直しは必要じゃね げーマジか
そういやノートブックの途中でどっかからダウンロードはしてるな…そこが消えたらアウトなのか 亀だが
>>57
音声自動生成AI「MoeGoe」スレ★8
これで行きます
[JA]保守[JA] ■ このスレッドは過去ログ倉庫に格納されています