githubで公開されている音声自動生成AI、日本のアニメキャラ2890名分の音声を学習素材に超速度で進化中★4 [386780362]

■ このスレッドは過去ログ倉庫に格納されています
0001ケ 晟鉉 (ポキッー b14e-dYLF)2022/11/11(金) 19:41:37.93ID:IXlWf/AS01111●?2BP(2000)

githubで公開されている音声自動生成AI、日本のアニメキャラ2890名分の音声を学習素材に超速度で進化中★3
https://greta.5ch.net/test/read.cgi/poverty/1667913400/

各キャラごとの声質に寄せつつ、日本語以外にも英語中国語韓国語で音声を生成することも可能なようだ

https://i.imgur.com/xvOmV0y.png
https://i.imgur.com/1nHgIjd.png
https://i.imgur.com/yvYkW6E.png
https://i.imgur.com/S9FjVrm.png
https://i.imgur.com/KgZo70z.png
https://i.imgur.com/kINKEVU.png

包含2890名动画角色的VITS语音合成模型
https://www.bilibili.com/video/BV1P8411Y7v5/

2890名分のデータセットの場所はこちら

GitHub - CjangCjengh-TTSModels
https://github.com/CjangCjengh/TTSModels#voistock

Japanese & English & Korean & Chinese

Voistockの箇所

エヴァの続編で冬月先生出せるのええな

0124ケ 晟鉉 (ワッチョイ 154e-ESxH)2022/11/13(日) 06:27:03.17ID:MPiftEyU0
[JA]保守[JA]

0125番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ a334-lg2x)2022/11/13(日) 06:54:22.85ID:gbw9P5Vp0
>>123
やってみたけど別人の声だった

0126ケ 晟鉉 (ワッチョイ 154e-7ucU)2022/11/13(日) 09:47:43.75ID:MPiftEyU0?2BP(1000)

[JA]保守[JA]

>>122だけどわかったわテキスト書き起こししてないからだわ
この作業が一番きついな

0128番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ a334-lg2x)2022/11/13(日) 11:42:30.82ID:gbw9P5Vp0
colabでの学習方法教えて

https://www.bilibili.com/read/cv17826415
https://www.bilibili.com/read/cv18357171
tacotron2の学習方法と同じみたいなのでそっち見てからvits版のやり方にいじればいけると思う
URLの中にノートブックもあるよ、感情付きのほうも

0130番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ a334-lg2x)2022/11/13(日) 12:17:52.92ID:gbw9P5Vp0
テキストは漢字使ってもいいの

>>130
どっちかわからんかったのでひらがなでやってみて認識するようになったからそっちで作っていこうと思うんだけどどうなんだろ
あと全部のテキスト書き起こさなくてもある程度文章いれたら他のキャラでも学習してくれるっぽい気がする

0132番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ a334-lg2x)2022/11/13(日) 12:23:18.58ID:gbw9P5Vp0
もちろん素材が多い方が質は上がるよね

いや漢字もいけそうな気がする
訓練する前の前処理で文字を機械が読める文字に整理されるみたいだけど漢字にしててもa↑ri↓gatoo go↑zaima↓sU みたいに変換してるわ

0134番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ a334-lg2x)2022/11/13(日) 12:54:12.86ID:gbw9P5Vp0
文字コードはShift-JIS?

>>134
あんま意識してなかったけどutf-8でやってた

0136番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ a334-lg2x)2022/11/13(日) 13:18:07.48ID:gbw9P5Vp0
ありがとう

0137番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ a334-lg2x)2022/11/13(日) 14:03:29.38ID:gbw9P5Vp0
あんまり素材が多すぎてもパンクする感じかな

0138ケ 晟鉉 (ワッチョイ 154e-7ucU)2022/11/13(日) 15:00:38.54ID:MPiftEyU0?2BP(1000)

嫌儲ディスコ鯖管理人としての緊急連絡

乗っ取られたカウントを発見したためBANしましたが、該当ユーザーから個別DMで不審な招待URLが送られていることを確認しました
もし不審なDMが来ていた場合、URLを絶対にクリックしないようお願いいたします

0139番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ a334-lg2x)2022/11/13(日) 15:11:34.48ID:gbw9P5Vp0
VITSへの変換方法を教えてたもれ

0140番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ a334-lg2x)2022/11/13(日) 17:01:12.94ID:gbw9P5Vp0
変換ってどうするの

0141番組の途中ですがアフィサイトへの転載は禁止です (アウアウウー Saa9-1aCe)2022/11/13(日) 17:06:58.92ID:LMnUZtjja
anything v3.2ってどこよ

0142番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ a334-lg2x)2022/11/13(日) 17:12:53.58ID:gbw9P5Vp0
tacotron2で合成したけどVITSに変換できますか?

0143番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ 238f-WFXv)2022/11/13(日) 17:18:54.44ID:ZsPsQnA90
また元データは海賊版から?

0144番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ a334-lg2x)2022/11/13(日) 17:46:54.15ID:gbw9P5Vp0
VITSの方wavsフォルダがないけどどうするんですか

0145ケ 晟鉉 (ワッチョイ 154e-ESxH)2022/11/13(日) 18:23:13.58ID:MPiftEyU0
[JA]保守[JA]

0146番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ 1ba2-uOnm)2022/11/13(日) 18:32:23.36ID:3BCrKRlE0
ぶっちゃけ日本、絵やらアニメやら声優やら関わってる人多いのだから、
ネット上のアニメやら漫画やらをAIに学習させて活用するって発想して
実現するって動きが、そういう日本だからこそワンサカ出てくるものだろうと
予想していたのだがな

で、中国とかに持っていかれる

いくらコンテンツの生まれ出る国でも、技術音痴さで遅れて失う

この先どんな分野でも、そんな感じで衰退していくのであろう

0147ケ 晟鉉 (ワッチョイ 154e-ESxH)2022/11/13(日) 18:37:30.14ID:MPiftEyU0
>>146
開発者にインタビューしてきたけどアニメは学習素材にしてない

0148ケ 晟鉉 (ワッチョイ 154e-ESxH)2022/11/13(日) 18:38:32.90ID:MPiftEyU0

>>147
このAIに限った話ではなくって、自国産コンテンツにAIを採り入れての
更なるコンテンツの革新と生産についての話だったすまん

>>147
アニメ素材にしてなかったらアニメでしか音声なさそうな作品ちらほらあるのは無理な気がする

0151番組の途中ですがアフィサイトへの転載は禁止です (アウアウウー Saa9-fwKM)2022/11/13(日) 19:34:39.75ID:sj/fCjm+a
>>146
関わってる人が多いからこそ自動化して全員失業じゃ洒落にならんでしょ
新興国でしがらみのない中国だから出来ること

今期で放送されてるアニメとかアニメ素材無しでどうやってやったんだ?

0153番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ a334-lg2x)2022/11/13(日) 19:47:22.56ID:gbw9P5Vp0
>>152
Voistockっていうサイトがある

0154番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW a5af-z7/d)2022/11/13(日) 19:58:26.62ID:Y+vD2VpL0
こんなサイトあったんだ
なんでもあるんだねぇ

0155番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ a334-lg2x)2022/11/13(日) 19:59:38.78ID:gbw9P5Vp0
冬月先生みたいに1つしか素材無いキャラは謎のショタボになるみたい
逆にクロコダイルとかバギーは4つしか素材無いけどかなりクオリティ高かったよ

0156番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW 1522-HMC2)2022/11/13(日) 19:59:40.61ID:pqds8WKR0
声だけのモブ声優はもういらんな
トーク力や容姿がいいやつはその付加価値で生き残るだろうけど

>>153
いやそれも誰か素材にしたんだろう?

0158番組の途中ですがアフィサイトへの転載は禁止です (スップ Sd43-z7/d)2022/11/13(日) 20:09:40.80ID:t6uwn1TSd
アニメから切り取った音声素材サイト使ってるけど直接アニメは使ってないってことじゃね
あっちの人的には

ソースロンダリングだな

0160ケ 晟鉉 (ワッチョイ 154e-ESxH)2022/11/13(日) 20:19:14.92ID:MPiftEyU0
>>159
それがアウトならGDPR違反のSDもアウトということになる
http://greta.5ch.net/test/read.cgi/poverty/1666517260/

中華は知らんが日本だと
アニメの音声を音声として聞いて楽しむためではなく
研究目的でのデータベースは合法でしょ

「~のかわいい声100選(皆聞いてね)」なら違法になるけど
「少女キャラ、100ボイス(サンプルボイス)」なら合法なんでしょ?

しかしこれ1回作ったモデルに後からキャラ足したり順番変えたりできんのね
いっぱい作りたいなら最初からキャラ枠と何個かのボイスはセットしとかないといけないわけか

0163ケ 晟鉉 (ワッチョイ 154e-ESxH)2022/11/13(日) 20:49:35.92ID:MPiftEyU0
[JA]保守[JA]

>>160
今の中国しらんけど、そういうの何でもOKな流れではもうない感じ?
今でもNHKの番組がbilibiliにあがるからありがたく見てるけど

0165ケ 晟鉉 (ワッチョイ 154e-ESxH)2022/11/13(日) 22:56:18.23ID:MPiftEyU0
ビリビリに動画上がってたから削除要請出してきた

日本5CH反应:悲报!中国人使用2890位动漫角色声音训练出最强音声AI了!
https://www.bilibili.com/video/BV1Ne4y147CT/

0166ケ 晟鉉 (ワッチョイ 154e-7ucU)2022/11/14(月) 05:31:49.02ID:LmRbohCp0?2BP(1000)

[JA]保守[JA]

0167番組の途中ですがアフィサイトへの転載は禁止です (テテンテンテン MM4b-N7Ga)2022/11/14(月) 05:40:44.64ID:70c4hua+M
ルイズあるやんけ

0168ケ 晟鉉 (オッペケ Src1-Uv+W)2022/11/14(月) 07:56:51.37ID:2W+SfvNwr
[JA]保守[JA]

0169番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ a334-lg2x)2022/11/14(月) 14:15:17.75ID:bY3JEBq60
VITSの学習で、データセットの解凍まで終わったんだけどhparams_training_files:とhparams_validation_files:はどうすればいいの?

0170番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ a334-lg2x)2022/11/14(月) 15:07:59.35ID:bY3JEBq60
「No dashboards are active for the current data set.」ってエラーが出る

0171番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ a334-lg2x)2022/11/14(月) 16:28:47.81ID:bY3JEBq60
wavsフォルダを直下に移動したら今度は
「IndexError: tuple index out of range」ってエラーが出るようになった

0172ケ 晟鉉 (ワッチョイ 154e-7ucU)2022/11/14(月) 19:37:00.32ID:LmRbohCp0?2BP(1000)

c直下はどうですか?

0173ケ 晟鉉 (ワッチョイ 154e-7ucU)2022/11/14(月) 19:37:08.80ID:LmRbohCp0?2BP(1000)

[JA]保守[JA]

■ このスレッドは過去ログ倉庫に格納されています