githubで公開されている音声自動生成AI、日本のアニメキャラ2890名分の音声を学習素材に超速度で進化中★2 [386780362]

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-dYLF) · 2022/11/05(土) 21:32:41.32

githubで公開されている音声自動生成AI、日本のアニメキャラ2890名分の音声を学習素材に超速度で進化中
https://www.youtube.com/watch?v=aoq97CT0MUs

各キャラごとの声質に寄せつつ、日本語以外にも英語中国語韓国語で音声を生成することも可能なようだ

https://i.imgur.com/xvOmV0y.png
https://i.imgur.com/1nHgIjd.png
https://i.imgur.com/yvYkW6E.png
https://i.imgur.com/S9FjVrm.png
https://i.imgur.com/KgZo70z.png
https://i.imgur.com/kINKEVU.png

包含2890名动画角色的VITS语音合成模型
https://www.bilibili.com/video/BV1P8411Y7v5/

前スレ
githubで公開されている音声自動生成AI、日本のアニメキャラ2890名分の音声を学習素材に超速度で進化中
https://greta.5ch.net/test/read.cgi/poverty/1667389094/

2022/11/06(日) 06:47:22.59

絵は著作権とかあるから絵描きがキレてたけど
声質は権利とかなさそうだしキレる要素無さそう

2022/11/06(日) 07:10:43.77

作ってみた
https://youtu.be/CbKIgjjW6y0

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-KQvO) · 2022/11/06(日) 07:32:20.35

釘宮

【AI语音合成/VITS】来感受随时可以被钉宫辱骂的快感吧！
https://www.bilibili.com/video/BV1BP411G7P8/

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-KQvO) · 2022/11/06(日) 07:39:05.54

釘宮のデータセットが入っているのはこれだね

GitHub - CjangCjengh-MoeGoe- Executable file for VITS inference
https://github.com/CjangCjengh/MoeGoe

2022/11/06(日) 07:40:57.83

>>158
ワロタ

2022/11/06(日) 07:46:42.04

>>158
これチノちゃんはどこのデータセットや？

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-KQvO) · 2022/11/06(日) 07:59:41.30

>>162
多分Moe TTSか>>160のMoeGoe

Moe TTS And Voice Conversion Using VITS Model
https://huggingface.co/spaces/skytnt/moe-tts

2022/11/06(日) 08:18:58.31

アクションゲームの簡単なボイスならもうこれで行けるじゃん

2022/11/06(日) 09:01:59.97

中国人がチューニングしているせいかなんか中国語訛り

2022/11/06(日) 09:06:01.37

ＡＩ関係ないけど１００年後に日本や日本語が残ってるとしても
日本語の発音自体が中国語寄りになってるとかありそう

2022/11/06(日) 09:13:26.20

郷里大輔さんと飯塚昭三さんのデータが欲しい

2022/11/06(日) 09:36:54.51

>>1
日本声優事業者協議会のお問い合わせリンク貼っておくわ
この件で一報入れといたから

https://sei-yu.net/contact/ver2/

ウェブサイト: https://sei-yu.net/

2022/11/06(日) 09:42:47.19

>>168
DMCAで消えるかもな、2890のモデルってローカルにダウンロードできないの？

2022/11/06(日) 10:02:13.48

ローカルで出力するとデモで作るのに比べて大幅にクオリティ下がっちゃうんだけどなんで😭

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-KQvO) · 2022/11/06(日) 10:06:26.07

中国語各方言のデータセットが公開されるみたい

表記法
https://i.imgur.com/wD4fELY.png

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-KQvO) · 2022/11/06(日) 10:08:39.99

>>169
MOEGOE開発者のCjangCjenghにに聞いてみて

CjangCjengh
https://space.bilibili.com/35285881

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-KQvO) · 2022/11/06(日) 10:24:14.23

GUIもあった

MoeGoe_GUI
https://github.com/CjangCjengh/MoeGoe_GUI

2022/11/06(日) 10:28:58.22

ジャップ「AI音声には魂がない！！」

こうして技術とデータは海外へ

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-KQvO) · 2022/11/06(日) 10:43:18.19

上で貼ってる用VITS神经网络模型は中国声優のデータセットだね

2022/11/06(日) 11:03:13.87

VITSならボイチェンできると思うんだけどこれ作ってる人が音声合成しか興味ない感じなのかな

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-KQvO) · 2022/11/06(日) 11:06:55.28

同じく上で貼ってるMoe TTSはエロゲ声優狙い撃ちだね

2022/11/06(日) 11:14:18.19

発音が変だから所詮お遊びやね

2022/11/06(日) 11:17:13.26

同じ条件でも合成のたびにイントネーション変わるから、ほぼ日本語の部分を繋げればまじで違和感ない感じになるよ。

2022/11/06(日) 11:19:25.69

Config FileとModelだけダウンロードすればええんか？

2022/11/06(日) 11:53:16.00

胡散臭い中国イントネーションになって使えんわ

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-KQvO) · 2022/11/06(日) 12:03:46.86

ここでも音声AIの話やってる
https://discord.gg/JTrphv74Qg

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-KQvO) · 2022/11/06(日) 12:15:20.84

マギレコのデータセット消されました

2022/11/06(日) 12:19:29.51

自主的に消してるの？管理者か誰かに消されてんのかな？

絵と違って、声はその人のパーソナリティそのものだから
今の仕様だと、喋らせる内容がひどくなるほど、学習元の人個人を貶めてる感が強い。

中国人が自粛・通報するレベルなんだから、
法的に問題がなくても、生理的・感情的な拒否感の方で
今のままだと流行らないだろうな。
せめてTwitterで気軽に投稿できるレベルまで落とし込まないと。

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-dYLF) · 2022/11/06(日) 12:28:36.15

中国で批判のネット記事が出てるので、製作者が自主的に消してる可能性もある
中国声優のデータセットもバラまかれているのでまぁ残当

在宣传时完全不提原来的声优，是否存在侵权风险？
https://www.v2ex.com/t/885347

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-dYLF) · 2022/11/06(日) 12:30:02.87

音声・画像・動画問わず
今はネットだけで議論されている段階で、法整備もこれからだから落ち着くまで今後もこういうのは続くと思う

2022/11/06(日) 12:31:06.72

１０年以上前の棒読みちゃんで情報止まってたがこれはすごいな

2022/11/06(日) 12:31:52.99

まあ前からbaiduは消されがちだから
githubが消えると終了しそうだけど

2022/11/06(日) 12:32:41.31

>>168
声優の声って著作物でもないしそいつら何かできるのか？
音声そのまま使ってるわけじゃないから法的には何もできん思うぞ

2022/11/06(日) 12:36:26.91

声から明らかに本人特定できる場合に卑猥なこと喋らせて公開したら名誉毀損とか何らかの問題にはなりそう。
法律上も未知の分野で条文が十分に対応できてないからどういう処理がされるのか未知数

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-dYLF) · 2022/11/06(日) 12:38:23.33

現状
音声のデータセット作ってるのは個人だから、規制は不可能だと思うね
次々とgithubに公開されるデータセットの作成者一人一人をいちいち見つけ出して当該国まで行って訴訟を起こすのか？

2022/11/06(日) 12:39:33.29

これって日本の法律だと勝手に学習素材にしていいってなってるから
海外の人は積極的にノーリスクで日本の著作物を学習素材にできる

つまり日本がどんどんパクられていってる

2022/11/06(日) 12:45:39.00

>>112
そこ蹴られたけど

2022/11/06(日) 12:46:57.93

マジで日本の法律馬鹿すぎる
どんどん日本の著作物パクっていいよ！って海外に向けて発信してるようなもんだぞ

まずイラストがターゲットにされた
次は音声

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-dYLF) · 2022/11/06(日) 12:47:58.70

>>193
対処法書いてあるからDISBOARD概要欄読んで

2022/11/06(日) 12:48:33.62

これから先声優といえば同人音声限定の職業になるんだな

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-dYLF) · 2022/11/06(日) 12:49:32.77

ボサっとしてたら法律、建築、医療とか他の分野もAIに捲られそう

2022/11/06(日) 13:17:55.32

コイカツでキャラ作ってこれで喘がせれば完璧やん

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-dYLF) · 2022/11/06(日) 13:53:17.44

CjangCjengh氏に色々取材しようと思ってテンセントQQのMOEGOE開発グループ覗いてみたが、満員(全508人、内モデレータ8人)で入れませんでした
メンバーのプロフィール見たら清華大学学生とか普通に居て草なんだ

https://i.imgur.com/vVGD4Pt.jpg
https://i.imgur.com/djqeaAV.jpg
https://i.imgur.com/LazZpbq.jpg

あと第2鯖も埋まってて第3鯖が出来ていたので、最低でも1000人以上いる

2022/11/06(日) 13:55:05.06

おのれギフハブ…

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-dYLF) · 2022/11/06(日) 13:57:53.35

Cjang Cjengh氏自身も機械工学系の上海交大出身
エリート集団が正に"人海戦術"で開発してる

2022/11/06(日) 13:59:11.43

死んだ声優のアニメもう一度作れんじゃね
まつらいさんとか

2022/11/06(日) 14:00:50.55

もうほとんど消されちゃた後だったか

2022/11/06(日) 14:01:10.52

使ってみたけど思ったよりシコるのに使えて驚いた

2022/11/06(日) 14:02:31.01

2800人モデル、ソシャゲがベースのだとボイスデータ豊富なのか結構使える
マギレコは断然こっちのほうがいいよ

2022/11/06(日) 14:03:39.83

>>204
昨日三回抜いたわ・・・

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-dYLF) · 2022/11/06(日) 14:09:09.32

腾讯群聊(テンセントグループチャト)見る限りだと
今年7月から開発開始したっぽい？

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-dYLF) · 2022/11/06(日) 14:17:39.50

MOEGOEの中身すげぇ
IPA対応してるじゃん

('A', 'ei˥'),
('B', 'biː˥'),
('C', 'siː˥'),
('D', 'tiː˥'),
('E', 'iː˥'),
('F', 'e˥fuː˨˩'),
('G', 'tsiː˥'),
('H', 'ɪk̚˥tsʰyː˨˩'),
('I', 'ɐi˥'),
('J', 'tsei˥'),
('K', 'kʰei˥'),
('L', 'e˥llou˨˩'),
('M', 'ɛːm˥'),
('N', 'ɛːn˥'),
('O', 'ou˥'),
('P', 'pʰiː˥'),
('Q', 'kʰiːu˥'),
('R', 'aː˥lou˨˩'),
('S', 'ɛː˥siː˨˩'),
('T', 'tʰiː˥'),
('U', 'juː˥'),
('V', 'wiː˥'),
('W', 'tʊk̚˥piː˥juː˥'),
('X', 'ɪk̚˥siː˨˩'),
('Y', 'waːi˥'),
('Z', 'iː˨sɛːt̚˥')

2022/11/06(日) 14:18:19.48

AIイラストは学習対象が広いから特定の絵師には大して似ないし
寄せるためにデータを集中学習させたものもほぼ使いものにならんからな
アングラでデータが流行ったところでなんだってのはある

特定声優に成りすませるデータが表で拡散していたらそりゃまあ問題視されるだろう

2022/11/06(日) 14:20:47.05

これもうパソコンに
異世界
ラブコメ
ハーレム
とか入力したらワンクールのアニメが出力されそう

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-dYLF) · 2022/11/06(日) 14:23:35.72

MoeGoe-masterの中身見てる
35万行もあるファイル出てきたけど、データセットは入ってないっぽい？

2022/11/06(日) 14:24:39.13

ルパンはAIで山田なんとかさんに戻すべき。

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-dYLF) · 2022/11/06(日) 14:25:59.62

あー

2980名のデータセット本体はテンセントのグループに入ってないと入手できないかもしれないですね

2022/11/06(日) 14:26:04.99

鄧晟鉉ってtwitterに居るやつかと思ったら嫌儲民だったのか。

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-dYLF) · 2022/11/06(日) 14:27:08.84

やはりMoeGoe-masterの中身にデータセットらしき物は見当たらなかった
多分この認識で合ってると思う

2022/11/06(日) 14:29:35.86

こういうアニメ系の声で中国語喋るとめちゃくちゃ可愛いな

2022/11/06(日) 14:38:54.04

キリコが悪いとは言わんが、いつか富山敬さんで銀英伝外伝を吹き替え直してくれ

2022/11/06(日) 14:43:39.04

鄧晟鉉さん　いつも情報提供ありがとうございます

テンセントが関わってたの？
企業がこんなモラルの欠けたことに関わってていいのか…
部分的に関わってたのか
がっつりプロジェクトに関わってたのかって分かりますか？

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-dYLF) · 2022/11/06(日) 14:46:30.31

>>218
腾讯qqは中国版discordみたいなものです
個人が色んなサーバー立ててグループでチャットやファイル共有できるしモデレータも設定できる

2022/11/06(日) 14:50:08.16

>>219
ありがとうございます、
なるほど、テンセントのチャットツールを使ってやり取りしていたってだけか
早とちりして申し訳ない

2022/11/06(日) 14:53:44.42

Huggingfaceのデモでエラーが出るの治して欲しい

2022/11/06(日) 14:53:59.77

>>218
別にモラルは欠けてないだろ。
AIで怒り狂ってた絵師みたいな事言いだすなよ笑

2022/11/06(日) 14:57:06.21

アニメに限らず本人の声色での吹き替え需要は大きいだろうな

2022/11/06(日) 15:27:09.03

これでシモセカの続編作れるやん

2022/11/06(日) 15:28:35.69

んで遺族にリベート行く様にしたら、みんなこぞって有名声優にしようとする
この流れ出来たらすごいでー
ワイビジネスセンス有り過ぎ
才能が怖い

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-KQvO) · 2022/11/06(日) 15:35:48.44

前言撤回
2980名分のデータセットの場所はこちらでした

https://github.com/CjangCjengh/TTSModels#voistock

Japanese & English & Korean & Chinese
↓
Voistockの箇所

2022/11/06(日) 15:36:09.68

もうデータ全部入ったやつ誰か配布してくれよ
どうせ全部DL済みの奴いるんやろ？

2022/11/06(日) 15:38:39.02

これGIGAZINEあたりがまとめてくれないのかな
だれかタレコミしてよ

2022/11/06(日) 15:41:55.76

まだ騒がなくていい。

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-KQvO) · 2022/11/06(日) 15:48:12.53

>>229
これの開発開始時期は7月でもう4ヶ月経ってる

中国で騒がれまくったあとに華僑経由でワシのところに情報が入ってきたので
日本で情報が出揃うのは2ヶ月遅れくらいだと思う

2022/11/06(日) 15:57:02.23

これモデルは自作できないの？
自分で作るなら何word位必要なんだろう

2022/11/06(日) 15:58:48.46

ゼロベースはしんどそうだから2800モデルに追加学習させたいなあ

2022/11/06(日) 16:08:13.24

認知度で言うと日本だとこの辺のツイートが最短か？
https://twitter.com/yocqn/status/1563452114160205826?s=46&t=Yu96Iq2ZkvgsQDvM-fT8zA
https://twitter.com/5chan_nel (5ch newer account)

2022/11/06(日) 16:14:04.53

モデル学習法を日本語で解説してクレメンス

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-KQvO) · 2022/11/06(日) 16:21:13.02

これ一人でやるのは無理だな
グループで集まって交代でやるものだね

零基础炼丹秘籍 - 为自己喜爱的角色训练TTS（文字转语音）模型
TTS (text to speech) model for your favorite character
https://www.bilibili.com/read/mobile?id=17826415

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-KQvO) · 2022/11/06(日) 16:26:19.96

moegoe guiに日本人のコメントあるけどこれモメン？

2022/11/06(日) 16:27:28.53

ドラえもん（大山のぶ代）のモデルが水田わさびに聞こえる
ジャングル黒べえや冬月副司令や大槻班長のモデルも謎のショタ声だし、所々間違いあるね

2022/11/06(日) 16:34:06.36

日本語を喋らせても微妙に中国訛りぽくなってるのが面白いな

2022/11/06(日) 16:56:52.03

>>226
ほんまやサンクス

2022/11/06(日) 17:00:21.44

pthとjsonって両方pythonに紐づけでええんよな？
文字入れてクリーンアップしても"操作可能なプログラムまたはバッチファイルとして認識されていません。"って出てくるわ

2022/11/06(日) 17:02:59.52

ボイスロイドより便利になったら教えてくれ

2022/11/06(日) 17:07:50.09

ローカル版落としたけどTTSは出来るけどボイスチェンジャーができない……
ボイチェンを試行するとTTSも出来なくなっちゃう

2022/11/06(日) 17:27:15.07

人数多すぎて草

2022/11/06(日) 17:28:22.24

シンボリックを使えば自然にいけそうだな
ってか１６０メガしかないのがやばい

2022/11/06(日) 17:30:06.31

https://huggingface.co/spaces/skytnt/moe-tts
ここのsoft voice conversionタブで一応出来るけどバリエーションが少ねえ…
voice conversionタブはバリエーション多いけどオリジナルスピーカー選ばないといけないから使える音源が限られるのかエラーばっか

2022/11/06(日) 17:33:10.62

なんでAI関連ってチノちゃんの再現度異様に高いんだろw

2022/11/06(日) 17:45:56.32

>>227
>>226に２８９０名分入ってるよ

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-KQvO) · 2022/11/06(日) 18:12:17.37

日本語化版moegoe
話し手を選択しているのに「話し手を選択してください」と出る
どうすれば？

2022/11/06(日) 18:20:50.13

-結構大事だな
息遣い的に使える

2022/11/06(日) 18:27:36.82

>>145
あげ直してよ

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-KQvO) · 2022/11/06(日) 18:39:31.20

>>250
ワシだってダウンロードしてなかったんだよ
ミラーまで消えてるのでどうにもならない
一応モデルの開発者にもっかい上げてくれってメッセ送ったから返信待ち

返信なけりゃ自分たちで作るしかない

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-KQvO) · 2022/11/06(日) 18:40:21.55

>>242
管理者で実行していますが保存ができません
どうすれば？

2022/11/06(日) 18:42:02.41

>>252
管理者実行してないけど保存できているよ

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-KQvO) · 2022/11/06(日) 18:44:10.43

ディレクトリのパス名に漢字ひらがな入っていても正常に動作しますか？

2022/11/06(日) 18:46:09.79

動作したよ

2022/11/06(日) 18:47:56.06

ダウンロードフォルダとC:フォルダでは動作したけどドキュメントフォルダでは動作しなかった

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-KQvO) · 2022/11/06(日) 18:53:31.50

フォルダ名を1にしてC:\Users\Desktopに移して管理者で実行しても保存ができませんでした