githubで公開されている音声自動生成AI、日本のアニメキャラ2890名分の音声を学習素材に超速度で進化中★2 [386780362]
■ このスレッドは過去ログ倉庫に格納されています
絵は著作権とかあるから絵描きがキレてたけど
声質は権利とかなさそうだしキレる要素無さそう 釘宮のデータセットが入っているのはこれだね
GitHub - CjangCjengh-MoeGoe- Executable file for VITS inference
https://github.com/CjangCjengh/MoeGoe >>158
これチノちゃんはどこのデータセットや? >>162
多分Moe TTSか>>160のMoeGoe
Moe TTS And Voice Conversion Using VITS Model
https://huggingface.co/spaces/skytnt/moe-tts アクションゲームの簡単なボイスならもうこれで行けるじゃん 中国人がチューニングしているせいかなんか中国語訛り AI関係ないけど100年後に日本や日本語が残ってるとしても
日本語の発音自体が中国語寄りになってるとかありそう >>168
DMCAで消えるかもな、2890のモデルってローカルにダウンロードできないの? ローカルで出力するとデモで作るのに比べて大幅にクオリティ下がっちゃうんだけどなんで😭 >>169
MOEGOE開発者のCjangCjenghにに聞いてみて
CjangCjengh
https://space.bilibili.com/35285881 ジャップ「AI音声には魂がない!!」
こうして技術とデータは海外へ 上で貼ってる用VITS神经网络模型は中国声優のデータセットだね VITSならボイチェンできると思うんだけどこれ作ってる人が音声合成しか興味ない感じなのかな 同じく上で貼ってるMoe TTSはエロゲ声優狙い撃ちだね 同じ条件でも合成のたびにイントネーション変わるから、ほぼ日本語の部分を繋げればまじで違和感ない感じになるよ。 Config FileとModelだけダウンロードすればええんか? 自主的に消してるの?管理者か誰かに消されてんのかな?
絵と違って、声はその人のパーソナリティそのものだから
今の仕様だと、喋らせる内容がひどくなるほど、学習元の人個人を貶めてる感が強い。
中国人が自粛・通報するレベルなんだから、
法的に問題がなくても、生理的・感情的な拒否感の方で
今のままだと流行らないだろうな。
せめてTwitterで気軽に投稿できるレベルまで落とし込まないと。
中国で批判のネット記事が出てるので、製作者が自主的に消してる可能性もある
中国声優のデータセットもバラまかれているのでまぁ残当
在宣传时完全不提原来的声优,是否存在侵权风险?
https://www.v2ex.com/t/885347
音声・画像・動画問わず
今はネットだけで議論されている段階で、法整備もこれからだから落ち着くまで今後もこういうのは続くと思う 10年以上前の棒読みちゃんで情報止まってたがこれはすごいな まあ前からbaiduは消されがちだから
githubが消えると終了しそうだけど >>168
声優の声って著作物でもないしそいつら何かできるのか?
音声そのまま使ってるわけじゃないから法的には何もできん思うぞ 声から明らかに本人特定できる場合に卑猥なこと喋らせて公開したら名誉毀損とか何らかの問題にはなりそう。
法律上も未知の分野で条文が十分に対応できてないからどういう処理がされるのか未知数
現状
音声のデータセット作ってるのは個人だから、規制は不可能だと思うね
次々とgithubに公開されるデータセットの作成者一人一人をいちいち見つけ出して当該国まで行って訴訟を起こすのか? これって日本の法律だと勝手に学習素材にしていいってなってるから
海外の人は積極的にノーリスクで日本の著作物を学習素材にできる
つまり日本がどんどんパクられていってる マジで日本の法律馬鹿すぎる
どんどん日本の著作物パクっていいよ!って海外に向けて発信してるようなもんだぞ
まずイラストがターゲットにされた
次は音声
>>193
対処法書いてあるからDISBOARD概要欄読んで これから先声優といえば同人音声限定の職業になるんだな
ボサっとしてたら法律、建築、医療とか他の分野もAIに捲られそう
CjangCjengh氏に色々取材しようと思ってテンセントQQのMOEGOE開発グループ覗いてみたが、満員(全508人、内モデレータ8人)で入れませんでした
メンバーのプロフィール見たら清華大学学生とか普通に居て草なんだ
https://i.imgur.com/vVGD4Pt.jpg
https://i.imgur.com/djqeaAV.jpg
https://i.imgur.com/LazZpbq.jpg
あと第2鯖も埋まってて第3鯖が出来ていたので、最低でも1000人以上いる
Cjang Cjengh氏自身も機械工学系の上海交大出身
エリート集団が正に"人海戦術"で開発してる 死んだ声優のアニメもう一度作れんじゃね
まつらいさんとか 2800人モデル、ソシャゲがベースのだとボイスデータ豊富なのか結構使える
マギレコは断然こっちのほうがいいよ
腾讯群聊(テンセントグループチャト)見る限りだと
今年7月から開発開始したっぽい?
MOEGOEの中身すげぇ
IPA対応してるじゃん
('A', 'ei˥'),
('B', 'biː˥'),
('C', 'siː˥'),
('D', 'tiː˥'),
('E', 'iː˥'),
('F', 'e˥fuː˨˩'),
('G', 'tsiː˥'),
('H', 'ɪk̚˥tsʰyː˨˩'),
('I', 'ɐi˥'),
('J', 'tsei˥'),
('K', 'kʰei˥'),
('L', 'e˥llou˨˩'),
('M', 'ɛːm˥'),
('N', 'ɛːn˥'),
('O', 'ou˥'),
('P', 'pʰiː˥'),
('Q', 'kʰiːu˥'),
('R', 'aː˥lou˨˩'),
('S', 'ɛː˥siː˨˩'),
('T', 'tʰiː˥'),
('U', 'juː˥'),
('V', 'wiː˥'),
('W', 'tʊk̚˥piː˥juː˥'),
('X', 'ɪk̚˥siː˨˩'),
('Y', 'waːi˥'),
('Z', 'iː˨sɛːt̚˥') AIイラストは学習対象が広いから特定の絵師には大して似ないし
寄せるためにデータを集中学習させたものもほぼ使いものにならんからな
アングラでデータが流行ったところでなんだってのはある
特定声優に成りすませるデータが表で拡散していたらそりゃまあ問題視されるだろう これもうパソコンに
異世界
ラブコメ
ハーレム
とか入力したらワンクールのアニメが出力されそう
MoeGoe-masterの中身見てる
35万行もあるファイル出てきたけど、データセットは入ってないっぽい?
あー
2980名のデータセット本体はテンセントのグループに入ってないと入手できないかもしれないですね 鄧 晟鉉ってtwitterに居るやつかと思ったら嫌儲民だったのか。
やはりMoeGoe-masterの中身にデータセットらしき物は見当たらなかった
多分この認識で合ってると思う こういうアニメ系の声で中国語喋るとめちゃくちゃ可愛いな キリコが悪いとは言わんが、いつか富山敬さんで銀英伝外伝を吹き替え直してくれ 鄧 晟鉉さん いつも情報提供ありがとうございます
テンセントが関わってたの?
企業がこんなモラルの欠けたことに関わってていいのか…
部分的に関わってたのか
がっつりプロジェクトに関わってたのかって分かりますか?
>>218
腾讯qqは中国版discordみたいなものです
個人が色んなサーバー立ててグループでチャットやファイル共有できるしモデレータも設定できる >>219
ありがとうございます、
なるほど、テンセントのチャットツールを使ってやり取りしていたってだけか
早とちりして申し訳ない Huggingfaceのデモでエラーが出るの治して欲しい >>218
別にモラルは欠けてないだろ。
AIで怒り狂ってた絵師みたいな事言いだすなよ笑 アニメに限らず本人の声色での吹き替え需要は大きいだろうな んで遺族にリベート行く様にしたら、みんなこぞって有名声優にしようとする
この流れ出来たらすごいでー
ワイビジネスセンス有り過ぎ
才能が怖い 前言撤回
2980名分のデータセットの場所はこちらでした
https://github.com/CjangCjengh/TTSModels#voistock
Japanese & English & Korean & Chinese
↓
Voistockの箇所 もうデータ全部入ったやつ誰か配布してくれよ
どうせ全部DL済みの奴いるんやろ? これGIGAZINEあたりがまとめてくれないのかな
だれかタレコミしてよ >>229
これの開発開始時期は7月でもう4ヶ月経ってる
中国で騒がれまくったあとに華僑経由でワシのところに情報が入ってきたので
日本で情報が出揃うのは2ヶ月遅れくらいだと思う これモデルは自作できないの?
自分で作るなら何word位必要なんだろう ゼロベースはしんどそうだから2800モデルに追加学習させたいなあ これ一人でやるのは無理だな
グループで集まって交代でやるものだね
零基础炼丹秘籍 - 为自己喜爱的角色训练TTS(文字转语音)模型
TTS (text to speech) model for your favorite character
https://www.bilibili.com/read/mobile?id=17826415 moegoe guiに日本人のコメントあるけどこれモメン? ドラえもん(大山のぶ代)のモデルが水田わさびに聞こえる
ジャングル黒べえや冬月副司令や大槻班長のモデルも謎のショタ声だし、所々間違いあるね 日本語を喋らせても微妙に中国訛りぽくなってるのが面白いな pthとjsonって両方pythonに紐づけでええんよな?
文字入れてクリーンアップしても"操作可能なプログラムまたはバッチ ファイルとして認識されていません。"って出てくるわ ローカル版落としたけどTTSは出来るけどボイスチェンジャーができない……
ボイチェンを試行するとTTSも出来なくなっちゃう シンボリックを使えば自然にいけそうだな
ってか160メガしかないのがやばい https://huggingface.co/spaces/skytnt/moe-tts
ここのsoft voice conversionタブで一応出来るけどバリエーションが少ねえ…
voice conversionタブはバリエーション多いけどオリジナルスピーカー選ばないといけないから使える音源が限られるのかエラーばっか なんでAI関連ってチノちゃんの再現度異様に高いんだろw 日本語化版moegoe
話し手を選択しているのに「話し手を選択してください」と出る
どうすれば? >>250
ワシだってダウンロードしてなかったんだよ
ミラーまで消えてるのでどうにもならない
一応モデルの開発者にもっかい上げてくれってメッセ送ったから返信待ち
返信なけりゃ自分たちで作るしかない >>242
管理者で実行していますが保存ができません
どうすれば? >>252
管理者実行してないけど保存できているよ ディレクトリのパス名に漢字ひらがな入っていても正常に動作しますか? ダウンロードフォルダとC:フォルダでは動作したけどドキュメントフォルダでは動作しなかった フォルダ名を1にしてC:\Users\Desktopに移して管理者で実行しても保存ができませんでした ■ このスレッドは過去ログ倉庫に格納されています