githubで公開されている音声自動生成AI、日本のアニメキャラ2890名分の音声を学習素材に超速度で進化中★2 [386780362]
■ このスレッドは過去ログ倉庫に格納されています
マジで日本の法律馬鹿すぎる
どんどん日本の著作物パクっていいよ!って海外に向けて発信してるようなもんだぞ
まずイラストがターゲットにされた
次は音声
>>193
対処法書いてあるからDISBOARD概要欄読んで これから先声優といえば同人音声限定の職業になるんだな
ボサっとしてたら法律、建築、医療とか他の分野もAIに捲られそう
CjangCjengh氏に色々取材しようと思ってテンセントQQのMOEGOE開発グループ覗いてみたが、満員(全508人、内モデレータ8人)で入れませんでした
メンバーのプロフィール見たら清華大学学生とか普通に居て草なんだ
https://i.imgur.com/vVGD4Pt.jpg
https://i.imgur.com/djqeaAV.jpg
https://i.imgur.com/LazZpbq.jpg
あと第2鯖も埋まってて第3鯖が出来ていたので、最低でも1000人以上いる
Cjang Cjengh氏自身も機械工学系の上海交大出身
エリート集団が正に"人海戦術"で開発してる 死んだ声優のアニメもう一度作れんじゃね
まつらいさんとか 2800人モデル、ソシャゲがベースのだとボイスデータ豊富なのか結構使える
マギレコは断然こっちのほうがいいよ
腾讯群聊(テンセントグループチャト)見る限りだと
今年7月から開発開始したっぽい?
MOEGOEの中身すげぇ
IPA対応してるじゃん
('A', 'ei˥'),
('B', 'biː˥'),
('C', 'siː˥'),
('D', 'tiː˥'),
('E', 'iː˥'),
('F', 'e˥fuː˨˩'),
('G', 'tsiː˥'),
('H', 'ɪk̚˥tsʰyː˨˩'),
('I', 'ɐi˥'),
('J', 'tsei˥'),
('K', 'kʰei˥'),
('L', 'e˥llou˨˩'),
('M', 'ɛːm˥'),
('N', 'ɛːn˥'),
('O', 'ou˥'),
('P', 'pʰiː˥'),
('Q', 'kʰiːu˥'),
('R', 'aː˥lou˨˩'),
('S', 'ɛː˥siː˨˩'),
('T', 'tʰiː˥'),
('U', 'juː˥'),
('V', 'wiː˥'),
('W', 'tʊk̚˥piː˥juː˥'),
('X', 'ɪk̚˥siː˨˩'),
('Y', 'waːi˥'),
('Z', 'iː˨sɛːt̚˥') AIイラストは学習対象が広いから特定の絵師には大して似ないし
寄せるためにデータを集中学習させたものもほぼ使いものにならんからな
アングラでデータが流行ったところでなんだってのはある
特定声優に成りすませるデータが表で拡散していたらそりゃまあ問題視されるだろう これもうパソコンに
異世界
ラブコメ
ハーレム
とか入力したらワンクールのアニメが出力されそう
MoeGoe-masterの中身見てる
35万行もあるファイル出てきたけど、データセットは入ってないっぽい?
あー
2980名のデータセット本体はテンセントのグループに入ってないと入手できないかもしれないですね 鄧 晟鉉ってtwitterに居るやつかと思ったら嫌儲民だったのか。
やはりMoeGoe-masterの中身にデータセットらしき物は見当たらなかった
多分この認識で合ってると思う こういうアニメ系の声で中国語喋るとめちゃくちゃ可愛いな キリコが悪いとは言わんが、いつか富山敬さんで銀英伝外伝を吹き替え直してくれ 鄧 晟鉉さん いつも情報提供ありがとうございます
テンセントが関わってたの?
企業がこんなモラルの欠けたことに関わってていいのか…
部分的に関わってたのか
がっつりプロジェクトに関わってたのかって分かりますか?
>>218
腾讯qqは中国版discordみたいなものです
個人が色んなサーバー立ててグループでチャットやファイル共有できるしモデレータも設定できる >>219
ありがとうございます、
なるほど、テンセントのチャットツールを使ってやり取りしていたってだけか
早とちりして申し訳ない Huggingfaceのデモでエラーが出るの治して欲しい >>218
別にモラルは欠けてないだろ。
AIで怒り狂ってた絵師みたいな事言いだすなよ笑 アニメに限らず本人の声色での吹き替え需要は大きいだろうな んで遺族にリベート行く様にしたら、みんなこぞって有名声優にしようとする
この流れ出来たらすごいでー
ワイビジネスセンス有り過ぎ
才能が怖い 前言撤回
2980名分のデータセットの場所はこちらでした
https://github.com/CjangCjengh/TTSModels#voistock
Japanese & English & Korean & Chinese
↓
Voistockの箇所 もうデータ全部入ったやつ誰か配布してくれよ
どうせ全部DL済みの奴いるんやろ? これGIGAZINEあたりがまとめてくれないのかな
だれかタレコミしてよ >>229
これの開発開始時期は7月でもう4ヶ月経ってる
中国で騒がれまくったあとに華僑経由でワシのところに情報が入ってきたので
日本で情報が出揃うのは2ヶ月遅れくらいだと思う これモデルは自作できないの?
自分で作るなら何word位必要なんだろう ゼロベースはしんどそうだから2800モデルに追加学習させたいなあ これ一人でやるのは無理だな
グループで集まって交代でやるものだね
零基础炼丹秘籍 - 为自己喜爱的角色训练TTS(文字转语音)模型
TTS (text to speech) model for your favorite character
https://www.bilibili.com/read/mobile?id=17826415 moegoe guiに日本人のコメントあるけどこれモメン? ドラえもん(大山のぶ代)のモデルが水田わさびに聞こえる
ジャングル黒べえや冬月副司令や大槻班長のモデルも謎のショタ声だし、所々間違いあるね 日本語を喋らせても微妙に中国訛りぽくなってるのが面白いな pthとjsonって両方pythonに紐づけでええんよな?
文字入れてクリーンアップしても"操作可能なプログラムまたはバッチ ファイルとして認識されていません。"って出てくるわ ローカル版落としたけどTTSは出来るけどボイスチェンジャーができない……
ボイチェンを試行するとTTSも出来なくなっちゃう シンボリックを使えば自然にいけそうだな
ってか160メガしかないのがやばい https://huggingface.co/spaces/skytnt/moe-tts
ここのsoft voice conversionタブで一応出来るけどバリエーションが少ねえ…
voice conversionタブはバリエーション多いけどオリジナルスピーカー選ばないといけないから使える音源が限られるのかエラーばっか なんでAI関連ってチノちゃんの再現度異様に高いんだろw 日本語化版moegoe
話し手を選択しているのに「話し手を選択してください」と出る
どうすれば? >>250
ワシだってダウンロードしてなかったんだよ
ミラーまで消えてるのでどうにもならない
一応モデルの開発者にもっかい上げてくれってメッセ送ったから返信待ち
返信なけりゃ自分たちで作るしかない >>242
管理者で実行していますが保存ができません
どうすれば? >>252
管理者実行してないけど保存できているよ ディレクトリのパス名に漢字ひらがな入っていても正常に動作しますか? ダウンロードフォルダとC:フォルダでは動作したけどドキュメントフォルダでは動作しなかった フォルダ名を1にしてC:\Users\Desktopに移して管理者で実行しても保存ができませんでした 一度エラー出ると再起しなきゃいけないのっておま環?
なかなかめんどい アニメ化してないマンガやラノベの台詞を読ませるのが楽しい MoeGoeダウンロードして
https://github.com/CjangCjengh/MoeGoe/releases/tag/v3.0.0
MoeGoe_GUIダウンロードして
https://github.com/CjangCjengh/MoeGoe_GUI/releases/tag/v3.0.0
ここのリンクからモデルとコンフィグファイルをセットでダウンロードして
https://github.com/CjangCjengh/TTSModels
MoeGoe_GUI.exeを起動、MoeGoe.exeの位置とモデル(模型pth)、コンフィグ(配置・json)を指定したら
文本に文章入れて正規表現に変換できたら下のプルダウンメニューからキャラ名選んで保存ボタンで保存 Vtuber版も作れそうだな
生配信やらボイスが豊富だしな >>261
[JA]んっ...んっ...んっ...んっ...んっ...[JA]
キスしてるように聞こえるゾ 非常に申し訳ないが
誰か
moegoe起動してモデルとコンフィグファイルをセットして話して選んで保存押すところまで動画で撮ってあげてくれないか? >>41
言うてこういうの使いたがるの倫理観無視の同人とか個人制作の動画とかだろ
別に読み上げるだけなら専用のソフト使えばいいだけだし 日本語喋らせると中国訛りが激しいのは中国語のイントネーションを優先してるのか >>271
第一弾のうるさいですねえの面倒くさそうな感じってどうやって車べせた?
不愉快そうな感じが難しい 保存するときのexplorerの画面の下の方の
ファイルの種類(T) 音频文件(*wav)
これがワシの環境だと何故か表示されないみたい
(*wav)の表示がない シンボリック入力を駆使すればなんとかなりそう?
[JA]そ-う-だ-よ-...[JA]
[JA]おまえ、さっきおらきがえてるときちらちらみてただろ、うそつけぜったいみてたぞ[JA]
[JA]みたけりゃみせてやるよ[JA] やっぱりこういうのは権利関係の常識や良心が無いチャイナが強いわ 嫌儲ディスコのAI板でbaiduのウマ娘・プリコネ・マギレコデータセット持ってる方がいらしたので
再配布するそうです >>284
2980人の方にウマ娘いるけど何か違うの? >>285
なんだそうだったのか
あんな流暢に出せるのかと思ったわ [JA]いれてもじぇーえーって読み上げるだけなんだがなんでなん(・x・) >>286
作った人が違う
少人数分のモデルデータのほうが品質が高いようだ 半角だけどなぁ
>>281のやつコピペしてもじぇーえー読み上げる ■ このスレッドは過去ログ倉庫に格納されています