githubで公開されている音声自動生成AI、日本のアニメキャラ2890名分の音声を学習素材に超速度で進化中★2 [386780362]
■ このスレッドは過去ログ倉庫に格納されています
正式名称「VITS文本转语音生成模型」((Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech))
github
vits: Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech
https://github.com/jaywalnut310/vits
GitHub - innnky-vits-japanese- 端到端语音合成模型VITS,日语数据训练
https://github.com/innnky/vits-japanese
VITS 语音合成完全端到端TTS的里程碑
https://blog.csdn.net/Terry_ZzZzZz/article/details/120458064
Moe TTS And Voice Conversion Using VITS Model
https://huggingface.co/spaces/skytnt/moe-tts
零基础炼丹秘籍 - 为自己喜爱的角色训练TTS(文字转语音)模型
TTS (text to speech) model for your favorite character
https://www.bilibili.com/read/mobile?id=17826415
マギレコキャラ10人分のモデルデータ
基于VITS的魔法纪录10人模型
https://www.bilibili.com/video/BV1Ne4y1y7uT/
百度网盘(Baidu Cloud)からダウンロードするには百度垢が必須
百度アカウント開設方法↓
このアプリをインスコ後、で国コードで日本を選んでSMS認証すれば完了
https://adersaytech.com/tech-event/how-to-register-baidu-account.html
デモページ
Audio Samples from "Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech"
https://jaywalnut310.github.io/vits-demo/index.html
論文
用于端到端文本到语音的具有对抗学习的条件变分自动编码器(Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech)
https://arxiv.org/abs/2106.06103
論文の解説動画
论文分享会 | 用于端到端文本到语音的具有对抗学习的条件变分自编码器
https://www.bilibili.com/video/BV1QB4y1U7ZK/
こちらは同じ製作者の動画
喜怒哀楽による読み上げの変化をパラメータ化しツール化
VITS情感控制语音合成
解説動画
可控制情感的绫地宁宁语音合成!基于VITS模型
https://www.bilibili.com/video/BV1Vg411h7of/
GitHub - audeering-w2v2-how-to- How to use our public wav2vec2 dimensional emotion model
https://github.com/audeering/w2v2-how-to
VITS情感控制语音合成
https://github.com/innnky/emotional-vits
デモページ
https://huggingface.co/spaces/innnky/nene-emotion
関連動画
プリコネキャラにごめゆいを言わせる動画、音声はすべて自動生成
【AI语音合成】用VITS给优衣说对不起 公主连接17人模型
https://www.bilibili.com/video/BV1S24y1d74C/
なかよし部に中国語で喋らせる動画
【语音合成】基于VITS的好朋友部三人语音合成模型
https://www.bilibili.com/video/BV1JD4y167sQ
ウマ娘&原神の声色再現動画
【AI语音合成】赛马娘&原神的中日结合模型尝试
https://www.bilibili.com/video/BV1UG4y1W7Ji/
VITS文本转语音生成模型の解説動画
【AI语音合成】基于VITS模型的优妮先辈语音合成
https://www.bilibili.com/video/BV1jY4y1c7JF かなり年齢が高い声優陣はデータが大量にあるから学習させておけば
もしものことがあっても大丈夫な気がする ええやん
読むのがめんどくさい時にフルボイスがありがたい
小説とか捗る まだまだなレベルだけど
イラストAIみたいに突然変異する可能性あるからな
怖いよAI 音程だけに依存しない男声、女声、成人、児童の使い分けとか
フォルマウントレベルでの性差が表現できてるかとか
色々気になります
そこまでてきてたら本当に人間がいらなくなる日は近いかも 声優が失業する代わりに出力調整師が誕生するから問題ない >>22
初音ミクとおなじで合成音声の癖が全部残ってるからな
NHKのAI読み上げレベルならかなりすごいけど ずんだもんとか割と人間が喋ってる感あるけど
それを上回れるんかな ええなこれ
出来れば普通の女優とかも頼む
アニメ声は要らん
>>11
このまま行くと文章を読み上げる職業なくなるんじゃない?
ニュースのキャスターとか見た目は画像生成、声も自動生成で人件費は無料にできる どちらかと言うと有料で自動音声を法人向けに売っている
モヤさまとかのああ言う声の会社が一番やばそう 野沢那智とか塩沢兼人みたいな鬼籍に入った声優復活出来るやん まぁ絵も声も死んだ人の絵柄や声質を今生きてる人間が権利主張するのはおかしいわな
これさ、この前うちの会社で話題にしてたよ
明らかにコモンズライセンス違反だって
商業に使えねーものなんだよなあ。当たり前だけどコモンズライセンス違反だからフリーソフトとしても公開したらアウト 声優はただでさえ過当競争なのにどうなっちゃうんだよ 声優が中国に進出したとたんこれかよw
技術を中国に吸い上げられた日本企業と変わらんな >>41
いうてCGはもう商売として成立してるやん AIには枕営業出来ないから人間の声優を脅かす事は無い まぁ今の時点では権利問題あるけど
技術も権利関連もどんどん改善されていくから
未来の話をしてるならただの馬鹿w ささっとこういう仕事する有能な暇人は
日本から消えて中国が本場になっちゃった感じだな これでドラゴンボールの悟空は永遠に生き続ける
AI悟空楽しみだな 調声するための時間を考えたら普通に声優を使った方がよくないか
と思ったけど声質を選べて台詞と演技を自由にさせられるメリットやばいな
Synthesizer VのMaiがベタ打ちの超精度でびびったけど歌だけじゃなくなるのか ボカロは全然進化しなかったのに
こっちの進化は凄いな >>53
悟空の声でエロゲができるってことでもあるのか AI絵師の話で初音ミクとか持ち出してる奴ってやっぱり全然わかってなかったよな
初音ミクなんて所詮ただの楽器であり全然人間の声には聞こえなかった
AI音声というなら文章入力しただけでリアルな音声や歌を勝手に再生してくれないとな
そのうち歌詞入力しただけで勝手にいい感じの音楽作ってくれるようになるんだろうな
そしたら作曲家や歌手の多くは失業確実だ >>52
有能人材余ってるからな
輸入すればいいのに これ声優交代とか必要なくなるな
不死のぶ代出来るぞ 数年前にadobeが悪用されるので公開はしないけど
音声自動生成AI出来ましたいってたからな
その辺の倫理をぶっ飛ばす個人レベルでも
開発環境が整ってきたってコトだわ >>41
このソフトの詳しい仕組みが分からないのでなんとも言えないけれど
仕組みによってはこれから法的な議論が必要になる可能性もあると思う
入力された音声から特徴量を抽出、さらに共通部分を見つけ出して真似るのであれば
元の音声から特徴量に変換された時点で残っているものが何かによって完全な権利は主張できないかもしれない 杉田とかが企画で有名声優の声帯模写やってたりするが
実力ある声優なら、他の人の演技コピーしちゃうのはある程度できるみたいだよな
ただ、有名声優はその芸風をゼロからつくったってのがすごいんだろうね >>41
今のうちにローカルにダウンロードしとかないとな そういえば形態模写って大昔からあるけど
落語家とか動物真似してたからなw >>51
ここに銀行のソースコード流したアニオタいたよな
やばいやつが集まりがち 一切違和感ないAI音声が可能になったら純粋にそのキャラクターの声として聴けるからいいね
声優はいらない >>71
不倫とか不祥事起こさないしな
アニメを作る側としても見る側としても最高の人材
>>64
百度网盘に上げられている声優音声の学習データ(训练模型)を落とすには百度垢が必須
作り方は上で書いてる コエフォントはもう日本にあるけどね
ひろゆきおしゃべりメーカーで話題になった >>71
結局ひな形の存在は絶対不可欠だとは思うけどな
藤田咲のような存在になってしまう可能性もあるし
演技のひな形をどうするかという問題もつきまとう 商利用するなら、むしろ特徴を徹底的に平均化して「聞きやすいけど誰とも似てない声で朗読」の方向へ行った方がよさげな
とりあえず無個性でいいから人畜無害な声で朗読音声出力してくれる、声のいらすと屋さん状態 >>79
もうそれはすでにNHKがTVニュースでやってるからな
あと電話アンケートとか >>80
ああ、やさしいにほんごのニュースか
あったな 蒐集した音声をAIで合成したものだったら
別に問題ないと思うが 今日はこれにかかりっきりだったわ。
マジでヤバイ代物だと思う >>32
キャスターは顔採用だからな
Vtuber的な路線を一般層が受け入れるかどうかだな アニメの吹き替えできなくなったら声優なんてただのブスで歌が下手なアイドル崩れの何かでしかないな これでまたDTM(デスクトップアニメ)の夢に近付いたな 絵描きのときもだがこれで廃業がどうだのは話が飛躍しすぎ まだまだブレイクスルーが必要だろうけど
今後に夢を感じさせてくれる進捗具合だとは思う
AI技術者の方々頑張ってー
vits模型で検索すれば配布されてるデータセットが結構出てくるね
ウマ娘
トウカイテイオー
ハルウララ
マチカネフクキタル
マチカネタンホイザ
パスワード wzsq
https://pan.baidu.com/s/1RsC-3WJfbv3pn7egGepcMA?pwd=wzsq マジでボイチェン来たらVtuber業界に革命起きるんじゃね
おっさんだけで完結してしまう 絵師→AI
アニメーター→AI
声優→AI
3DCG→AI
日本終了wwwwwww アニメやオタクという
女性を性的搾取するネトウヨ産業がAIによって滅ぼされて素晴らしいことだ 女声優はアイドル要素のが大事だからなんの問題もないだろ
むしろアイドル化を加速するだけの材料でしかないな ド下手くそな芸能人を名前と声質だけ使ってAIさんに演技含めた実演はやってもらうことも?
>>107
新浪微博
百度贴吧(中国版5ch)
哔哩哔哩 中国から来て大阪在住三年目くらいの人がこんな感じで可愛かった 別に今でもリアルな音声合成は出来るけど合成音声としか使われてないんだから世界なんて変わらんよ
百度アカウント作成後について
アプリでログインしてこの画面になれば成功
https://i.imgur.com/MQQUBga.jpg megaあたりにミラーでもしないと人集まらんでしょ 絵のAIもそうだけど、元ネタを弄って生成したAI音声の著作権(?)ってどうなるんだろうな。 >>116
元データの改竄とかじゃないからどうにもならんらしいよ
勿論明確に○○(声優名やキャラ名)と関連付けたらアウトみたいだが 改造GUIをさらに俺仕様に
https://i.imgur.com/j87es7j.jpg
・デフォルトCtrl+2で[JA][JA]追加されるけど文の前後に追加したいボタン
・Ctrl+↑↓で↑↓が簡単に挿入できる機能
・zero no tsukaimaのconfig.jsonで青野武を島田敏って書いてたミス修正(他にもあるかも)
https://uploader.cc/s/phiwh3oeu2tkz2we5jyoaf718b85l84wwzf6jdy84etz394v28g97togho5ehx6p.zip のぶ代オンリーでいい
ドラえもんverのぶ代作ってくれ >>119
[JA]ってコマンドを普通に読み上げ始めるのは何がいけないんだろう ライスシャワーもそうだったけどモデルが削除されたりダウンロード出来なくなるのはしょっちゅうだから気になったのがあったら即ダウンロードがいい >>124
Twitterでも取り上げるやつ出てきたしそろそろ規制される可能性出てきたから手に入れるなら尚更そうやな つーか今のネットの情報って半分以上がダークウェブみたいな話あるけど
そっちでもやってるんじゃね >>125
日本に規制できるほどの権力があればいいんだけどね…
今の日本じゃ海外でやられたら太刀打ちできないからやられたい放題になりそう 収益化も禁止されてるしそれ以前に色々問題あるから個人で楽しむくらいが一番いいな >>128
このまま広まれば国内はなんか措置は取るだろうね、海外はまぁ無理だろうな… >>100
AIは悪事もしないしミスも無いのに
人間の悪意の操作で犯罪に使われ
人間のミスでのらキャットおじになる プリコネ3人のAI結構学習されてて結構台詞作れるな 日本語と中国語混ざってて違和感しか感じないが成長したらまた変わるんかな 日本でも結構前からYouTubeとかニコニコにちょいちょいVITS使った合成音声動画上がってるんだけど全然再生されてないんだよね、知名度の問題なんだろうけど >>102
あとはシナリオだな
シナリオなんてある程度パターン決まってるから
めちゃくちゃ学習させればなんとかなるかな >>136
青空文庫辺りから勝手にアニメ化とかしたら怒られたりするのかな?
いらすとやとずんだもんの動画とかあるし行けるのかな 絵もAI、声もAI、シナリオもAIで完全にAIのみでエロゲが作れるじゃないか よくわからんが、人工無能チャットみたいに会話でキャバクラ出来るかも知れんのか! 流石にここまで来ると面白いな
俺もgtx1060でもうゲームやらないから放置してたけど、来年rtx4060出たら買い替えるわ
>>121
小度音箱 apkでググって出てきたapkをインスコする
データセット消えるの早いみたい
中国で批判のネット記事が出てるから多分製作者が自主的に消してる
↑で貼ったのが消えてたらすまんな
なかよし部のデータセットはもう消されてた
此链接分享内容可能因为涉及侵权、色情、反动、低俗等信息,无法访问!
>>141
零基础炼丹秘籍 - 为自己喜爱的角色训练TTS(文字转语音)模型
TTS (text to speech) model for your favorite character
https://www.bilibili.com/read/mobile?id=17826415
マギレコデータセット以外消されました
ラブ虹9人のデータセット(汉语版)、訓練中
基于vits的LoveLive!虹咲学园学园偶像同好会!9人中日双语模型 试做版
https://www.bilibili.com/video/BV1c14y1V7DA/ Voicetockのモデルだと音声から音声の変換できないっぽいんだけどなんでだろ
わかる人いる? バカにしてたポリコレ欧米と表現規制中国にAIで
オタク文化土台から破壊されてんのカタルシス半端ねぇなあ!これ ユーチューブで無料で使える読み上げエンジン欲しかったんだよな
これでいいわ 絵は著作権とかあるから絵描きがキレてたけど
声質は権利とかなさそうだしキレる要素無さそう 釘宮のデータセットが入っているのはこれだね
GitHub - CjangCjengh-MoeGoe- Executable file for VITS inference
https://github.com/CjangCjengh/MoeGoe >>158
これチノちゃんはどこのデータセットや? >>162
多分Moe TTSか>>160のMoeGoe
Moe TTS And Voice Conversion Using VITS Model
https://huggingface.co/spaces/skytnt/moe-tts アクションゲームの簡単なボイスならもうこれで行けるじゃん 中国人がチューニングしているせいかなんか中国語訛り AI関係ないけど100年後に日本や日本語が残ってるとしても
日本語の発音自体が中国語寄りになってるとかありそう >>168
DMCAで消えるかもな、2890のモデルってローカルにダウンロードできないの? ローカルで出力するとデモで作るのに比べて大幅にクオリティ下がっちゃうんだけどなんで😭 >>169
MOEGOE開発者のCjangCjenghにに聞いてみて
CjangCjengh
https://space.bilibili.com/35285881 ジャップ「AI音声には魂がない!!」
こうして技術とデータは海外へ 上で貼ってる用VITS神经网络模型は中国声優のデータセットだね VITSならボイチェンできると思うんだけどこれ作ってる人が音声合成しか興味ない感じなのかな 同じく上で貼ってるMoe TTSはエロゲ声優狙い撃ちだね 同じ条件でも合成のたびにイントネーション変わるから、ほぼ日本語の部分を繋げればまじで違和感ない感じになるよ。 Config FileとModelだけダウンロードすればええんか? 自主的に消してるの?管理者か誰かに消されてんのかな?
絵と違って、声はその人のパーソナリティそのものだから
今の仕様だと、喋らせる内容がひどくなるほど、学習元の人個人を貶めてる感が強い。
中国人が自粛・通報するレベルなんだから、
法的に問題がなくても、生理的・感情的な拒否感の方で
今のままだと流行らないだろうな。
せめてTwitterで気軽に投稿できるレベルまで落とし込まないと。
中国で批判のネット記事が出てるので、製作者が自主的に消してる可能性もある
中国声優のデータセットもバラまかれているのでまぁ残当
在宣传时完全不提原来的声优,是否存在侵权风险?
https://www.v2ex.com/t/885347
音声・画像・動画問わず
今はネットだけで議論されている段階で、法整備もこれからだから落ち着くまで今後もこういうのは続くと思う 10年以上前の棒読みちゃんで情報止まってたがこれはすごいな まあ前からbaiduは消されがちだから
githubが消えると終了しそうだけど >>168
声優の声って著作物でもないしそいつら何かできるのか?
音声そのまま使ってるわけじゃないから法的には何もできん思うぞ 声から明らかに本人特定できる場合に卑猥なこと喋らせて公開したら名誉毀損とか何らかの問題にはなりそう。
法律上も未知の分野で条文が十分に対応できてないからどういう処理がされるのか未知数
現状
音声のデータセット作ってるのは個人だから、規制は不可能だと思うね
次々とgithubに公開されるデータセットの作成者一人一人をいちいち見つけ出して当該国まで行って訴訟を起こすのか? これって日本の法律だと勝手に学習素材にしていいってなってるから
海外の人は積極的にノーリスクで日本の著作物を学習素材にできる
つまり日本がどんどんパクられていってる マジで日本の法律馬鹿すぎる
どんどん日本の著作物パクっていいよ!って海外に向けて発信してるようなもんだぞ
まずイラストがターゲットにされた
次は音声
>>193
対処法書いてあるからDISBOARD概要欄読んで これから先声優といえば同人音声限定の職業になるんだな
ボサっとしてたら法律、建築、医療とか他の分野もAIに捲られそう
CjangCjengh氏に色々取材しようと思ってテンセントQQのMOEGOE開発グループ覗いてみたが、満員(全508人、内モデレータ8人)で入れませんでした
メンバーのプロフィール見たら清華大学学生とか普通に居て草なんだ
https://i.imgur.com/vVGD4Pt.jpg
https://i.imgur.com/djqeaAV.jpg
https://i.imgur.com/LazZpbq.jpg
あと第2鯖も埋まってて第3鯖が出来ていたので、最低でも1000人以上いる
Cjang Cjengh氏自身も機械工学系の上海交大出身
エリート集団が正に"人海戦術"で開発してる 死んだ声優のアニメもう一度作れんじゃね
まつらいさんとか 2800人モデル、ソシャゲがベースのだとボイスデータ豊富なのか結構使える
マギレコは断然こっちのほうがいいよ
腾讯群聊(テンセントグループチャト)見る限りだと
今年7月から開発開始したっぽい?
MOEGOEの中身すげぇ
IPA対応してるじゃん
('A', 'ei˥'),
('B', 'biː˥'),
('C', 'siː˥'),
('D', 'tiː˥'),
('E', 'iː˥'),
('F', 'e˥fuː˨˩'),
('G', 'tsiː˥'),
('H', 'ɪk̚˥tsʰyː˨˩'),
('I', 'ɐi˥'),
('J', 'tsei˥'),
('K', 'kʰei˥'),
('L', 'e˥llou˨˩'),
('M', 'ɛːm˥'),
('N', 'ɛːn˥'),
('O', 'ou˥'),
('P', 'pʰiː˥'),
('Q', 'kʰiːu˥'),
('R', 'aː˥lou˨˩'),
('S', 'ɛː˥siː˨˩'),
('T', 'tʰiː˥'),
('U', 'juː˥'),
('V', 'wiː˥'),
('W', 'tʊk̚˥piː˥juː˥'),
('X', 'ɪk̚˥siː˨˩'),
('Y', 'waːi˥'),
('Z', 'iː˨sɛːt̚˥') AIイラストは学習対象が広いから特定の絵師には大して似ないし
寄せるためにデータを集中学習させたものもほぼ使いものにならんからな
アングラでデータが流行ったところでなんだってのはある
特定声優に成りすませるデータが表で拡散していたらそりゃまあ問題視されるだろう これもうパソコンに
異世界
ラブコメ
ハーレム
とか入力したらワンクールのアニメが出力されそう
MoeGoe-masterの中身見てる
35万行もあるファイル出てきたけど、データセットは入ってないっぽい?
あー
2980名のデータセット本体はテンセントのグループに入ってないと入手できないかもしれないですね 鄧 晟鉉ってtwitterに居るやつかと思ったら嫌儲民だったのか。
やはりMoeGoe-masterの中身にデータセットらしき物は見当たらなかった
多分この認識で合ってると思う こういうアニメ系の声で中国語喋るとめちゃくちゃ可愛いな キリコが悪いとは言わんが、いつか富山敬さんで銀英伝外伝を吹き替え直してくれ 鄧 晟鉉さん いつも情報提供ありがとうございます
テンセントが関わってたの?
企業がこんなモラルの欠けたことに関わってていいのか…
部分的に関わってたのか
がっつりプロジェクトに関わってたのかって分かりますか?
>>218
腾讯qqは中国版discordみたいなものです
個人が色んなサーバー立ててグループでチャットやファイル共有できるしモデレータも設定できる >>219
ありがとうございます、
なるほど、テンセントのチャットツールを使ってやり取りしていたってだけか
早とちりして申し訳ない Huggingfaceのデモでエラーが出るの治して欲しい >>218
別にモラルは欠けてないだろ。
AIで怒り狂ってた絵師みたいな事言いだすなよ笑 アニメに限らず本人の声色での吹き替え需要は大きいだろうな んで遺族にリベート行く様にしたら、みんなこぞって有名声優にしようとする
この流れ出来たらすごいでー
ワイビジネスセンス有り過ぎ
才能が怖い 前言撤回
2980名分のデータセットの場所はこちらでした
https://github.com/CjangCjengh/TTSModels#voistock
Japanese & English & Korean & Chinese
↓
Voistockの箇所 もうデータ全部入ったやつ誰か配布してくれよ
どうせ全部DL済みの奴いるんやろ? これGIGAZINEあたりがまとめてくれないのかな
だれかタレコミしてよ >>229
これの開発開始時期は7月でもう4ヶ月経ってる
中国で騒がれまくったあとに華僑経由でワシのところに情報が入ってきたので
日本で情報が出揃うのは2ヶ月遅れくらいだと思う これモデルは自作できないの?
自分で作るなら何word位必要なんだろう ゼロベースはしんどそうだから2800モデルに追加学習させたいなあ これ一人でやるのは無理だな
グループで集まって交代でやるものだね
零基础炼丹秘籍 - 为自己喜爱的角色训练TTS(文字转语音)模型
TTS (text to speech) model for your favorite character
https://www.bilibili.com/read/mobile?id=17826415 moegoe guiに日本人のコメントあるけどこれモメン? ドラえもん(大山のぶ代)のモデルが水田わさびに聞こえる
ジャングル黒べえや冬月副司令や大槻班長のモデルも謎のショタ声だし、所々間違いあるね 日本語を喋らせても微妙に中国訛りぽくなってるのが面白いな pthとjsonって両方pythonに紐づけでええんよな?
文字入れてクリーンアップしても"操作可能なプログラムまたはバッチ ファイルとして認識されていません。"って出てくるわ ローカル版落としたけどTTSは出来るけどボイスチェンジャーができない……
ボイチェンを試行するとTTSも出来なくなっちゃう シンボリックを使えば自然にいけそうだな
ってか160メガしかないのがやばい https://huggingface.co/spaces/skytnt/moe-tts
ここのsoft voice conversionタブで一応出来るけどバリエーションが少ねえ…
voice conversionタブはバリエーション多いけどオリジナルスピーカー選ばないといけないから使える音源が限られるのかエラーばっか なんでAI関連ってチノちゃんの再現度異様に高いんだろw 日本語化版moegoe
話し手を選択しているのに「話し手を選択してください」と出る
どうすれば? >>250
ワシだってダウンロードしてなかったんだよ
ミラーまで消えてるのでどうにもならない
一応モデルの開発者にもっかい上げてくれってメッセ送ったから返信待ち
返信なけりゃ自分たちで作るしかない >>242
管理者で実行していますが保存ができません
どうすれば? >>252
管理者実行してないけど保存できているよ ディレクトリのパス名に漢字ひらがな入っていても正常に動作しますか? ダウンロードフォルダとC:フォルダでは動作したけどドキュメントフォルダでは動作しなかった フォルダ名を1にしてC:\Users\Desktopに移して管理者で実行しても保存ができませんでした 一度エラー出ると再起しなきゃいけないのっておま環?
なかなかめんどい アニメ化してないマンガやラノベの台詞を読ませるのが楽しい MoeGoeダウンロードして
https://github.com/CjangCjengh/MoeGoe/releases/tag/v3.0.0
MoeGoe_GUIダウンロードして
https://github.com/CjangCjengh/MoeGoe_GUI/releases/tag/v3.0.0
ここのリンクからモデルとコンフィグファイルをセットでダウンロードして
https://github.com/CjangCjengh/TTSModels
MoeGoe_GUI.exeを起動、MoeGoe.exeの位置とモデル(模型pth)、コンフィグ(配置・json)を指定したら
文本に文章入れて正規表現に変換できたら下のプルダウンメニューからキャラ名選んで保存ボタンで保存 Vtuber版も作れそうだな
生配信やらボイスが豊富だしな >>261
[JA]んっ...んっ...んっ...んっ...んっ...[JA]
キスしてるように聞こえるゾ 非常に申し訳ないが
誰か
moegoe起動してモデルとコンフィグファイルをセットして話して選んで保存押すところまで動画で撮ってあげてくれないか? >>41
言うてこういうの使いたがるの倫理観無視の同人とか個人制作の動画とかだろ
別に読み上げるだけなら専用のソフト使えばいいだけだし 日本語喋らせると中国訛りが激しいのは中国語のイントネーションを優先してるのか >>271
第一弾のうるさいですねえの面倒くさそうな感じってどうやって車べせた?
不愉快そうな感じが難しい 保存するときのexplorerの画面の下の方の
ファイルの種類(T) 音频文件(*wav)
これがワシの環境だと何故か表示されないみたい
(*wav)の表示がない シンボリック入力を駆使すればなんとかなりそう?
[JA]そ-う-だ-よ-...[JA]
[JA]おまえ、さっきおらきがえてるときちらちらみてただろ、うそつけぜったいみてたぞ[JA]
[JA]みたけりゃみせてやるよ[JA] やっぱりこういうのは権利関係の常識や良心が無いチャイナが強いわ 嫌儲ディスコのAI板でbaiduのウマ娘・プリコネ・マギレコデータセット持ってる方がいらしたので
再配布するそうです >>284
2980人の方にウマ娘いるけど何か違うの? >>285
なんだそうだったのか
あんな流暢に出せるのかと思ったわ [JA]いれてもじぇーえーって読み上げるだけなんだがなんでなん(・x・) >>286
作った人が違う
少人数分のモデルデータのほうが品質が高いようだ 半角だけどなぁ
>>281のやつコピペしてもじぇーえー読み上げる >>292
なんでかわからんけどToLOVEるとルイズの方はJAなしで日本語いけるけど2980人の方はJAないとだめだった >>290
イントネーションがどうしても中国語風になっちゃうね 日本語設定しかないのは[JA]いれても意味ないんじゃないかい? /N/ は撥音(「ん」)
/Q/ は促音(「っ」)
長音は -
↑ ↓ でアクセント あやねるのDeepfakeが完全体になって出てきそう >>195
reCAPTCHAの認証がそもそも出ないんだよね
DMで送られてくるだろ >>279
それ初めて見た
ちなワイは[JA]あほ[JA]で文字を囲んでも、
そのあと声を選んでから変換?で a↑ho とかなるはずだが、そいつができないでいる
[clear]になる
■■ズ単体のではできたのに2000人のができないから何か問題あるので歯とは思うが
.pthと.jsonは一緒のフォルダに入れておかないとあかんのかなぁ これ生成時CPU使ってるのかな?
AIイラスト生成でグラボ買い替えたけどCPUも買い替えた方が良さそう ちなみにtor使ってる!分割でテスト中!(イキッ
の奴さ、yelpとかいうやつ
それやると無能な働き者が分割ファイルにミスがあったりであとで修正あとで修正の繰り返しになってクソ時間ドブになるから
やらんでいいで 分割はまぁいいや
それよりも、清理文本から清理を押すと
操作可能なプログラムまたはバッチファイルとして認識されませんになるんだよな
清理本文を押さなくても保存はできるのはわかったが、
402のは[JA]いれても入れなくても保存ができない
というか入れないときは右側にエラーコード吐くな
全バージョン試すのは面倒だ
やめだやめだ ディスコでウマ頂いたけどこっちの方が全然再現度高いね >>312
本人きちゃった感じですか?
ワイは自分を有能なんて一言も書いてないけどなぁ
無能ワイちゃんやで
それとワイが他の奴を無能呼ばわりするとは話は別や
これ、詭弁やで
ワイには詭弁はきかんよーwwwwwwwwwwww 繰り返しておくと、無駄に分割すると
今度は結合の仕方が分かりませんとかいう輩が出てくるのがまず1つと、
調子乗ってアップするも抜けがあったりそのまま音信普通だったり待たせようとする輩が出てくる
むしろこれらのせいで効率性が下がる、ワイらの時間は有限なんやで
しかもいま一般的に普及している回線速度から考えてもそこまでする必要性はない シンボリックってどうやって使うんだ
プロのひと教えて >>317
とりあえず記号を入れまくって聞きまくるしかない 読んでくれなくはないけど
濁音とか半濁音の認識が低い気がする イントネーションおかしいからテキストからの合成は諦めて、同人音声をボイスチェンジャーしてみようと思ったら、これ元音声の声優もリスト内から選ぶ必要あるのか >>321
俺は本名を名乗らせてからエロいことばかり言わせて爆笑してるわw
うpしたら訴えられそう オスマン青野さんじゃなくて島田さんなのか
ブロリーMADには使えそうだけど >>322
これ自分の声の録音からでもやらせてほしいよな
どうにかしたらできないのかな せっかくの素晴らしい技術なのにえっちなセリフ作るセンスがなかった え?どういうこと?
シンギュラリティはじまったってこと? 昔、嫁コレって架空の設定で版権キャラとイチャイチャできるボイスを聴けるアプリがあって結構費やしてたんだが
同じようなことを自作でできるの素晴らしいよ >>332
保存してた膨大なデータが生かせるのか
じょしらくのボイス欲しいんだよなあ >>330
パラメータを上から
1.0
0.2
0.2
くらいにすると作りやすい
記号らしきものを挟むと色々捗るけど説明が殆どないので試行錯誤が必要 >>333
じょしらくは持ってなかった気がするけどサ終する前に持ってたキャラのボイスデータは抽出してこっそり保存してるから追加学習とか自前でできるんなら再利用したいわ エロボイス作り放題な上にシチュエーションも自由だから
マジで抜ける、中国っぽい感じをどう隠せるかがコツかな? マジで第一の難所は恥ずかしさだな
誰かに見られてるわけでもないけど変なセリフを入力するのは結構恥ずかしい 記号使ったら文章内で急に読む速度が速くなったりするのとかも防げたりするん? >>338
イントネーション中国人ぽい単語の一字をひらがな→カタカナにしたり漢字にしたりするとよくなる場合あるで >>340
この文字言えてないなと思ったら↑とか↓でアクセントつけるかな これ有効活用できない?
('A', 'ei˥'),
('B', 'biː˥'),
('C', 'siː˥'),
('D', 'tiː˥'),
('E', 'iː˥'),
('F', 'e˥fuː˨˩'),
('G', 'tsiː˥'),
('H', 'ɪk̚˥tsʰyː˨˩'),
('I', 'ɐi˥'),
('J', 'tsei˥'),
('K', 'kʰei˥'),
('L', 'e˥llou˨˩'),
('M', 'ɛːm˥'),
('N', 'ɛːn˥'),
('O', 'ou˥'),
('P', 'pʰiː˥'),
('Q', 'kʰiːu˥'),
('R', 'aː˥lou˨˩'),
('S', 'ɛː˥siː˨˩'),
('T', 'tʰiː˥'),
('U', 'juː˥'),
('V', 'wiː˥'),
('W', 'tʊk̚˥piː˥juː˥'),
('X', 'ɪk̚˥siː˨˩'),
('Y', 'waːi˥'),
('Z', 'iː˨sɛːt̚˥') 実際の声優の声まんまだと問題になりそうだけど
声ちょっといじったらどうしようもなくね? >>345
ワイも、出力ちょっと弄ればいいのに、と思ったけど
AI絵のようにそれっぽい別物を作りたいんじゃなくて、
オタクたちは「あの人のあの声」「そのもの」が欲しいんだろうな
この辺、AI絵師の流れとちょっと違うな パラメータの上は言う速度(上げれば上げるほど遅くなる)
真ん中と下は下げれば下げるほどピッチの上がり下がりが低くなる
(低くし過ぎると謎の電子音が出たりする、中国感がなくなる?) ボイロボイボみたく簡単に調整出来る様になればいいのにな GUI版、保存前にプレビュー出来るとええんだけどな ↑↓~以外のシンボリックの使い方誰かわかる?
変化が感じ取れない >>351
一度は保存するけど、微調整はテキスト編集後に左下の再生成した後に再生でプレビューできない?気に入らんかったら削除ボタン押せば残らんし。 >>352
「.」は言葉を区切る、連続で使用可能
「-」はゆっくり言うのに適している 例:「だ-い-す-き」
「!」は強調して言う、「?」は疑問符、「!?」のようにすれば驚く感じに
前のレスであったけど、カタカナに変えるのも効果アリ?
でもまだ細かい所は分からない、1文字ずつ音程とかを変えるやつがないので難しい
毎回ちょっと音声の出し方が違うので現状ガチャりつつ調整するしかない? 音程調節機能と特定の部分だけ再生成する機能ほしいよなぁ AIはともかくMoeGoeはまだ手加えられる要素多そうではある 水瀬いのりとか特徴ある声はほぼ完璧やね
少女終末旅行のチトを再現できてる ずっと2千人の方でやっていてクオリティ低いなぁと思ってたけど、知らないエロゲ絵の少人数の方でやったら滅茶苦茶クオリティ高くてビビった
なんで学習素材の多いはずの有名声優の方が精度低いんだ ウマ娘も少人数のデータセットのほうがクオリティ高いみたいね 流石に声優の声再現するのは
個人の趣味以外だと問題出てくるのでは 感情のパラメータ指定できるね
nene-emotion
https://huggingface.co/spaces/innnky/nene-emotion
↓
「使用情感样本id作为情感参数」→「情感样本ID」 このスレのおかげでmoegoe導入できたわサンクス
イントネーションの調整ってどうしてる?矢印で変化はするけど思ったようになかなかならん でもこれまたオタクがファビョーンして動画なんかじゃ使いづらくするんだろ?
どんな用途があるん? 誰が演じているのかを重視する人間が一定数いるからな
機械音声1とするのではなく、バーチャル声優として絵と名前と人格を与えてアイドル売りするのがいい >>359
そりゃゲームのほうが音声素材が多いからだろう
2000人以上のモデルの奴もベースがソシャゲで、それのメイン級に出番あるようなキャラだと結構いい感じになるよ
ゲームもなにも出てないからアニメから切り取ったような声しかないのはそれ相応でやっぱりノイズも出る 同じゲームのキャラでも使えるやつと使えないやつの差が激しいね 2800人のやつ、ちょいちょいターゲット設定して音声作ろうとするとまた話し相手を選んでくださいってjsonファイル再指定させられて作れないな。
これはjsonファイルの記述ミスなのかなあ 結局これってVITSを使ってるんだよな?
VITSなら一年前からシャニマスで全員分やってるやついたし驚くの遅くね? 全盛期若本規夫ボイスとかも生成できるのかな
もう80近いおじいちゃんだからコーチみたいなイケボまた聞きたい >>373
AI絵で完全にモラル吹っ飛んだんだなって方が驚きかな。技術自体はその通りで昔から出来た訳だし >>373
日本の音声合成界隈はVITSが出た辺りからモラル気にしてそういうの表に出さないように慎重になってたからな
実際それやってたの日本人もいたけど海外の人間がやってたイメージがある
データ集めるの大変でプログラム動かす敷居も高くて一般には手が届かなかったけどモデルばら撒き始めたから騒がれてるのかな >>87
息継ぎなんか大してすごくないよ
吸気音をそれっぽく差し込むだけだし HuBERT-VITSのsoftVC声の相性が良ければ綺麗に聞こえるけどなかなか上手く行かんね 2800のモデル微妙に更新入ったようだが中華の発音修正だけかな >>375
ブレンドSのキャラとか選ぶと何回も出てくる
でも今さっきもう一度選び直したら作れたわ
何が原因なんだろう 単語の変なところで変な間が開く時ってそこに「-」付けても何もかわらんよな?
結局関係ない場所に記号つけ足して繋げて発音されまで探って行く感じになるわ 機械音声っぽい違和感はいつまで経っても消えないのな moegoe開発者グループと連絡付くので
バグの詳しい内容抽出してリストや画像とかにしてくれたらメッセージ送れます とりあえずGUI
・中国語・韓国語がうまく再生できない
・音声変換ができない
・保存前にプレビュー再生できるように
こんなところかな いちいち同人声優を雇いたくない同人エロゲ製作者の強い武器になるかな >>391
あとは、テキスト欄に入力しなくてもチェックを入れるだけで言語を選べるようにして欲しい >>392
同人声優に金払う方が時間もコストもかからんぞ多分 >>392
権利的にもアレだしガチャ外れたら調整がめんどくさすぎる
普通に商用利用できるフリーのTTSでも使った方が全然マシ 催眠音声とかの同人音声
台本.txtも同梱してくれてる場合あるけどあれ使えば好きな声優の声で聞けるのか >>390
自分も確かに話相手選んでてもバグってこうなることはちょいちょいあるので一応報告しとく、一度この状態になるとモデルから選び直してもキャラ切り替えてたらまた再発したりする
一旦ソフト再起動すると直るみたいだけど…キャラ切り替え頻繁にやるのが処理追いついてないとかかなあとは思ってる、まあ参考までに
ちなみにファイルパス隠してるが日本語フォルダにはなってない、画像は以前の改造版だけど通常版でも同じことになったのは確認した
https://i.imgur.com/xVy4PD2.jpg >>398
あ、たまに押してたかも…それがあかんかったのか 更新版やったけど
データ量少なすぎて酷い出来になってるキャラがいるなあ
まあ更新されると思うけど Enter押さないようにしたら起こらなくなったわ、失礼した 誰かが(多分ここ)で改造してくれたGUI使って(3.0)
これで2800人?を試しているのだが、
右側の画面に処理結果が表示されるわけだけれどなにも表示されない
当然ファイルも保存されない
普通にJAいれてこんにちは入れて、話してきめて、保存しただけなのに
これはどうしてなの?
ルイズだけとかまどマギだけとかウマとかこれらまとまったやつはすんなり右側の画面にも処理結果表示されるのに
PCの処理速度というかグラボ(AIはグラボによってスピード変わるよね)によって変わるのかね?
でもそれだったら例えばルイズだけのセットを使ってすんなり処理完了するのはおかしいのよな
単純にJSONファイルも大きいしエポックのファイル容量は少ないだろうけれど、
数が多すぎるからそれで時間かかってるって認識でいいのだろうか
結局ローカルでは何も動かん
動かんというより右の画面に表示されない
同じような症状の人おるか?
ちなみにクリーンアップはやってない。調整の時に使うものだと思ってるから
ええ方法教えてクレメンス ちなみにだけど改造されていないGUIでも右側表示は一向に表示されない
右側表示ってのは処理のやつね、最後サクセスってでるやつ
フォルダ名とか長くなるとこまるから
短いフォルダ名にしてpthとjsonいれてる(この2つは改名してない)
やはりPC処理速度で表示が遅かったりするのかな
だとすると2800人だかのファイルを
うまいこと分割というかお気に入りのキャラだけを抜き出すことってできないのだろうか
だったら動きそうな予感がするのだが
ワイの環境では他は動いているわけだし >>404
ええっ、右にサクセス表示でて
それで作成されると思ってた
で、そのあと保存のパスいれる↓にある再生とかで試して聞いてる
ずっと確かめてて何が原因かわからないんだよな
他のファイルセットで問題なくサクセスなってるのにさ
やはりファイル?データ量が多すぎてついていけてないのかなぁ
だとするとやはり2800人のファイルを分割できればいいのだが、
そんなことできるのかどうか 俺もログ表示されないけどちゃんと出力できてる
キャラ多すぎて見づらいから分割したいよな 追記 自分で自作の学習というかpthとjson
を作るのにいい解説サイトないだろうか
有識者いたら教えてください ■ このスレッドは過去ログ倉庫に格納されています