githubで公開されている音声自動生成AI、日本のアニメキャラ2890名分の音声を学習素材に超速度で進化中★2 [386780362]
■ このスレッドは過去ログ倉庫に格納されています
マジで第一の難所は恥ずかしさだな
誰かに見られてるわけでもないけど変なセリフを入力するのは結構恥ずかしい 記号使ったら文章内で急に読む速度が速くなったりするのとかも防げたりするん? >>338
イントネーション中国人ぽい単語の一字をひらがな→カタカナにしたり漢字にしたりするとよくなる場合あるで >>340
この文字言えてないなと思ったら↑とか↓でアクセントつけるかな これ有効活用できない?
('A', 'ei˥'),
('B', 'biː˥'),
('C', 'siː˥'),
('D', 'tiː˥'),
('E', 'iː˥'),
('F', 'e˥fuː˨˩'),
('G', 'tsiː˥'),
('H', 'ɪk̚˥tsʰyː˨˩'),
('I', 'ɐi˥'),
('J', 'tsei˥'),
('K', 'kʰei˥'),
('L', 'e˥llou˨˩'),
('M', 'ɛːm˥'),
('N', 'ɛːn˥'),
('O', 'ou˥'),
('P', 'pʰiː˥'),
('Q', 'kʰiːu˥'),
('R', 'aː˥lou˨˩'),
('S', 'ɛː˥siː˨˩'),
('T', 'tʰiː˥'),
('U', 'juː˥'),
('V', 'wiː˥'),
('W', 'tʊk̚˥piː˥juː˥'),
('X', 'ɪk̚˥siː˨˩'),
('Y', 'waːi˥'),
('Z', 'iː˨sɛːt̚˥') 実際の声優の声まんまだと問題になりそうだけど
声ちょっといじったらどうしようもなくね? >>345
ワイも、出力ちょっと弄ればいいのに、と思ったけど
AI絵のようにそれっぽい別物を作りたいんじゃなくて、
オタクたちは「あの人のあの声」「そのもの」が欲しいんだろうな
この辺、AI絵師の流れとちょっと違うな パラメータの上は言う速度(上げれば上げるほど遅くなる)
真ん中と下は下げれば下げるほどピッチの上がり下がりが低くなる
(低くし過ぎると謎の電子音が出たりする、中国感がなくなる?) ボイロボイボみたく簡単に調整出来る様になればいいのにな GUI版、保存前にプレビュー出来るとええんだけどな ↑↓~以外のシンボリックの使い方誰かわかる?
変化が感じ取れない >>351
一度は保存するけど、微調整はテキスト編集後に左下の再生成した後に再生でプレビューできない?気に入らんかったら削除ボタン押せば残らんし。 >>352
「.」は言葉を区切る、連続で使用可能
「-」はゆっくり言うのに適している 例:「だ-い-す-き」
「!」は強調して言う、「?」は疑問符、「!?」のようにすれば驚く感じに
前のレスであったけど、カタカナに変えるのも効果アリ?
でもまだ細かい所は分からない、1文字ずつ音程とかを変えるやつがないので難しい
毎回ちょっと音声の出し方が違うので現状ガチャりつつ調整するしかない? 音程調節機能と特定の部分だけ再生成する機能ほしいよなぁ AIはともかくMoeGoeはまだ手加えられる要素多そうではある 水瀬いのりとか特徴ある声はほぼ完璧やね
少女終末旅行のチトを再現できてる ずっと2千人の方でやっていてクオリティ低いなぁと思ってたけど、知らないエロゲ絵の少人数の方でやったら滅茶苦茶クオリティ高くてビビった
なんで学習素材の多いはずの有名声優の方が精度低いんだ ウマ娘も少人数のデータセットのほうがクオリティ高いみたいね 流石に声優の声再現するのは
個人の趣味以外だと問題出てくるのでは 感情のパラメータ指定できるね
nene-emotion
https://huggingface.co/spaces/innnky/nene-emotion
↓
「使用情感样本id作为情感参数」→「情感样本ID」 このスレのおかげでmoegoe導入できたわサンクス
イントネーションの調整ってどうしてる?矢印で変化はするけど思ったようになかなかならん でもこれまたオタクがファビョーンして動画なんかじゃ使いづらくするんだろ?
どんな用途があるん? 誰が演じているのかを重視する人間が一定数いるからな
機械音声1とするのではなく、バーチャル声優として絵と名前と人格を与えてアイドル売りするのがいい >>359
そりゃゲームのほうが音声素材が多いからだろう
2000人以上のモデルの奴もベースがソシャゲで、それのメイン級に出番あるようなキャラだと結構いい感じになるよ
ゲームもなにも出てないからアニメから切り取ったような声しかないのはそれ相応でやっぱりノイズも出る 同じゲームのキャラでも使えるやつと使えないやつの差が激しいね 2800人のやつ、ちょいちょいターゲット設定して音声作ろうとするとまた話し相手を選んでくださいってjsonファイル再指定させられて作れないな。
これはjsonファイルの記述ミスなのかなあ 結局これってVITSを使ってるんだよな?
VITSなら一年前からシャニマスで全員分やってるやついたし驚くの遅くね? 全盛期若本規夫ボイスとかも生成できるのかな
もう80近いおじいちゃんだからコーチみたいなイケボまた聞きたい >>373
AI絵で完全にモラル吹っ飛んだんだなって方が驚きかな。技術自体はその通りで昔から出来た訳だし >>373
日本の音声合成界隈はVITSが出た辺りからモラル気にしてそういうの表に出さないように慎重になってたからな
実際それやってたの日本人もいたけど海外の人間がやってたイメージがある
データ集めるの大変でプログラム動かす敷居も高くて一般には手が届かなかったけどモデルばら撒き始めたから騒がれてるのかな >>87
息継ぎなんか大してすごくないよ
吸気音をそれっぽく差し込むだけだし HuBERT-VITSのsoftVC声の相性が良ければ綺麗に聞こえるけどなかなか上手く行かんね 2800のモデル微妙に更新入ったようだが中華の発音修正だけかな >>375
ブレンドSのキャラとか選ぶと何回も出てくる
でも今さっきもう一度選び直したら作れたわ
何が原因なんだろう 単語の変なところで変な間が開く時ってそこに「-」付けても何もかわらんよな?
結局関係ない場所に記号つけ足して繋げて発音されまで探って行く感じになるわ 機械音声っぽい違和感はいつまで経っても消えないのな moegoe開発者グループと連絡付くので
バグの詳しい内容抽出してリストや画像とかにしてくれたらメッセージ送れます とりあえずGUI
・中国語・韓国語がうまく再生できない
・音声変換ができない
・保存前にプレビュー再生できるように
こんなところかな いちいち同人声優を雇いたくない同人エロゲ製作者の強い武器になるかな >>391
あとは、テキスト欄に入力しなくてもチェックを入れるだけで言語を選べるようにして欲しい >>392
同人声優に金払う方が時間もコストもかからんぞ多分 >>392
権利的にもアレだしガチャ外れたら調整がめんどくさすぎる
普通に商用利用できるフリーのTTSでも使った方が全然マシ 催眠音声とかの同人音声
台本.txtも同梱してくれてる場合あるけどあれ使えば好きな声優の声で聞けるのか >>390
自分も確かに話相手選んでてもバグってこうなることはちょいちょいあるので一応報告しとく、一度この状態になるとモデルから選び直してもキャラ切り替えてたらまた再発したりする
一旦ソフト再起動すると直るみたいだけど…キャラ切り替え頻繁にやるのが処理追いついてないとかかなあとは思ってる、まあ参考までに
ちなみにファイルパス隠してるが日本語フォルダにはなってない、画像は以前の改造版だけど通常版でも同じことになったのは確認した
https://i.imgur.com/xVy4PD2.jpg >>398
あ、たまに押してたかも…それがあかんかったのか 更新版やったけど
データ量少なすぎて酷い出来になってるキャラがいるなあ
まあ更新されると思うけど Enter押さないようにしたら起こらなくなったわ、失礼した 誰かが(多分ここ)で改造してくれたGUI使って(3.0)
これで2800人?を試しているのだが、
右側の画面に処理結果が表示されるわけだけれどなにも表示されない
当然ファイルも保存されない
普通にJAいれてこんにちは入れて、話してきめて、保存しただけなのに
これはどうしてなの?
ルイズだけとかまどマギだけとかウマとかこれらまとまったやつはすんなり右側の画面にも処理結果表示されるのに
PCの処理速度というかグラボ(AIはグラボによってスピード変わるよね)によって変わるのかね?
でもそれだったら例えばルイズだけのセットを使ってすんなり処理完了するのはおかしいのよな
単純にJSONファイルも大きいしエポックのファイル容量は少ないだろうけれど、
数が多すぎるからそれで時間かかってるって認識でいいのだろうか
結局ローカルでは何も動かん
動かんというより右の画面に表示されない
同じような症状の人おるか?
ちなみにクリーンアップはやってない。調整の時に使うものだと思ってるから
ええ方法教えてクレメンス ちなみにだけど改造されていないGUIでも右側表示は一向に表示されない
右側表示ってのは処理のやつね、最後サクセスってでるやつ
フォルダ名とか長くなるとこまるから
短いフォルダ名にしてpthとjsonいれてる(この2つは改名してない)
やはりPC処理速度で表示が遅かったりするのかな
だとすると2800人だかのファイルを
うまいこと分割というかお気に入りのキャラだけを抜き出すことってできないのだろうか
だったら動きそうな予感がするのだが
ワイの環境では他は動いているわけだし >>404
ええっ、右にサクセス表示でて
それで作成されると思ってた
で、そのあと保存のパスいれる↓にある再生とかで試して聞いてる
ずっと確かめてて何が原因かわからないんだよな
他のファイルセットで問題なくサクセスなってるのにさ
やはりファイル?データ量が多すぎてついていけてないのかなぁ
だとするとやはり2800人のファイルを分割できればいいのだが、
そんなことできるのかどうか 俺もログ表示されないけどちゃんと出力できてる
キャラ多すぎて見づらいから分割したいよな 追記 自分で自作の学習というかpthとjson
を作るのにいい解説サイトないだろうか
有識者いたら教えてください ■ このスレッドは過去ログ倉庫に格納されています