githubで公開されている音声自動生成AI、日本のアニメキャラ2890名分の音声を学習素材に超速度で進化中★2 [386780362]
■ このスレッドは過去ログ倉庫に格納されています
>>290
イントネーションがどうしても中国語風になっちゃうね 日本語設定しかないのは[JA]いれても意味ないんじゃないかい? /N/ は撥音(「ん」)
/Q/ は促音(「っ」)
長音は -
↑ ↓ でアクセント あやねるのDeepfakeが完全体になって出てきそう >>195
reCAPTCHAの認証がそもそも出ないんだよね
DMで送られてくるだろ >>279
それ初めて見た
ちなワイは[JA]あほ[JA]で文字を囲んでも、
そのあと声を選んでから変換?で a↑ho とかなるはずだが、そいつができないでいる
[clear]になる
■■ズ単体のではできたのに2000人のができないから何か問題あるので歯とは思うが
.pthと.jsonは一緒のフォルダに入れておかないとあかんのかなぁ これ生成時CPU使ってるのかな?
AIイラスト生成でグラボ買い替えたけどCPUも買い替えた方が良さそう ちなみにtor使ってる!分割でテスト中!(イキッ
の奴さ、yelpとかいうやつ
それやると無能な働き者が分割ファイルにミスがあったりであとで修正あとで修正の繰り返しになってクソ時間ドブになるから
やらんでいいで 分割はまぁいいや
それよりも、清理文本から清理を押すと
操作可能なプログラムまたはバッチファイルとして認識されませんになるんだよな
清理本文を押さなくても保存はできるのはわかったが、
402のは[JA]いれても入れなくても保存ができない
というか入れないときは右側にエラーコード吐くな
全バージョン試すのは面倒だ
やめだやめだ ディスコでウマ頂いたけどこっちの方が全然再現度高いね >>312
本人きちゃった感じですか?
ワイは自分を有能なんて一言も書いてないけどなぁ
無能ワイちゃんやで
それとワイが他の奴を無能呼ばわりするとは話は別や
これ、詭弁やで
ワイには詭弁はきかんよーwwwwwwwwwwww 繰り返しておくと、無駄に分割すると
今度は結合の仕方が分かりませんとかいう輩が出てくるのがまず1つと、
調子乗ってアップするも抜けがあったりそのまま音信普通だったり待たせようとする輩が出てくる
むしろこれらのせいで効率性が下がる、ワイらの時間は有限なんやで
しかもいま一般的に普及している回線速度から考えてもそこまでする必要性はない シンボリックってどうやって使うんだ
プロのひと教えて >>317
とりあえず記号を入れまくって聞きまくるしかない 読んでくれなくはないけど
濁音とか半濁音の認識が低い気がする イントネーションおかしいからテキストからの合成は諦めて、同人音声をボイスチェンジャーしてみようと思ったら、これ元音声の声優もリスト内から選ぶ必要あるのか >>321
俺は本名を名乗らせてからエロいことばかり言わせて爆笑してるわw
うpしたら訴えられそう オスマン青野さんじゃなくて島田さんなのか
ブロリーMADには使えそうだけど >>322
これ自分の声の録音からでもやらせてほしいよな
どうにかしたらできないのかな せっかくの素晴らしい技術なのにえっちなセリフ作るセンスがなかった え?どういうこと?
シンギュラリティはじまったってこと? 昔、嫁コレって架空の設定で版権キャラとイチャイチャできるボイスを聴けるアプリがあって結構費やしてたんだが
同じようなことを自作でできるの素晴らしいよ >>332
保存してた膨大なデータが生かせるのか
じょしらくのボイス欲しいんだよなあ >>330
パラメータを上から
1.0
0.2
0.2
くらいにすると作りやすい
記号らしきものを挟むと色々捗るけど説明が殆どないので試行錯誤が必要 >>333
じょしらくは持ってなかった気がするけどサ終する前に持ってたキャラのボイスデータは抽出してこっそり保存してるから追加学習とか自前でできるんなら再利用したいわ エロボイス作り放題な上にシチュエーションも自由だから
マジで抜ける、中国っぽい感じをどう隠せるかがコツかな? マジで第一の難所は恥ずかしさだな
誰かに見られてるわけでもないけど変なセリフを入力するのは結構恥ずかしい 記号使ったら文章内で急に読む速度が速くなったりするのとかも防げたりするん? >>338
イントネーション中国人ぽい単語の一字をひらがな→カタカナにしたり漢字にしたりするとよくなる場合あるで >>340
この文字言えてないなと思ったら↑とか↓でアクセントつけるかな これ有効活用できない?
('A', 'ei˥'),
('B', 'biː˥'),
('C', 'siː˥'),
('D', 'tiː˥'),
('E', 'iː˥'),
('F', 'e˥fuː˨˩'),
('G', 'tsiː˥'),
('H', 'ɪk̚˥tsʰyː˨˩'),
('I', 'ɐi˥'),
('J', 'tsei˥'),
('K', 'kʰei˥'),
('L', 'e˥llou˨˩'),
('M', 'ɛːm˥'),
('N', 'ɛːn˥'),
('O', 'ou˥'),
('P', 'pʰiː˥'),
('Q', 'kʰiːu˥'),
('R', 'aː˥lou˨˩'),
('S', 'ɛː˥siː˨˩'),
('T', 'tʰiː˥'),
('U', 'juː˥'),
('V', 'wiː˥'),
('W', 'tʊk̚˥piː˥juː˥'),
('X', 'ɪk̚˥siː˨˩'),
('Y', 'waːi˥'),
('Z', 'iː˨sɛːt̚˥') 実際の声優の声まんまだと問題になりそうだけど
声ちょっといじったらどうしようもなくね? >>345
ワイも、出力ちょっと弄ればいいのに、と思ったけど
AI絵のようにそれっぽい別物を作りたいんじゃなくて、
オタクたちは「あの人のあの声」「そのもの」が欲しいんだろうな
この辺、AI絵師の流れとちょっと違うな パラメータの上は言う速度(上げれば上げるほど遅くなる)
真ん中と下は下げれば下げるほどピッチの上がり下がりが低くなる
(低くし過ぎると謎の電子音が出たりする、中国感がなくなる?) ボイロボイボみたく簡単に調整出来る様になればいいのにな GUI版、保存前にプレビュー出来るとええんだけどな ↑↓~以外のシンボリックの使い方誰かわかる?
変化が感じ取れない >>351
一度は保存するけど、微調整はテキスト編集後に左下の再生成した後に再生でプレビューできない?気に入らんかったら削除ボタン押せば残らんし。 >>352
「.」は言葉を区切る、連続で使用可能
「-」はゆっくり言うのに適している 例:「だ-い-す-き」
「!」は強調して言う、「?」は疑問符、「!?」のようにすれば驚く感じに
前のレスであったけど、カタカナに変えるのも効果アリ?
でもまだ細かい所は分からない、1文字ずつ音程とかを変えるやつがないので難しい
毎回ちょっと音声の出し方が違うので現状ガチャりつつ調整するしかない? 音程調節機能と特定の部分だけ再生成する機能ほしいよなぁ AIはともかくMoeGoeはまだ手加えられる要素多そうではある 水瀬いのりとか特徴ある声はほぼ完璧やね
少女終末旅行のチトを再現できてる ずっと2千人の方でやっていてクオリティ低いなぁと思ってたけど、知らないエロゲ絵の少人数の方でやったら滅茶苦茶クオリティ高くてビビった
なんで学習素材の多いはずの有名声優の方が精度低いんだ ウマ娘も少人数のデータセットのほうがクオリティ高いみたいね 流石に声優の声再現するのは
個人の趣味以外だと問題出てくるのでは 感情のパラメータ指定できるね
nene-emotion
https://huggingface.co/spaces/innnky/nene-emotion
↓
「使用情感样本id作为情感参数」→「情感样本ID」 このスレのおかげでmoegoe導入できたわサンクス
イントネーションの調整ってどうしてる?矢印で変化はするけど思ったようになかなかならん でもこれまたオタクがファビョーンして動画なんかじゃ使いづらくするんだろ?
どんな用途があるん? 誰が演じているのかを重視する人間が一定数いるからな
機械音声1とするのではなく、バーチャル声優として絵と名前と人格を与えてアイドル売りするのがいい >>359
そりゃゲームのほうが音声素材が多いからだろう
2000人以上のモデルの奴もベースがソシャゲで、それのメイン級に出番あるようなキャラだと結構いい感じになるよ
ゲームもなにも出てないからアニメから切り取ったような声しかないのはそれ相応でやっぱりノイズも出る 同じゲームのキャラでも使えるやつと使えないやつの差が激しいね 2800人のやつ、ちょいちょいターゲット設定して音声作ろうとするとまた話し相手を選んでくださいってjsonファイル再指定させられて作れないな。
これはjsonファイルの記述ミスなのかなあ 結局これってVITSを使ってるんだよな?
VITSなら一年前からシャニマスで全員分やってるやついたし驚くの遅くね? 全盛期若本規夫ボイスとかも生成できるのかな
もう80近いおじいちゃんだからコーチみたいなイケボまた聞きたい >>373
AI絵で完全にモラル吹っ飛んだんだなって方が驚きかな。技術自体はその通りで昔から出来た訳だし >>373
日本の音声合成界隈はVITSが出た辺りからモラル気にしてそういうの表に出さないように慎重になってたからな
実際それやってたの日本人もいたけど海外の人間がやってたイメージがある
データ集めるの大変でプログラム動かす敷居も高くて一般には手が届かなかったけどモデルばら撒き始めたから騒がれてるのかな >>87
息継ぎなんか大してすごくないよ
吸気音をそれっぽく差し込むだけだし HuBERT-VITSのsoftVC声の相性が良ければ綺麗に聞こえるけどなかなか上手く行かんね 2800のモデル微妙に更新入ったようだが中華の発音修正だけかな >>375
ブレンドSのキャラとか選ぶと何回も出てくる
でも今さっきもう一度選び直したら作れたわ
何が原因なんだろう 単語の変なところで変な間が開く時ってそこに「-」付けても何もかわらんよな?
結局関係ない場所に記号つけ足して繋げて発音されまで探って行く感じになるわ 機械音声っぽい違和感はいつまで経っても消えないのな moegoe開発者グループと連絡付くので
バグの詳しい内容抽出してリストや画像とかにしてくれたらメッセージ送れます とりあえずGUI
・中国語・韓国語がうまく再生できない
・音声変換ができない
・保存前にプレビュー再生できるように
こんなところかな いちいち同人声優を雇いたくない同人エロゲ製作者の強い武器になるかな >>391
あとは、テキスト欄に入力しなくてもチェックを入れるだけで言語を選べるようにして欲しい >>392
同人声優に金払う方が時間もコストもかからんぞ多分 ■ このスレッドは過去ログ倉庫に格納されています