githubで公開されている音声自動生成AI、日本のアニメキャラ2890名分の音声を学習素材に超速度で進化中★2 [386780362]
■ このスレッドは過去ログ倉庫に格納されています
一度エラー出ると再起しなきゃいけないのっておま環?
なかなかめんどい アニメ化してないマンガやラノベの台詞を読ませるのが楽しい MoeGoeダウンロードして
https://github.com/CjangCjengh/MoeGoe/releases/tag/v3.0.0
MoeGoe_GUIダウンロードして
https://github.com/CjangCjengh/MoeGoe_GUI/releases/tag/v3.0.0
ここのリンクからモデルとコンフィグファイルをセットでダウンロードして
https://github.com/CjangCjengh/TTSModels
MoeGoe_GUI.exeを起動、MoeGoe.exeの位置とモデル(模型pth)、コンフィグ(配置・json)を指定したら
文本に文章入れて正規表現に変換できたら下のプルダウンメニューからキャラ名選んで保存ボタンで保存 Vtuber版も作れそうだな
生配信やらボイスが豊富だしな >>261
[JA]んっ...んっ...んっ...んっ...んっ...[JA]
キスしてるように聞こえるゾ 非常に申し訳ないが
誰か
moegoe起動してモデルとコンフィグファイルをセットして話して選んで保存押すところまで動画で撮ってあげてくれないか? >>41
言うてこういうの使いたがるの倫理観無視の同人とか個人制作の動画とかだろ
別に読み上げるだけなら専用のソフト使えばいいだけだし 日本語喋らせると中国訛りが激しいのは中国語のイントネーションを優先してるのか >>271
第一弾のうるさいですねえの面倒くさそうな感じってどうやって車べせた?
不愉快そうな感じが難しい 保存するときのexplorerの画面の下の方の
ファイルの種類(T) 音频文件(*wav)
これがワシの環境だと何故か表示されないみたい
(*wav)の表示がない シンボリック入力を駆使すればなんとかなりそう?
[JA]そ-う-だ-よ-...[JA]
[JA]おまえ、さっきおらきがえてるときちらちらみてただろ、うそつけぜったいみてたぞ[JA]
[JA]みたけりゃみせてやるよ[JA] やっぱりこういうのは権利関係の常識や良心が無いチャイナが強いわ 嫌儲ディスコのAI板でbaiduのウマ娘・プリコネ・マギレコデータセット持ってる方がいらしたので
再配布するそうです >>284
2980人の方にウマ娘いるけど何か違うの? >>285
なんだそうだったのか
あんな流暢に出せるのかと思ったわ [JA]いれてもじぇーえーって読み上げるだけなんだがなんでなん(・x・) >>286
作った人が違う
少人数分のモデルデータのほうが品質が高いようだ 半角だけどなぁ
>>281のやつコピペしてもじぇーえー読み上げる >>292
なんでかわからんけどToLOVEるとルイズの方はJAなしで日本語いけるけど2980人の方はJAないとだめだった >>290
イントネーションがどうしても中国語風になっちゃうね 日本語設定しかないのは[JA]いれても意味ないんじゃないかい? /N/ は撥音(「ん」)
/Q/ は促音(「っ」)
長音は -
↑ ↓ でアクセント あやねるのDeepfakeが完全体になって出てきそう >>195
reCAPTCHAの認証がそもそも出ないんだよね
DMで送られてくるだろ >>279
それ初めて見た
ちなワイは[JA]あほ[JA]で文字を囲んでも、
そのあと声を選んでから変換?で a↑ho とかなるはずだが、そいつができないでいる
[clear]になる
■■ズ単体のではできたのに2000人のができないから何か問題あるので歯とは思うが
.pthと.jsonは一緒のフォルダに入れておかないとあかんのかなぁ これ生成時CPU使ってるのかな?
AIイラスト生成でグラボ買い替えたけどCPUも買い替えた方が良さそう ちなみにtor使ってる!分割でテスト中!(イキッ
の奴さ、yelpとかいうやつ
それやると無能な働き者が分割ファイルにミスがあったりであとで修正あとで修正の繰り返しになってクソ時間ドブになるから
やらんでいいで 分割はまぁいいや
それよりも、清理文本から清理を押すと
操作可能なプログラムまたはバッチファイルとして認識されませんになるんだよな
清理本文を押さなくても保存はできるのはわかったが、
402のは[JA]いれても入れなくても保存ができない
というか入れないときは右側にエラーコード吐くな
全バージョン試すのは面倒だ
やめだやめだ ディスコでウマ頂いたけどこっちの方が全然再現度高いね >>312
本人きちゃった感じですか?
ワイは自分を有能なんて一言も書いてないけどなぁ
無能ワイちゃんやで
それとワイが他の奴を無能呼ばわりするとは話は別や
これ、詭弁やで
ワイには詭弁はきかんよーwwwwwwwwwwww 繰り返しておくと、無駄に分割すると
今度は結合の仕方が分かりませんとかいう輩が出てくるのがまず1つと、
調子乗ってアップするも抜けがあったりそのまま音信普通だったり待たせようとする輩が出てくる
むしろこれらのせいで効率性が下がる、ワイらの時間は有限なんやで
しかもいま一般的に普及している回線速度から考えてもそこまでする必要性はない シンボリックってどうやって使うんだ
プロのひと教えて >>317
とりあえず記号を入れまくって聞きまくるしかない 読んでくれなくはないけど
濁音とか半濁音の認識が低い気がする イントネーションおかしいからテキストからの合成は諦めて、同人音声をボイスチェンジャーしてみようと思ったら、これ元音声の声優もリスト内から選ぶ必要あるのか >>321
俺は本名を名乗らせてからエロいことばかり言わせて爆笑してるわw
うpしたら訴えられそう オスマン青野さんじゃなくて島田さんなのか
ブロリーMADには使えそうだけど >>322
これ自分の声の録音からでもやらせてほしいよな
どうにかしたらできないのかな せっかくの素晴らしい技術なのにえっちなセリフ作るセンスがなかった え?どういうこと?
シンギュラリティはじまったってこと? 昔、嫁コレって架空の設定で版権キャラとイチャイチャできるボイスを聴けるアプリがあって結構費やしてたんだが
同じようなことを自作でできるの素晴らしいよ >>332
保存してた膨大なデータが生かせるのか
じょしらくのボイス欲しいんだよなあ >>330
パラメータを上から
1.0
0.2
0.2
くらいにすると作りやすい
記号らしきものを挟むと色々捗るけど説明が殆どないので試行錯誤が必要 >>333
じょしらくは持ってなかった気がするけどサ終する前に持ってたキャラのボイスデータは抽出してこっそり保存してるから追加学習とか自前でできるんなら再利用したいわ エロボイス作り放題な上にシチュエーションも自由だから
マジで抜ける、中国っぽい感じをどう隠せるかがコツかな? マジで第一の難所は恥ずかしさだな
誰かに見られてるわけでもないけど変なセリフを入力するのは結構恥ずかしい 記号使ったら文章内で急に読む速度が速くなったりするのとかも防げたりするん? >>338
イントネーション中国人ぽい単語の一字をひらがな→カタカナにしたり漢字にしたりするとよくなる場合あるで >>340
この文字言えてないなと思ったら↑とか↓でアクセントつけるかな これ有効活用できない?
('A', 'ei˥'),
('B', 'biː˥'),
('C', 'siː˥'),
('D', 'tiː˥'),
('E', 'iː˥'),
('F', 'e˥fuː˨˩'),
('G', 'tsiː˥'),
('H', 'ɪk̚˥tsʰyː˨˩'),
('I', 'ɐi˥'),
('J', 'tsei˥'),
('K', 'kʰei˥'),
('L', 'e˥llou˨˩'),
('M', 'ɛːm˥'),
('N', 'ɛːn˥'),
('O', 'ou˥'),
('P', 'pʰiː˥'),
('Q', 'kʰiːu˥'),
('R', 'aː˥lou˨˩'),
('S', 'ɛː˥siː˨˩'),
('T', 'tʰiː˥'),
('U', 'juː˥'),
('V', 'wiː˥'),
('W', 'tʊk̚˥piː˥juː˥'),
('X', 'ɪk̚˥siː˨˩'),
('Y', 'waːi˥'),
('Z', 'iː˨sɛːt̚˥') 実際の声優の声まんまだと問題になりそうだけど
声ちょっといじったらどうしようもなくね? >>345
ワイも、出力ちょっと弄ればいいのに、と思ったけど
AI絵のようにそれっぽい別物を作りたいんじゃなくて、
オタクたちは「あの人のあの声」「そのもの」が欲しいんだろうな
この辺、AI絵師の流れとちょっと違うな パラメータの上は言う速度(上げれば上げるほど遅くなる)
真ん中と下は下げれば下げるほどピッチの上がり下がりが低くなる
(低くし過ぎると謎の電子音が出たりする、中国感がなくなる?) ボイロボイボみたく簡単に調整出来る様になればいいのにな GUI版、保存前にプレビュー出来るとええんだけどな ↑↓~以外のシンボリックの使い方誰かわかる?
変化が感じ取れない >>351
一度は保存するけど、微調整はテキスト編集後に左下の再生成した後に再生でプレビューできない?気に入らんかったら削除ボタン押せば残らんし。 >>352
「.」は言葉を区切る、連続で使用可能
「-」はゆっくり言うのに適している 例:「だ-い-す-き」
「!」は強調して言う、「?」は疑問符、「!?」のようにすれば驚く感じに
前のレスであったけど、カタカナに変えるのも効果アリ?
でもまだ細かい所は分からない、1文字ずつ音程とかを変えるやつがないので難しい
毎回ちょっと音声の出し方が違うので現状ガチャりつつ調整するしかない? 音程調節機能と特定の部分だけ再生成する機能ほしいよなぁ AIはともかくMoeGoeはまだ手加えられる要素多そうではある 水瀬いのりとか特徴ある声はほぼ完璧やね
少女終末旅行のチトを再現できてる ■ このスレッドは過去ログ倉庫に格納されています