githubで公開されている音声自動生成AI、日本のアニメキャラ2890名分の音声を学習素材に超速度で進化中 [386780362]
■ このスレッドは過去ログ倉庫に格納されています
正式名称「VITS文本转语音生成模型」((Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech))
github
vits: Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech
https://github.com/jaywalnut310/vits vits-jap.ipynb - Colaboratory
https://colab.research.google.com/drive/18T3XCOzmlOGV1HOfbv6v3zyOxwH1vJLN GitHub - innnky-vits-japanese- 端到端语音合成模型VITS,日语数据训练
https://github.com/innnky/vits-japanese VITS 语音合成完全端到端TTS的里程碑
https://blog.csdn.net/Terry_ZzZzZz/article/details/120458064 デモページ
Audio Samples from "Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech"
https://jaywalnut310.github.io/vits-demo/index.html 論文
用于端到端文本到语音的具有对抗学习的条件变分自动编码器(Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech)
https://arxiv.org/abs/2106.06103
関連動画
プリコネキャラにごめゆいを言わせる動画、音声はすべて自動生成
【AI语音合成】用VITS给优衣说对不起 公主连接17人模型
https://www.bilibili.com/video/BV1S24y1d74C/ VITS文本转语音生成模型の解説動画
【AI语音合成】基于VITS模型的优妮先辈语音合成
https://www.bilibili.com/video/BV1jY4y1c7JF 自動でゲーム作ってくれるAIはまだか?
はやく自作のゲーム作りたい
>>8 どこでこういうAIのニュース知れるか教えて!
いよ!嫌儲の総大将!
日笠っぽいキャラに日笠の声を当てることも?
ざーさんぽいキャラに
問題は精度よ
どうせラーメンが食えないAIみたいなもんだろ
演技力必要無いナレーションなんかはAIに取って代わられるだろうな
>>3 中国は知らんが日本は取らなくていい
改正著作権法でAIの学習素材は何を使っても良いことになってる
結局イラストAIと同じで何となくそれっぽい物しか出来ないんだな
>>9 中国語で百度とか新浪微博の記事検索してる
自动合成にいろいろ語句をくっつければ嫌というほど出てくるよ
>>6 まあ大丈夫でしょ
日本のアニメでは
イラストレーターみたく一枚絵ってわけでもあるまいし
>>24 台詞に著作権はあるけど声に著作権てあるのん?
さすがに自然に喋らせるには手動で調声しなきゃならんのだろ。ボイロだってそうだし
これ声優だけじゃなく録音関係で悪さする奴出てきそうだな
AIを使った歌を歌うnutorino
AIを使った読み上げvoicevox
これらを合わせられれば
とんでもねぇ話だよ
声質と喋り方の癖だけ抽出してるってことか
まぁ確かに考えて見れば音声って全て波形に変換出来るから学習もしやすいか
安倍の秘蔵音声がボロボロ出てくる
マザームーンとか喋らせろ
>>44 上にソースあるよ
VITS 语音合成完全端到端TTS的里程碑
https://blog.csdn.net/Terry_ZzZzZz/article/details/120458064 デモページ
Audio Samples from "Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech"
https://jaywalnut310.github.io/vits-demo/index.html 論文
用于端到端文本到语音的具有对抗学习的条件变分自动编码器(Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech)
https://arxiv.org/abs/2106.06103 ギターアンプとかほぼもう合成と区別つかんからね
Dumbleだろうとメサブギーだろうとマーシャルだろうと
完全に音色コピーしてくる
種崎敦美さん「ひらめいた!エロゲの仕事だけこいつにやらせよう!別名義で!」
>>51 AIを使ったボイチェンはMMVCだぞ
AI安倍晋三になれる日も近い
これは朗報
中の人もいらなくなってついに三次女と完全に切れるわ
波形をFFTして周波数成分抽出して
「はーいこれウチの人気声優と99.99%一致してますねー!損害賠償ね」
ってとこまで行くと思う
ギフハブってストーカーしてくる連中だよな
俺のスマホの中身も見られてんだろうな
裁判長「FFTってなに?学校で習わなかったこと証拠に出さないでくれる?はい無罪」
そんなあああ
ってなるかも
結城美柑のエッチなASMR
みたいなのも余裕で可能に!
ビジネスチャンスや
このAIは何ができるのか?
いや
できない理由を考えるのではなく!
工場とか事務じゃなくてアーティスト系の仕事からAIにやられてるのが終わってる
アドリブできるトーク力あるやつやビジュアルで売るやつはしばらく残るだろうがモブとか全部機械でよくなるな
つーかサンプリングによる合成音声じゃなくて
ディープラーニングの学習だったら
もう元は誰とかじゃなくなるからな
まあでもそういうビジネスじゃねえからよ声優ってのは
人気商売なのよ
>>1の動画の作成者、学習済のデータバラ撒く宣言してて草
CjangCjengh
https://space.bilibili.com/35285881 対応Linuxだけじゃね?これ
だいたいの日本のパンピーはLinux使えないから関係ないな
ディープフェイクと組み合わせればもはや何でもありになるな
>>87 それ使えば
neutrino、mmvc、voicevox
全部モデル作れるかもしれない!
ありがとう父さん😭
なんでどいつもこいつも悪意の塊みたいな宣言から入るんだこういうのの技術者
藤原啓治さんと石塚運昇さんとコバキヨさんをこの技術で蘇らせて…
自分の持ってる同人音声読み込ませたりできたらヤバそう
>>94 買ったな…インターネットはフリーライダーのものだって分からせてやる!
悪意なんてないよ
一人はみんなのために、みんなは一人のためにだよ
自分も今日たまたまギフハブでプロセカのキャラ喋らせるやつのデモみたいなのあったんでやってみたんだけど発音がイマイチな感じだったな
>>89 視認(目)と顔と声は揃ったしあとは体と自律動作(思考)やね
体はそろそろ3Dが来るらしいし
考える部分も今のAIでも犬猫程度は再現可能みたいだから
もう登場もすぐそこだろうな
創作系が駆逐されてくんだな
最後まで残るのは肉体労働か
同じ製作者の動画
喜怒哀楽による読み上げの変化をパラメータ化
可控制情感的绫地宁宁语音合成!基于VITS模型
https://www.bilibili.com/video/BV1Vg411h7of/ こっちももうgithubに上がってるね
GitHub - audeering-w2v2-how-to- How to use our public wav2vec2 dimensional emotion model
https://github.com/audeering/w2v2-how-to VITS情感控制语音合成
https://github.com/innnky/emotional-vits デモページ
https://huggingface.co/spaces/innnky/nene-emotion へー 好きな声優で中国語吹き替えとかやらせたいのかね
カセットデーブが伸びるとこんな声になったよな
若い子はわからんだろうが
イリヤとかサーニャの声学習させて門脇舞以のエロボイス作れる時代が来るのか?
>>115 なるほどそれは開発モチベーションになるな
SEだったけどguthubの使い方とかわかんねえわ
中国語はわからんけどその声優が発音してそうって感じがする
英語は発音が惜しくて聞き取りにくいな
もうちょっとでいけるきがする
>>113 アイコンの健太かよ
ちんぽ舐めさせろぺろぺろ!
>>8 プリコネのごめゆいは本編で言ってるんだよなぁ
>>8 正直クオリティは大した事無いけど
Steamでこれ使ったHentaiゲーは量産されそう
>>43 昔は百度のサイト内検索で個人のクラウドがヒットしてたからポエム集めるのに使ってたわ
ボイスロイドでも鷹の爪の吉田くんみたいな特徴的な声は再現度高いから
昔のドラえもんあたりはAIでかなり良い線いくんじゃないか
全然わからん
任意のテキストをしゃべらすデモページどこなの
せっかくAIで声質作れるってんならさ
AI塩沢兼人とか
AI内海賢二とか
AI石塚運昇とか
やってほしいんだよな
>>117 もう既にそれっぽいことはやってるぞ
MMD動かしてAIに描かせてセルルックアニメは結構数が出てる
これで亡くなった声優を再現できるって事だな
古参なら学習させるデータは豊富だろうし
これすげーな
キメラじゃなくて声色を再現してるのか••••
亡くなった声優さんの声も違和感なく復活できるんかな?
それが普通になるとAIか新しい声優さんに交代するべきかジレンマが生まれそうだな
クレしんのひまわり、ポケモンのピカチュウはAIどころか使いまわしで良いと思うの
絵師の絵柄を一晩完全に学習させた学習データの容量
40KBだってよ
「お前の人生40KB」
これで筆を折ったやつもいる
学習データは一度流出したらもう終わり
とんでもない時代になったよ。
>>117 もう感動するストーリーから脚本から全部全部AIが作ってくれそうだな
>>147 絵は別に絵を描くのが楽しかったり
絵を描く者同士で交流するのが楽しいってのがあるからなくなりはしないだろうが
声優は難しいかもな
アマチュアで歌ってみたみたいなのしか残らなかったりして
こういうの結局優れたサンプルが先に必要だから、ai以下の底辺が駆逐されるだけで、逆にトップの表現力の洗練が高まるだけなような
つーか絵師だけじゃなくて普通の仕事でもぶっちゃけAIで十分だろうに
早く全部AIになってベーシックインカムになって金持ち消滅しないかなw
これ滑稽なのがさ
もしも
AIが学習工程を踏むことを知らず、
学習データに何を使っていたかも知らされず
なら、ギャーギャー言わない、そもそも言えないんだろ?w
トップのコーチとかZのセルやってた頃のキレッキレの若本頼むわ
3Dアニメとか有志が作るの促進されるかもな
技術的に映像はいいけど声が問題になってるだろ
映像だけなら俺ですらも多少作れるわけだしな
ニダーのアニメとか作りたいな
>>160 プリセットに海外の吹き替え声優もあったよ
声優業全体を狙い撃ちしてるね
声優廃業www
裏方のくせにアイドル気取りでちやほやされててムカついてたからうれしーwwwww
それもいいけど女優の声を学習して
ディープフェイクの声も合わせてきてくれ
全裸で待ってるから
これをコイカツに導入できたら本当の意味でめぐみんとvrセックスできるようになるのか
こういうのが蔓延すると聞いてる側のハードル下がってこれでいいやってなるから声のおしごとは終わりだな
機械には真似できない職人の技術があるから!
機械には真似できない演技の技術があるから!
これで声優が休んでも大丈夫になった
みんな幸せになるね
>>169 笑いすぎて呼吸困難になった
マジで安倍ちゃん復活祭できるやん
3日後にはFANZAでAIエロボイス同人が出そうだな
>>72 アーティスト系は大抵机の前で仕事完結する、PC内だけでデータが動いてるだけだからな。
工場とかはデータに置き換えられない実物が動く必要がある。
>>176 もう線引のない世界に入ってるな
一線も二線もかんけーねぇみたいな
>>174 まあ実際このとおりだろうな。
機械には真似できないレベルの技術を持っている食には生き残るが
機械に真似できる程度の技術しかない職人は消える。
機械による労働の置き換えは肉体労働から来ると思っていたが
技術職から先にくるとはなぁ
アキネーターをアニヲタが侵食して糞化させたのと同じことだろ?
>>185 現実は理想から始まるんじゃなくて、やりやすいものから変わっていくんよな
変な音の上がり下がりは氣になるけど凄いなこれ(´・ω・`)
結局、楽な仕事はAIが出来てしまうってことだよな
もう美味しい職業なくなってしまう
はんこ絵もはんこ声優もAIより安くならなきゃいけない
>>185 まあ客も馬鹿じゃないから、絵も演技も芸術は意図が大事だったりするから、表面的な技術だけで食えなくなる奴らは初めから同じ土台に立ってないよ
特にオタク界隈は目が肥えてるやつらの声がでかいからな
クリカンが嫌すぎるから
山田康雄のルパンが見られるようになったら嬉しい
合成音声の演技を過去のキャラクターの解釈通りに調整する仕事が新しく生まれるかもしれない、結局それも人が人に向けて作る技術職だからaiは人の後追いしかできなさそう
使って見ないと分からないけど今の所ボーカロイドレベルで一番発音がよく聞こえるボイスピークレベルは出せない感じかな
ただ進化したらどうなるか分からないけど
もう誰かやってそうだけど、増え続けるAI技術からあなたの著作物などを守ります!みたいなサービスで稼ぐやつ出てきそう。
合成だと棒読みになりがちだから
リアルタイム変換のために声優学校に通うキモヲタが出てくるぞ
まあしゃべった方が早そうだが
絵は時間かかるけど
声なんて作業コストないだろ
>>201 防ぐには非公開でやるだけだよ
公開した瞬間使われても文句言えない世界だ
やっと山田康雄の声でルパンが復活するのか
楽しみだぜとっつぁ〜ん
>>169 これで「生前の私は間違っていました。憲法九条は日本の宝であります」って安倍に言わせたらネトウヨが歯ぎしりして発狂するかなw
NHKのAIキャスターも聞き取りやすいし、
読み上げはもう全然実用だね
芝居・演技はもう一段掛かりそうだけど
クリエイティブな分野ばかりAIにやられてるな
営業職以外の社畜失業とはなんだったのか
>>209 おかず探しに時間かけなくて済むからGDP上がりそう
>>209 著作権などの問題はあるけどこの技術はもうついていかないと日本だけ置いて行かれるぞ
中国がAI大国になるのも間近だアメリカとどっちが早いか
別にクリエイティブ方面は何もやられてないんだけどな
勝手に外野が代用できると勘違いして騒いでるだけで
リアルタイムチャットに使える処理速度さえあれば四半世紀ぶりのネカマ時代復権も夢じゃない
というかwin95あたりから数えても余裕で四半世紀経ってるんだからそれくらいたのしい進化があってもいいだろ
頼むよ
おしゃべりひろゆきメーカーやってるとこが自分の声を素材化するサービスやってたな
癌で声帯摘出する人とかも利用してるらしい
>>214 今の音声解析なら元の発声の波形から計算して代わりのAI発声までコンマ数十秒ぐらいで生成出来そうだし
会話のテンポとしてはちょっと前の質の悪いIP電話ぐらいのやり取りはできると思う
これはこれでVOCALOIDよろしく調声役必要だから本当に人間がAIの補佐役になる時代が来たんだな
279: 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった(ワッチョイ 7938-NpS5) 2022/11/02(水) 23:57:43.32 ID:Sjjhf7uV0
>>268 ルイズにルイズコピペ音読させられるやん!
302: 今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった(ワッチョイ a97b-Ojdt) sage 2022/11/03(木) 00:16:38.17 ID:sveMjhCz0
>>279 試しにローカルに入れてやってみたけど
ちょっと読み上げさせた事を後悔するレベルで音読してくれて申し訳ない気持ちになったわ
https://uploader.cc/s/dboset813dk04nr5vnr168pj8lztjjq0nlnndhsqi0f5aurfbk417f6kfn5hnupb.mp4 >>217 ボカロ界隈ってクリエイターは補佐役扱いなの?
ボカロはむしろ人の道具として表現の踏み台ってイメージなんだけど
>>215 声フォントだっけ
mimicはといい、日本人のサービスはお行儀が良いんだよな
だからこいうのが出てくるとたちまち置いていかれる
かといってWinnyみたいなことやっても日本じゃ捕まるが
>>212 どう足掻いても勝手にコンテンツ使われるんだから先取りしないと駄目なんだよな
国内は批判して潰して海外に対してはお気持ち表明だからな
>>219 ボカロじゃなくてVOICEROIDって言った方が良かったな 間違えたから見逃してくんろ
ギフハブASKAさんも学習させれば歌手もAIにできるな
355今、天王星のwiki見てきたら軌道傾斜角(i) が0.774°だった (ワッチョイ a97b-Ojdt)2022/11/03(木) 01:04:30.01ID:sveMjhCz0
悪用はやめてな。あと悪意あるコードが含まれてても責任とれへんからな
MoeGoeダウンロードして
https://github.com/CjangCjengh/MoeGoe/releases/tag/v3.0.0 MoeGoe_GUIダウンロードして
https://github.com/CjangCjengh/MoeGoe_GUI/releases/tag/v3.0.0 ここのリンクからモデルとコンフィグファイルをセットでダウンロードして
https://github.com/CjangCjengh/TTSModels MoeGoe_GUI.exeを起動、MoeGoe.exeの位置とモデル(模型pth)、コンフィグ(配置・json)を指定したら
文本に文章入れて下のプルダウンメニューからキャラ名選んで、保存ボタンで保存や
もう好き放題できるみたいやぞ
>>232 やべえありがてえ
早速仮想環境物故無化
moegoeGUI無しでやってみたけどSDと違って一瞬で出力されるわ
これは動画サイトがしっちゃかめっちゃかになりそうなお手軽っぷり
やばい
これでイントネーションとか速度調整できるようになったら完璧だ
誰か使い方をwikiにまとめて
イントネーションの変え方と喋りの速さとか全然わからんちん
>>238 おもしれえな
もうここから先はあっという間だろ
ディープフェイクに利用されまくりだな
中国さんが頑張ってるってことは詐欺に使われる可能性が100%だな
真の自由の国やで
亡くなった名優たちの全出演作品取り込んで蘇らせてくれ
モラルの欠如が文化
こいつらに付き合って法規制するのも面倒だな
国民性がヤクザと変わらん
>>238 ちゃんと焦りや真剣さを汲み取って声色にしてるの凄くない?
やりたい放題のは良いが、エーアイ(企業ね、ボイロ等)に完勝してるかというと微妙。
>>232 技術的に面白そうなのに俺にキャラクターの知識がなくてイメージできないのが残念
キッズ「アーニャの声でエッチなセリフを生成して!」
AI「大量の学習データを検出シマシタ」
なんでやろなぁ…
これもう、おじさんがエロ小説朗読して音声作品をDLSiteで売るようになるだろ
>>258 そういうイメージ操作はねえ やめるべきですよ?
のとこめっちゃかわええ
>>256 これもうエンドレス再生したら使い物になりそう
これからはローカルで動かせる知識ある奴だけが楽しめるようになるだろうな
お前らバカそうだしあり合わせのもので楽しんどけ爆笑🤣
AI画家みたいに複数の声優さんをミックス出来るのだろうか?
そしたら声優さん個人の真似ではなくなる
エロシチュエーションの文章にAI喘ぎ声とAIエロ絵を付けたものをそこらのおっさんが作れるようになるのか
>>154 金があるやつはそのまんまやぞw
これの開発だって事業でやるなら
金が必要
それを出すのが金持ち
グラは完璧でも声が弱点だった某ウマゲーのコイカノVR
もしかしてこれを使えば完成させられる?
喋らんでいいから喘ぎ声と淫らな吐息自動生成AI作ってくれ
>>72 製品が燃えたり金が合わなくなったら困る
手でラーメン食う絵とか、変な声の合成音声とか、
別に誰も困らん
これ棒読みちゃん連携してリアルタイム変換できるようになったら配信界隈も変わりそうだな
日本語以外も対応してるから、日本語でしゃべってるところから突然中国語や韓国語に切り替えても違和感なく同じキャラがしゃべれてるな
>>258 これすごすぎだろ…違和感ほとんどないわ
ってかルイズコピペってルイズが読むセリフじゃないだろw、日野でやれ
>>232 サンクス
Windows Sandboxでexe叩くわ
著作権とか肖像権とかでこいつもお蔵入りなんだろうな
AVコラージュと一緒で
一般動画サイトで使ったらひんしゅくものだし、日本ではアングラな流通しかできないだろうな
まだ未完成って感じだけどすぐ自然になりそう
リアルタイム変換の技術はかなり難しいらしいけど
ちゃんと国ごとのイントネーションもローカライズされてんのかな
イントネーションがまだ中国人のカタコト日本語だなw
これ進化したらすごいことになりそう
>>25 おー、そうなのか
たまには政府もまともなことするんだな
少なくともこのままの形だと、
AI絵師よりも拒否反応大きいだろうね。
(法的にというよりは、感情的な面で)
学習した声質をもとに、出力ごとに毎回合成して、
新たなキャラを生み出す仕組みになればもう少し抵抗感は減るかもしれない
法的には、具体的に何が問題になるかな?
声紋は創作物ではないし、著作権では無いかな。
何かの尊厳を傷つけている気がするから、人権的な何かかな。
ノベルAIといい、音声合成といい、凄いなあ
忖度忖度じゃ何も進まない
【人間のデメリット】
・24時間レコーディングできない
・思った通りに歌えず、リテイクがある
・文句を言う
・気分や体調が変化する
・寿命がある
・プライベートのリスク、SNSのリスクなどがある
・金がかかる
>>299 AI「燃費効率の悪い人間は不要だ!ゴゴゴゴ…」
コイカツと組み合わさる日が
早ければ年内イケるか?
>>22 githubで公開されている音声自動生成AI、日本のアニメキャラ2890名分の音声を学習素材に超速度で進化中
https://www.youtube.com/watch?v=aoq97CT0MUs i2i的な処理ができるようになったら革命が起きるだろ、これ。
動画に使うとしても突っ込まれたら広告剥がされそうだし
やっぱり何でもできる中国様限定だな
>>9 絵と違って声は違和感がちょっとでもあるときついな
まだまだ実用性は低いからブレイクスルーに期待したい
オッオッって喘ぎ声くらいなら使えそうだけど
>>256 素晴らしいですね!文章読ませなければ十分実用性あるわ
ワイが声優より自信あるからワイの声でデータ作りたいんやけど
まずどこからはじめたらええかわからんわ
jsonと.phtだかを作ればええんやろ
このAIってオタクの間で議論になるだろうけど、安倍答弁が量産されて、そればかり転載されるようになったらオタクもネトウヨも正気に戻るのでは
声優の声を勝手に使ってエロいこと言わせるのは倫理的に問題あるから規制の足がかりになるけど
安倍答弁読ませることを批判するのはかなり難しい
ただの答弁で変なことは言ってないはずだから単なるAIのテストでしかない
>>318 でも人の絵を勝手に使ってエロ絵量産してるじゃん
>>319 AI絵もそのうち規制されるが声はダイレクトに本人と結びつくからヤバさが段違い
ただでさえアウトなのに公序良俗に反する要素入れたら規制まっしぐら
安倍答弁は公序良俗に関してクリアしてる
我が国最長政権の名君を惜しんで、せめて名答弁だけでもAIで再現してオタク界に広めたいと望んでる人もいるだろう
その手法もその意思も批判するのは難しい
真似する声優さんが選べるだけなのか、怒った感じでとか色々と指示出来るのか
日本語以外もというか外国のプログラムなんじゃないの
まあこのソフトみたいに
出力に堂々とキャラ名書いてあるような実装の仕方は論外として、
声そのものは著作物として認めらないし、肖像でもない。
しょっぴかれるとしたら、ディープポルノの画像みたいに
オリジナルの学習元個人に対する「名誉棄損」扱いが現実的かな
ただ、学習モデルを元に、新しい声質を出力する、という形になると色々と大変になってくるね
自分の好きなアイドルでモデル学習したいけどgithubのTTSプログラム多すぎてどれがいいかわからんから教えてほしい
Pytorchは結構触ってる
>>328 原理的にお絵かきAIと同じ仕組みなら学習元の声優さんミックスとかも出来そうなんだけれどどういう学習モデルなんだろうね
お絵かき用のTIやDBみたいにサンプル持ってきて学習させられるといいな
昔のまっとうにカッコ良かったころの若本とか聴けるのか
最高じゃん
こんなん声優に喋らせたほうが早いし安上がりだろ……w
過去の音声合成と違うのは雰囲気なんだよな
フォルマントやらが似てるだけではそういうのは出てこない
これ最終的に電脳の世界に安倍クローンが生まれるだろ
もういい加減学べよ
権利だなんだが通用した試しあったか?
イノベーションがつぶれるだけで結局悪いことしたもん勝ちなんだよ
もう人間とかいうゴミいらんな
AIに囲まれて暮らしてえわ
>>321 AIだと長文が安定しないから短文を切り貼りしてるんじゃないかな?
あの動画はわざと実音声もぶち込んであるみたいだけど
全然ダメだな
声優の表現力に遠く及ばないし
不自然だわ、
城達也がジェットストリームAV解説とか出来るんか?
AIで作ったイラスト、台本、声でDLsiteに売り出されるのも遠くないのかもな
DLsiteをAi作る人が意識したら、台本はいちばん簡単に真似できそうな気がする
いろんな理由でもうアフレコできなくても続きが作れるのがいいよな
現実の人間そっくりの顔でヌード作ったらアウトだけど
現実の人間そっくりの声でエロボイス作るのはセーフっておかしくね?
2030年代は安物の AI 娯楽で育った人間と、高級な人力娯楽で育った人間に文化圏が分断されるだろうな
声優が権利主張していかないと、あんたらの仕事無くなるぞと言いたい
動画で出てる学習モデルが公開されたのかと思えばそうじゃないのか
過去立てられたスレと状況が対して変わってないな
>>353 今の技術程度じゃ当分は大丈夫だわ
どっちにしろ強弱に話速イントネーションそういう物をコントロールする必要もあればアプリ側で対処する性能もいる
これ使って昔話読ませてようつべにあげて小銭稼ぎしたら怒られる?
自分の音声を元にキャラの声で話すデモ作ってる所あるだろ
自分の声の抑揚でAIキャラの抑揚をアシストできればグッと良くなるね
>>232 操作可能なパッチファイルとして認識されないんやがどうすりゃええ?
指定してるけどモデルとコンフィグの階層関係ある?
正確だけならボイロはゆっくりを駆逐しているはずだがそうなってない。結局細かいイントネーションは直さないといけないし、動画位ならそもそもゆっくりで十分。
画像AIは細かい所が駄目でも連打で数うてるのが強いように、音声もどれだけ手間がかからないかの方が重要。
>>361 ルイズ単体のデータはなんかエラーでて実行できなかった
ゼロの使い魔データとトラブルは行けたからそっち使うといいかも
>>363 フォルダの置き方とかスクショで見せてくれんか?
>>364 Moegoe.7zを解凍した中にあるMoegoe.exe と同じ階層にMoegoe_Guiを入れてるけどそれが正解かどうかはわからん
モデルのpthとjsonはgui起動後に指定するから多分場所はどこでもいい
7zipは古いバージョンの解凍ツールで解凍すると
一見正常に解凍できたように見えて破損ファイルになるからそれじゃね
AIとの差別化には「だれが演じたか」が重要になってくるけど
そうなれば専業声優は一般の芸能人に比べて不利
声って結構人間の各個人の情報の大部分を占めてる感じするから、悪用して、犯罪に使われそうだな
1人でアニメ作ったり映画作ったりする時代が
来るのかな
ボカロって何で延々ミクのままだったんだろうな
登場当初は今後アップデートやバージョンアップを繰り返し人間そっくりになるかと思ってたのに
音楽は新しいサウンドを求め続けている
初音ミクの下手くそな感じが面白かったのであって、
あれが人間と区別付かなくなったらただの退化
うまく違和感ない感じに喋らせるのむずいわ
やってて思ったのがくぎゅの声ってやっぱいいな
技術のある変態がコイカツの音声をくぎゅうに差し替えてくれんもんやろか
https://uploader.cc/s/85kl5zalimi3we4xb23c7g9c3xbcrfocnbb1s9xs5wf3rkgo80rohuoc5xsa0eeh.wav マギレコの双葉さな(小倉唯)でチノコピペ読ませてみたけど調節難しいな
MoeGoeの本文の下の参数設置で早さとか調節したり「!」とか「?」で強弱付けれるみたいだけど思ったようにはなかなか出来んわ
>>258 すげええええ
単純にくぎゅの音声デジタル化ってずっと求められてたよね
まさか無料でできることになるとは思わなかった
>>385 ボイロガチ勢みたいに最終的にはワード単位で切り貼りしてどうこうみたいになるんやろか
次から次へとオタク虚業潰されてくの爽快過ぎんだろ
しかも中国とアメリカという、表自界隈が見下してた存在というねw
本当のクールジャパンってこれなんだわ
日本のアニメ漫画ゲーム全部AI素材に使って日本滅ぼそうぜ!
中国父さん頑張れ!
https://huggingface.co/spaces/skytnt/moe-tts 文字数に制限あるけどブラウザ上で出来るからツール入れるの面倒くさいけど試してみたいって人には使ってみてくれ。
https://www.bilibili.com/read/mobile?id=17826415 もし興味持ってモデル作ってみたいって人はこの記事が参考になるかもしれん。
不祥事を起こさない声優なんて理想的な存在じゃねーか
マジのマジに10年後にはこの国の民全員が虚無虚無の虚無になってそうだな
AIで写実動画と音声が作れたら…AI動画が作れるね
マギレコのモデルの場所ヒントありませんか?
さすがにとらぶるとゼロ魔は加齢臭がキツい
>>232の音声モデルデータのJapanese & English & Korean & Chineseとかが大量のアニメの声のモデルデータっぽいけどGUI使っても直打ちしてもまともに出力されんな
何かコツがいるんだろうか?
これのおかげで今日は少し寝不足だが仕事しなきゃ。
土日でがっつりいじりたい
スレ落ちた時用に嫌儲ディスコにai板作ったから入っておいて
嫌儲DISCORD部 - DISBOARD-
https://disboard.org/ja/server/313289774440120332 >>399 http://b23.tv/YY0RjFq 基于VITS的魔法纪录10人模型
概要欄にモデルデータのリンクがあるからそっから飛べばいける。
注意点としてはルイズとかほど学習精度が高くないから片言になりやすい。あと百度アカウントがないとダウンロード出来ない。百度アカウントは電話番号必須だけど日本の電話番号じゃ出来ないから注意な。一応日本ので作る方法もある。
哔哩哔哩とか百度で「VITS模型 配布」とかで検索すると配布してくれてる人もいるけど本当に極端に少ない。イラストとは違って合成音声に関してはその辺かなり渋い。稀に動画の概要欄に配布リンク置いてくれる有志もいるからビリビリで「语音合成」って入れて見回るのもいいかもしれない。
http://b23.tv/oJeX5YS これとかフリージア歌うところで笑ったわ、ウマ娘系は特に動画多いから気になる人は調べてくれ。
余談だけど学習モデルにソシャゲとかエロゲのデータが多いのはキャラクターの音声が全部一文ずつ分けてあるから下準備が楽ってのが理由だと思う。
声の方が簡単だろうな
テキストと対になる学習データが豊富にあるし
音声データなんてもともと大した量じゃないから
すぐ完璧に再現しちゃうと思うわ
人間なんて所詮データの集合体だからな
すぐ人とAIの境なんてなくなるよ
あーあ、これは国民的アニメの野原一家がエロゲに出てしまうわ
絵師の次は声優か
遊びでやってるような職業がどんどん潰されるな
結局汗水垂らして労働するのが大正義ってこったな
>>418 汗水たらす職は置き換えるより人間使ったほうが安いという悲しい現実
>>306 エロMMDとか自作同人ゲームとかそこらへんの喘ぎ声なら充分に使えそう
>>8 声質は似てるけど発音がちょくちょくおかしいな
>>418 職業はこんなんじゃ潰れないよ、客が人間である限りはね
趣味レベルのクオリティの小遣い稼ぎは沙汰されるだろうけど
無料のクオリティが上がって、有料に求められる質が上がるから逆に全体の質向上が進むと予想する
シャンプーとかのせいかもしれないけど
中国語っぽいしゃべりかただとちょっと可愛く聞こえる
百度アカウントなんて持ってないわ
もっと前に取っておけばよかった
日本で規制されたところで海外で伸びれば関係ないしな
>>408 おお、ありがとうございました。
今晩辺り試してみます。
30代40代がメインヒロインの作品はもうちとキツいwマギレコは推してる声優が多いので是非導入したい。
>>424 だいぶ前に取ってたけど電話番号認証しろって言われてログインできないぞ
声優業界は声の仕事だけでじゅうぶんビジネスができたから
テレビドラマ出演など新しい分野の開拓は厳しいと思う
声優はオーディションで仕事を得るからその辺りの厳しさは一般の芸能人に対して強みになるはずなのだけどね
一生懸命チューニングする手間と人間に台本読ませるの、どっちがコスパが良いんだろうな
(ヽ´ん`)「○○の声でヤッてよ」
AI「おかのした」
これが実現するのか…
>>6 これ初代ルパンとか次元とか帰って来るんじゃねえの?
俺の友達が今(数年がかりで)、合成音声のプログラミングしてるんだけど
無駄に終わっちゃったな…
>>14 ギフハブ
ヤバいです
続きはメンバー限定で
まじで正解見つけたわ
ただでさえかわいいツイートに声をつけるのが使い道だったんだ
嫌儲FMが一流声優の声で聞けるようになる日も近い
これはもう革命だよ!
人の音声を声優のに置き換えるとかできないんかなぁ
ちまちま発音いじくる手間なくせたらいいんだが
こっちのほうがちょっと気になるな
エロいセリフOKなんか…
学習素材あればあのアイドルにエロエロボイスさせられるのか!
麻雀ゲームに出てないキャラにも「チンポにゃ!」って言わせられるのは凄い
声優も名前だけでアニメ見てもらえるレベルの人気声優にすでになってる人は安泰だが
ネット声優みたいな小銭稼いでるアマチュア声優はもうあかんな
>>450 嫌儲のボリュームゾーン
現実見たらちょうどいいんだわ
>>450 若い頃の学習データで新しいボイスを作れる
アニメや吹き替えの仕事で稼げないのがいけない
ソシャゲーの声なんて本来つまらない仕事だろうに
>>113や
>>392みたいなお手軽に遊べるの他にありませんか🥺
>>392 使ってみたけど、アニメの中に出てくる中国なまりキャラみたいなイントネーションやな
ただイントネーション以外はかなり自然なレベルに達してる
みんな上手えな
頑張ってもシャンプーみたいなイントネーションになるわ
石原夏織ちゃんの声のモデル作ってみたいけどxp3抜けそうなギャルゲ出てない(多分)からデータ集めが大変そう
とかいうとミズハスでええやんと言われそう
>>465 これさえどうにかできたら一生ルイズに喋らせてにやにやするわ
そろそろVOICEVOXのUI乗っ取って使えるようにする猛者が現れないもんか
ローカル版MOEGOEの日本語文章の書式が分かったわ
[JA]こんにちわ[JA]
みたいな感じに文章の頭と尻に[JA]ってタグを書けばエラー吐かずにちゃんと音声が出力される
ただ調整しないとマジ中国人にしか聞こえんし大半の音声は声優の声を再現できてなさそう
>>470 声優いっぱいのモデルが話せるようになったわ
ただ精度低いねやっぱ
反日と、日本のアニメ・声優大好き! を両立させようとすると、
AIに学習させて自分の管理下に置くような行動に走るようになるんだろうか。
>>470 そういうのよく分かるね。
これほんとヤバイな。若手声優に淫語喋らせまくりなんだが
ルイズ「もうイくの?いいわ、イきなさい」
いっぱい出た
具合悪いのに昼食も摂らずにひたむきに作業してしまった。
動画とか同人ゲームにつかったらどうなるんや
言い忘れ&れどめに書き忘れ
一緒に入れてるconfig.jsonは
>>232のモデルファイルの奴に声優名足しただけだからいらなかったらポイしてね
イラストよりこっち頑張ってほしい
自作アニメで女声優雇わないといけない問題が解決される
>>479 ありがたい
1個希望があるんだけどパラメータ設定のデフォルト値の好きな数字に変更できたりしない?
ピッチ僅差って項目が0.8だと大体早口になるから最小値にしてるけど毎回いじるのめんどくて
ゆっくりみたいな使い方ならともかくゲームとかに乗せるなら文字入力じゃなくてコナン君式がいいなー
>>479 ありがとう、すごい。日本語になってるし
>>484 出掛けるのでやっつけ
https://uploader.cc/s/kbvq2hvfrkp1robwy00j6zose3a66ymw5z06vfupgfooggqnnzzw5ig65321mg50.zip params.txtの各行がデフォルト値に対応してる…と思う
空欄で無視
今0.70って入れてるとこがピッチなんとかのハズ
テストも何もやってないので変だったらごめん
0x80070570エラー起きたぞ
というよりJA入れてもなにもならない
そもそも、こんちはをいれるとkon↑tiha↓のように変換されるがそれがならずに、clearだけになる
>>489 すまん対応ありがとう、初期値変更できたわ
でもたまにモデルとコンフィグ設定してるのにjsonファイルの読み込み外れてるっぽい時あるかも、おま環かもしれんけど
既存のdlsiteとかの音声作品を学習させて、
それに合わせてAIが声を当てれるようになったら
好きな作品の声を好きな声優にできるようになるんか?
アクセントやイントネーションは自作しなきゃならんから
できる人にはいいんじゃね
>>479 嫌儲ってこんな有能な人おったんだ
>>501 書き方悪かったわごめん
>>477見て自分の喋った言葉をルイズの声に変換するっていうの機能がmoegoeに付いてるのかと
もうクオリアの部分だからな
これは間違いなくあれだな、と人間には判るけど、
それをどれだけ似てたらNGみたいにルール化は不可能
似顔絵が肖像権を侵害しないのと同じ
訴えるやつなんて既にその時点で検証済みだろうからこれ使って商業利用して訴えられた時点でほぼ負けみたいなもん
凄い時代になったな本当。AIで文章、AIでイラスト、AIで音声、クリエイターとかアーティストは可哀想だけどさ。
ノベルAIはマジで凄いけど、さすがに他のAIはゴミかな
いや、個人でこんだけのもの作ったのはバケモンだけど
■ このスレッドは過去ログ倉庫に格納されています