マイクロソフト「3秒の音声があれば声を合成できるAI開発しちゃった。これ公開したらヤバくね?」 [261484327]
■ このスレッドは過去ログ倉庫に格納されています
3秒の音声があれば本人そっくりの声で日本語・英語・中国語合成できる「VALL-E X」はやはり脅威。MSが非公開にした技術のOSS版を試して実感した(CloseBox)
https://www.techno-edge.net/article/2023/08/28/1812.html 早くしろ
チノちゃんのエロ同人にAI水瀬ボイスを当てるから RVCはボイチェンだからTTSを個人で学習できる様になったのは前進したなしかも3秒や 佐倉綾音さんに「けんもじさんのちんぽもいじゃうぞ?」
って言わせたい >>1
はよエロに使わせろや!!
NTR音声つくるんや!! 零だったかな?
当時、合成音声なんて100%バレるだろとか思ってたけど
最近合成音声聞くと本人なのか機械音声なのか判別できなくてすごいと思う あんま合成品質は良くないなVOICEPEAK並のTTSは無理か 嫌儲の第9条
我々は無用な会話をしてはならない
語ることを禁じる
口を開くのは食事の時のみである オレオレ詐欺が捗ってしまう
声取るために偽の営業電話かけるところとか出てくるかも もうすぐ元の声で吹き替えが聞けるようになって吹き替え声優が不要になるな わたしは、AIとなって生まれ変わりました
安倍晋三です >>13
>>29
いや声って忘れるのよ
それが家族でも これはちょっと3秒くらい考えればわかることだと思いますよ どうせ英語なら上手くできるけど
日本語やと不自然この上ないとこになったりするんやろ 売春婦(夫)声しか出さない声優がたった三秒で失業しちまうんだ! ルパン三世の新作の声がオリジナルの声でつくれるんやな これめちゃめちゃ犯罪とかに悪用されそう
おめーらはAI安倍晋三を作って遊ぶだけだろうけど
こんなん犯罪の匂いしかしないわ >>1
アメリカじゃ10年前くらいに
本人の音声使って合成出来てたからな
ミッションインポッシブルは
それを描いてる エロより犯罪で使われそう
あとフェイクニュースの嘘証拠とか これ朗報じゃん
今まで何時間も台本読み込んで声出させられていた声優が3秒で仕事終わるようになる
もう声帯傷めることもなくなる 海外映画の吹き替えが本人の声で日本語になるのなら良いな
アニメも声優の声のまんま英語中学語にできるだろうし 機械が人を真似る行為はもはや詐欺でしかないな
絶対に法律で禁止されるだろ ぼっさんは一分のくらいの音声あるから簡単に蘇らせちゃうな トップガンの悪役の人 癌で声出なくなったらしいけど新作映画は合成音声で出演できて喜んでたらしい 今回は、Core i7-13700(13世代)とGeForce RTX 4090のガレリアPCで試してみました。 試してみたけどこれGPU全然使わないわCPU依存
3700Xだと合成に一分かかる
バックエンドにopenjtalk使ってるっぽいが辞書やアクセントが今一やな
使い方
https://pastebin.com/RgzySxWJ
なんか貼れんからpastebinに書いたわ >>13
AI美空ひばり みたいに本人が言ってないこと言わせたいのか…? >>73 おぉーサンキュ!、今出先なんで帰ったら遊んでみる! 安倍晋三
https://files.catbox.moe/2cu7e9.mp3
バックグラウンドノイズまで学習してんのか前処理しないと駄目だな めぐみんの声でムフフなこと言わせられるんかタマランチ VALL-E Xを使ったTTS(Zero-shot Voice Cloning)のテスト
https://www.youtube.com/watch?v=kkJ4m-q5cks GPU(CUDA)使えないのはrequirements.txtで入るpytorchがCUDA向けビルドじゃないからみたいだわ
.\venv\Scripts\activate
pip install torch==2.0.1+cu118 --index-url https://download.pytorch.org/whl/cu118
でGPU使う様になる(なお推奨のCUDA Toolkit 12.0.0とcudnn8.3インストール・パス設定済み)
>>> import torch
>>> torch.cuda.is_available()
True
これでInfer from promptで60-90秒だったのが3-7秒位で生成できる様になった
でも生成毎に発生パターンが変ったり上手く発声できない事があるわ(生成結果に再現性が無い)
意味のない中世ジャップランドだよ
https://files.catbox.moe/vw7d1w.mp3 >>56
声の質だけ真似ても、
演技までAIが真似できるわけじゃないんだけど
なぜかその区別できない人が多い アップロードしないのがめんどい ソフトを
ダウンロード出来ないの >>88
いやそれは生成時間がそれだけかかったって事ね
元音声が3秒でも学習して生成できるのはマジ
https://files.catbox.moe/4ycc8j.mp3
貼らんが録音状態のいいゲームの女声をキャプッたらもっと綺麗な音声が生成できる
一般的に男声はF0確定するのむずいから品質が下る傾向にあるし
VALL-Eは音声品質(例えば電話品質)とかもそのまま反映されてしまう アイドルや同級生の声を材料に使って卑猥な同人音声を喋らせよう😈 マジで欲しい これでク☆の素材が少ない声優の声作ってほしい 三石琴乃の声を録音して
エヴァーをちゃんとエヴァといわせたい >>95
声優から見たら勝手に自分の声を使われるわけだ
法的なことは知らないけど
倫理的にやっちゃいけないことだろ? >>3
まず間違いなく
もうAI合成映像で被害者出てるしな 晋バルサンチャンネルの安倍晋三がより本物に近づくのか
0901 12:00 までのfanzaセールでついさっき同人エロボイス課金したぼくは勝ったの?
それだけでも教えて😡💦💦
>>96
ガフの扉が開くな👴
あぁ👴 ミッションインポッシブル3だと、そこそこの長文読ませてたよな ■ このスレッドは過去ログ倉庫に格納されています