マイクロソフト「3秒の音声があれば声を合成できるAI開発しちゃった。これ公開したらヤバくね？」 [261484327]

?2BP(1000) · 2023/08/29(火) 00:38:39.69

3秒の音声があれば本人そっくりの声で日本語・英語・中国語合成できる「VALL-E X」はやはり脅威。MSが非公開にした技術のOSS版を試して実感した（CloseBox）
https://www.techno-edge.net/article/2023/08/28/1812.html

2023/08/29(火) 04:22:12.49

復活するであります

2023/08/29(火) 04:29:43.78

ぼっさんは一分のくらいの音声あるから簡単に蘇らせちゃうな

2023/08/29(火) 04:44:14.50

トップガンの悪役の人　癌で声出なくなったらしいけど新作映画は合成音声で出演できて喜んでたらしい

2023/08/29(火) 05:06:03.66

ブボボモワッになれるってこと？

2023/08/29(火) 05:12:20.35

女子アナに変態台詞を吐かせる事ができるのか🥺

2023/08/29(火) 05:34:41.59

シュワちゃんの音声を入れましょう

2023/08/29(火) 05:39:26.85

今回は、Core i7-13700（13世代）とGeForce RTX 4090のガレリアPCで試してみました。

2023/08/29(火) 05:45:04.72

透かし検知位あるだろ

2023/08/29(火) 09:38:11.78

AI「大川隆法です」

2023/08/29(火) 10:56:29.95

試してみたけどこれGPU全然使わないわCPU依存
3700Xだと合成に一分かかる
バックエンドにopenjtalk使ってるっぽいが辞書やアクセントが今一やな

使い方
https://pastebin.com/RgzySxWJ

なんか貼れんからpastebinに書いたわ

2023/08/29(火) 11:03:44.09

これでドラえもんの声のぶ代に戻せ

2023/08/29(火) 11:08:52.12

>>13
AI美空ひばりみたいに本人が言ってないこと言わせたいのか…？

2023/08/29(火) 11:15:12.30

>>73 おぉーサンキュ！、今出先なんで帰ったら遊んでみる！

2023/08/29(火) 11:20:02.64

書き忘れたけど python と git はインストール済なのが前提や
https://www.python.org/downloads/release/python-31013/
https://gitforwindows.org/

python --version
Python 3.10.11

で動いた

2023/08/29(火) 11:22:53.54

>>77 重ねてサンキュ！

2023/08/29(火) 12:37:06.42

安倍晋三
https://files.catbox.moe/2cu7e9.mp3

バックグラウンドノイズまで学習してんのか前処理しないと駄目だな

2023/08/29(火) 12:38:29.89

めぐみんの声でムフフなこと言わせられるんかタマランチ

2023/08/29(火) 12:39:39.12

ドラゴンボールはこれで安泰だ

2023/08/29(火) 12:42:22.61

moegoeさんではあかんのか？

2023/08/29(火) 12:45:03.03

VALL-E Xを使ったTTS（Zero-shot Voice Cloning）のテスト
https://www.youtube.com/watch?v=kkJ4m-q5cks

2023/08/29(火) 14:01:03.49

GPU(CUDA)使えないのはrequirements.txtで入るpytorchがCUDA向けビルドじゃないからみたいだわ

.\venv\Scripts\activate
pip install torch==2.0.1+cu118 --index-url https://download.pytorch.org/whl/cu118

でGPU使う様になる(なお推奨のCUDA Toolkit 12.0.0とcudnn8.3インストール・パス設定済み)

>>> import torch
>>> torch.cuda.is_available()
True

これでInfer from promptで60-90秒だったのが3-7秒位で生成できる様になった
でも生成毎に発生パターンが変ったり上手く発声できない事があるわ(生成結果に再現性が無い)

意味のない中世ジャップランドだよ
https://files.catbox.moe/vw7d1w.mp3

2023/08/29(火) 14:18:48.25

24時間365日ビッグマウス企業

2023/08/29(火) 15:23:12.25

>>56
声の質だけ真似ても、
演技までAIが真似できるわけじゃないんだけど
なぜかその区別できない人が多い

2023/08/29(火) 15:53:29.31

アップロードしないのがめんどい　ソフトを
ダウンロード出来ないの

2023/08/29(火) 18:58:53.58

>>84
やっぱ3秒ってことはないのかね

2023/08/29(火) 19:24:47.52

>>88
いやそれは生成時間がそれだけかかったって事ね

元音声が3秒でも学習して生成できるのはマジ
https://files.catbox.moe/4ycc8j.mp3

貼らんが録音状態のいいゲームの女声をキャプッたらもっと綺麗な音声が生成できる
一般的に男声はF0確定するのむずいから品質が下る傾向にあるし
VALL-Eは音声品質(例えば電話品質)とかもそのまま反映されてしまう

2023/08/29(火) 20:54:24.10

オレオレ詐欺に使われる未来がはっきりと見える

2023/08/29(火) 20:56:29.38

これで安倍晋三も蘇る！

2023/08/29(火) 21:36:57.66

>>89
声はきれいやね
元＋変換
https://files.catbox.moe/ev9tym.mp3

2023/08/29(火) 21:52:12.04

アイドルや同級生の声を材料に使って卑猥な同人音声を喋らせよう😈

2023/08/29(火) 21:59:30.65

こっちは声はそっくりだけど音程が低いのは苦手なのか？
https://files.catbox.moe/a63nh2.mp3

2023/08/29(火) 22:13:43.92

マジで欲しい　これでク☆の素材が少ない声優の声作ってほしい

2023/08/30(水) 08:15:33.30

三石琴乃の声を録音して
エヴァーをちゃんとエヴァといわせたい

2023/08/30(水) 11:17:59.76

>>95
声優から見たら勝手に自分の声を使われるわけだ
法的なことは知らないけど
倫理的にやっちゃいけないことだろ？

2023/08/30(水) 16:14:29.79

あげ

2023/08/30(水) 16:26:00.34

>>3
まず間違いなく
もうAI合成映像で被害者出てるしな

2023/08/30(水) 16:42:22.36

晋バルサンチャンネルの安倍晋三がより本物に近づくのか

2023/08/30(水) 16:56:42.48

>>97
んまぁそう…

2023/08/30(水) 19:41:58.41

あげ

2023/08/30(水) 22:39:34.71

あげ

2023/08/30(水) 22:40:41.68

安倍晋三語録が死後も増えてしまう

2023/08/31(木) 03:13:50.15

あげ

2023/08/31(木) 03:26:13.46

バーローごっこできるじゃん

?2BP(1500) · 2023/08/31(木) 09:54:12.50

0901 12:00 までのfanzaセールでついさっき同人エロボイス課金したぼくは勝ったの？
それだけでも教えて😡💦💦

?2BP(1500) · 2023/08/31(木) 09:56:03.10

>>96
ガフの扉が開くな👴
あぁ👴

2023/08/31(木) 10:00:22.72

ミッションインポッシブル3だと、そこそこの長文読ませてたよな

2023/08/31(木) 12:09:19.38

アクセントとかも？

2023/08/31(木) 18:09:38.44

あげ

2023/08/31(木) 18:10:57.13

詐欺業者が舌なめずりして公開を待ってますよ

2023/08/31(木) 19:50:42.78

>>112
https://files.catbox.moe/7g0lof.mp3

2023/08/31(木) 23:31:41.08

あげ