俺は今のAI事情を憂いている。画像処理とテキストばかり…そろそろ音声処理にも注目しろよ [435886538]

?2BP(1000) · 2023/03/16(木) 11:27:24.26

ディープラーニングの仕組みをわかりやすく解説丨音声認識との関連は？｜トラムシステム
https://www.tramsystem.jp/voice/voice-4279/

2023/03/16(木) 11:27:58.93

お前が作れば高卒

?2BP(1000) · 2023/03/16(木) 11:28:10.85

1. アニメ作品からAIがキャラ毎にVoice抽出
2. VoiceをAIが文字起こし
3. Voiceとテキストを学習データに音声生成モデルを作成
4. AIでテキスト生成
5. AIでテキストに合わせたイラスト生成
6. テキストを3の萌えボAIで朗読
7. 4～6を無限ループ
これを実現のに1,2,3がまるで進歩してないんじゃ夢のまた夢だよ

画像やテキストに比べて音声処理ってそんなに複雑なの？

?2BP(1000) · 2023/03/16(木) 11:28:55.37

>>2
落ち着けよ中卒

2023/03/16(木) 11:28:56.09

AIで大統領だとかセレブリティに好き放題喋らせてる動画がYoutubeに溢れてるぞ

2023/03/16(木) 11:28:58.17

声はもう出来てるでしょ！

ボデーをはよう！！

2023/03/16(木) 11:30:03.55

お前ら絶対AIの安倍晋三作る気だろ

2023/03/16(木) 11:30:10.20

so-vits-svcとかすごいよな

2023/03/16(木) 11:30:58.70

AIで動く3Dモデルも頼む

2023/03/16(木) 11:31:09.37

会話できないの？

2023/03/16(木) 11:31:20.21

なんで他人任せなんだよ
お前が開発しろよ
こういうメンタリティーのゴミばかりだから昨今のAIブームでジャップは蚊帳の外なんだよ

2023/03/16(木) 11:31:50.20

AIで健康と家計簿の管理も頼む

2023/03/16(木) 11:31:52.06

chatGPTが相手してくれる電話番号あるから一日中話してろよ

2023/03/16(木) 11:31:58.58

JASRACが煩い

2023/03/16(木) 11:32:20.73

なんに使うの？
ディープフェイク的な悪いことしか思いつかない

2023/03/16(木) 11:32:42.90

指定したイラストじゃなくて動画を作ってくれるAIができるのは何年後だろう

?2BP(1000) · 2023/03/16(木) 11:32:49.85

>>5
それ声質変換してたりしない？
音声生成してるとしてもノイズ酷かったり感情無かったり抑揚変だったり
音声処理に至ってはGPTみたいな技術革新がまだない気がする

2023/03/16(木) 11:33:07.38

おっさん声の配信者がある日突然有名声優になったりするの？

2023/03/16(木) 11:33:12.33

音声処理はもともとAI関係なく発達してるから
著作権とか面倒なんだろうな

2023/03/16(木) 11:33:15.25

ht
tps://video.twimg.com/ext_tw_video/1617498731317985280/pu/vid/548x480/eB5K0xxpoovhcdNX.mp4
　

2023/03/16(木) 11:34:07.45

>>16
既にある

2023/03/16(木) 11:34:16.54

同人音声自作できるようになれば一生困らないんだがな

2023/03/16(木) 11:34:50.79

>>20
たのしそう

2023/03/16(木) 11:36:27.20

きりたんがいるじゃん

2023/03/16(木) 11:36:31.68

もうとっくに溢れ返って問題になってんのに何言ってんだこいつ

2023/03/16(木) 11:37:16.71

ずんだもん

2023/03/16(木) 11:37:22.80

今のカタコト音声から自然な音声にする事で得られる物ってそんな無さそう

?2BP(1000) · 2023/03/16(木) 11:37:36.11

しゃーない、いっちょ作りますか…w
まず機械学習と深層学習の違いから調べるわ

2023/03/16(木) 11:37:37.40

つか、絵も文章も音楽もボイスも出来たら
それこそ作品を氾濫しすぎてカオスになりそうだな

2023/03/16(木) 11:37:59.84

>>3
4～6は無限ループせんだろ

2023/03/16(木) 11:39:10.26

政治家が絶対に許さない
自分の音声勝手にでっち上げて貶められるからな

2023/03/16(木) 11:39:19.57

オリジナルの声をポンポン生み出せるようになったらスレ立てて

2023/03/16(木) 11:40:04.85

結果的に完成が一番早いのは音声じゃねえかなぁ

2023/03/16(木) 11:40:39.52

https://www.techno-edge.net/article/2023/02/01/795.html
ちょっとググったら記事出てきたが

2023/03/16(木) 11:40:39.67

技術自体はあるからあとはリソースだろ

?2BP(1000) · 2023/03/16(木) 11:41:08.54

>>26
あの声正直ボイスロイドの発展って感じ強くて好きじゃない
MoeGoe.exeの方が期待出来たけどクローズドになってから一切話題にならないしなぁ

2023/03/16(木) 11:41:10.46

　　　　　　　　　　　　　／::::::::ソ:::::::::　:゛'ヽ、
　　　　　　　　　　　　/:::::::-、:::i´i|::|/:::::::::::ヽ
　　　　　　　　　　.. /::::::,,、ミ"ヽ｀　"゛　/ ::::::ヽ
　　　　　　　　　　/::::::==　　　　　　　`-::::::::ヽ　>>31
　　　　　　　　　　::::::::／.,,,=≡,　,≡=、、　l:::::::l　
　　　　/´|　　　　i::::::::l゛. ,ｨｪｧ;　　ｨｪｧ　　l:::::::!　
　　　　|　|　　/´/.|`:::|　:⌒ノ/..　i＼:⌒ 　.|:::::i　
　　　　|　|　/ /　　(i ″　　　　i i　　　　　i //　
　 __rｰﾄ､ l'　/　　　.ヽ　　　　 Vi　　　　 i /　
　{　!　{､ヽ. l/.　　　　lヽ　　　ー-―　　´/´　　
　ﾊ_>Jﾉ　l |　　　　　|、ヽ　　｀￣´　／　　
..{　 /　　/{　　／＼／ヽ　｀ "ー－´/、

2023/03/16(木) 11:42:45.07

MATLABにdeep learning toolboxがあるぞ

2023/03/16(木) 11:43:00.64

声系も確かやってるだろ？
どちらにしても望んだ声をまるで人間みたいに話せるってのはかなり不味いんだけどな
普通に犯罪利用されるの間違いないし

?2BP(1000) · 2023/03/16(木) 11:44:24.00

>>34
ツールってだけでモデルの公開じゃないしどうせ日本語入れたら破綻するパターンだろ
そういう話じゃないんだよ

2023/03/16(木) 11:47:12.57

声系は中華がすごいでしょ
modelも公開されてるし

2023/03/16(木) 11:47:32.36

声豚にしか需要がないからじゃね？

2023/03/16(木) 11:48:21.38

合成音声で無気味の谷を越えるのは相当難しい
研究やネットの記事だとうまくいってるとこだけ見せようとするけど、実際に自然な発話ができる例は少ない
エンドユーザー向けで軽くてちゃんと動くのはVOICEPEAK以外見たことがない
画像生成の方ばっかりに才能が集まって、ピッチ、音量等のパラメータや音響特徴量の生成技術が未成熟なままで止まってる
音声波形を生成するニューラルボコーダーの技術もちゃんと広まってなくて、あちこちで車輪の再発明みたいな検討がされてる

2023/03/16(木) 11:49:12.54

要はこれをAIで出来ちまうようにしろってことだろ？
夢の技術だな

https://nico.ms/sm41314771

2023/03/16(木) 11:49:30.27

もう出来てる

https://youtu.be/nS7hWpYvHlo

?2BP(1000) · 2023/03/16(木) 11:52:58.85

>>45
面白いけど違和感しかねーだろw

まぁ色々難しいっぽいんだな
折角だし調べてみるわ

2023/03/16(木) 11:53:09.42

ゲーム会社は製作過程でセリフ変更多いから音声合成に注目してるみたいだな

2023/03/16(木) 11:56:04.82

これは結構凄い
イントネーションも違和感ない

AIでラブライブ！声優の喋りを生成するツール　（日本語入力可）
https://huggingface.co/spaces/CarlDennis/Lovelive-VITS-JPZH

2023/03/16(木) 11:59:32.74

ニュース記事を生成するAIきぼんぬ

2023/03/16(木) 12:01:19.95

日本にはミクさんとずんだもんがいるから( ´ ▽ ` )ﾉ

2023/03/16(木) 12:06:56.65

日本の声優の声からAIが英語版吹き替えを生成ってこの前話題になってたな

2023/03/16(木) 12:10:02.03

勝手に憂いてろバーカ死ねよ。

2023/03/16(木) 12:14:46.63

音声系のAIは動物の鳴き声を翻訳するほうに向かっていくんじゃね？
アニメキャラにしゃべらせるのは版権がうるさい

2023/03/16(木) 12:15:20.51

>>52
死ぬのはAIの淘汰圧で余裕無い弱者男性だろw

2023/03/16(木) 12:18:42.32

>>53
画像生成みたいにあらゆる声の特徴からオリジナルの萌え声生成なんてのはまだまだ先なのかね

2023/03/16(木) 12:28:51.49

こんなこと言うのもなんだけど声の需要って文章や絵に比べるとあまり大きくないよね

2023/03/16(木) 12:41:50.98

死んだ声優AIで生き返らせてほしい
山田康雄とか

2023/03/16(木) 14:03:47.74

>>7
素材が多いので作りやすいからな

2023/03/16(木) 14:43:56.46

安倍はAI音声が不自然でも違和感ないのが凄い
本物が不自然だったからな

2023/03/16(木) 15:55:48.60

>>3
それにどんな商業的需要があるの？
パクリをしたいだけだろ

2023/03/16(木) 15:59:14.87

またいつものコテの人が貼りに来るぞ
ジャップはいろいろうるさいからハブられてるけどとっくに音声まで侵略されてる

2023/03/16(木) 16:00:06.27

>>48
私のおまんこ見てください
とか普通に言うしオタク発狂やろ
ロリ声しかないぽいけど

2023/03/16(木) 16:20:56.37

>>55
大分前にVALL-Eが発表されたろ
3秒程度のサンプルで合成できるそうな
法的・倫理的にヤバイから公開しないそうだが

2023/03/16(木) 17:02:12.35

>>1
えっと

とっくに出てるんだが。。

2023/03/16(木) 17:02:45.36

>>63
OpenAIからもwhisper APIが出てる

2023/03/16(木) 17:42:53.07

>>48
日本語と判別できなくて音声がバグることがあるからpykakasi通した方が良いのでは？