俺は今のAI事情を憂いている。画像処理とテキストばかり…そろそろ音声処理にも注目しろよ [435886538]
■ このスレッドは過去ログ倉庫に格納されています
1. アニメ作品からAIがキャラ毎にVoice抽出
2. VoiceをAIが文字起こし
3. Voiceとテキストを学習データに音声生成モデルを作成
4. AIでテキスト生成
5. AIでテキストに合わせたイラスト生成
6. テキストを3の萌えボAIで朗読
7. 4~6を無限ループ
これを実現のに1,2,3がまるで進歩してないんじゃ夢のまた夢だよ
画像やテキストに比べて音声処理ってそんなに複雑なの?
>>2
落ち着けよ中卒 AIで大統領だとかセレブリティに好き放題喋らせてる動画がYoutubeに溢れてるぞ なんで他人任せなんだよ
お前が開発しろよ
こういうメンタリティーのゴミばかりだから昨今のAIブームでジャップは蚊帳の外なんだよ chatGPTが相手してくれる電話番号あるから一日中話してろよ なんに使うの?
ディープフェイク的な悪いことしか思いつかない 指定したイラストじゃなくて動画を作ってくれるAIができるのは何年後だろう
>>5
それ声質変換してたりしない?
音声生成してるとしてもノイズ酷かったり感情無かったり抑揚変だったり
音声処理に至ってはGPTみたいな技術革新がまだない気がする おっさん声の配信者がある日突然有名声優になったりするの? 音声処理はもともとAI関係なく発達してるから
著作権とか面倒なんだろうな ht
tps://video.twimg.com/ext_tw_video/1617498731317985280/pu/vid/548x480/eB5K0xxpoovhcdNX.mp4
同人音声自作できるようになれば一生困らないんだがな もうとっくに溢れ返って問題になってんのに何言ってんだこいつ 今のカタコト音声から自然な音声にする事で得られる物ってそんな無さそう
しゃーない、いっちょ作りますか…w
まず機械学習と深層学習の違いから調べるわ つか、絵も文章も音楽もボイスも出来たら
それこそ作品を氾濫しすぎてカオスになりそうだな 政治家が絶対に許さない
自分の音声勝手にでっち上げて貶められるからな オリジナルの声をポンポン生み出せるようになったらスレ立てて
>>26
あの声正直ボイスロイドの発展って感じ強くて好きじゃない
MoeGoe.exeの方が期待出来たけどクローズドになってから一切話題にならないしなぁ /::::::::ソ::::::::: :゛'ヽ、
/:::::::-、:::i´i|::|/:::::::::::ヽ
.. /::::::,,、ミ"ヽ` "゛ / ::::::ヽ
/::::::== `-::::::::ヽ >>31
::::::::/.,,,=≡, ,≡=、、 l:::::::l
/´| i::::::::l゛. ,ィェァ; ィェァ l:::::::!
| | /´/.|`:::| :⌒ノ/.. i\:⌒ .|:::::i
| | / / (i ″ i i i //
__rート、 l' / .ヽ Vi i /
{ ! {、ヽ. l/. lヽ ー-― ´/´
ハ_>Jノ l | |、 ヽ ` ̄´ /
..{ / /{ /\/ ヽ ` "ー-´/、 MATLABにdeep learning toolboxがあるぞ 声系も確かやってるだろ?
どちらにしても望んだ声をまるで人間みたいに話せるってのはかなり不味いんだけどな
普通に犯罪利用されるの間違いないし
>>34
ツールってだけでモデルの公開じゃないしどうせ日本語入れたら破綻するパターンだろ
そういう話じゃないんだよ 声系は中華がすごいでしょ
modelも公開されてるし 合成音声で無気味の谷を越えるのは相当難しい
研究やネットの記事だとうまくいってるとこだけ見せようとするけど、実際に自然な発話ができる例は少ない
エンドユーザー向けで軽くてちゃんと動くのはVOICEPEAK以外見たことがない
画像生成の方ばっかりに才能が集まって、ピッチ、音量等のパラメータや音響特徴量の生成技術が未成熟なままで止まってる
音声波形を生成するニューラルボコーダーの技術もちゃんと広まってなくて、あちこちで車輪の再発明みたいな検討がされてる 要はこれをAIで出来ちまうようにしろってことだろ?
夢の技術だな
https://nico.ms/sm41314771
>>45
面白いけど違和感しかねーだろw
まぁ色々難しいっぽいんだな
折角だし調べてみるわ ゲーム会社は製作過程でセリフ変更多いから音声合成に注目してるみたいだな 日本にはミクさんとずんだもんがいるから( ´ ▽ ` )ノ 日本の声優の声からAIが英語版吹き替えを生成ってこの前話題になってたな 音声系のAIは動物の鳴き声を翻訳するほうに向かっていくんじゃね?
アニメキャラにしゃべらせるのは版権がうるさい >>52
死ぬのはAIの淘汰圧で余裕無い弱者男性だろw >>53
画像生成みたいにあらゆる声の特徴からオリジナルの萌え声生成なんてのはまだまだ先なのかね こんなこと言うのもなんだけど声の需要って文章や絵に比べるとあまり大きくないよね 安倍はAI音声が不自然でも違和感ないのが凄い
本物が不自然だったからな >>3
それにどんな商業的需要があるの?
パクリをしたいだけだろ またいつものコテの人が貼りに来るぞ
ジャップはいろいろうるさいからハブられてるけどとっくに音声まで侵略されてる >>48
私のおまんこ見てください
とか普通に言うしオタク発狂やろ
ロリ声しかないぽいけど >>55
大分前にVALL-Eが発表されたろ
3秒程度のサンプルで合成できるそうな
法的・倫理的にヤバイから公開しないそうだが >>63
OpenAIからもwhisper APIが出てる >>48
日本語と判別できなくて音声がバグることがあるからpykakasi通した方が良いのでは? ■ このスレッドは過去ログ倉庫に格納されています