俺は今のAI事情を憂いている。画像処理とテキストばかり…そろそろ音声処理にも注目しろよ [435886538]

?2BP(1000) · 2023/03/16(木) 11:28:10.85

1. アニメ作品からAIがキャラ毎にVoice抽出
2. VoiceをAIが文字起こし
3. Voiceとテキストを学習データに音声生成モデルを作成
4. AIでテキスト生成
5. AIでテキストに合わせたイラスト生成
6. テキストを3の萌えボAIで朗読
7. 4～6を無限ループ
これを実現のに1,2,3がまるで進歩してないんじゃ夢のまた夢だよ

画像やテキストに比べて音声処理ってそんなに複雑なの？