俺は今のAI事情を憂いている。画像処理とテキストばかり…そろそろ音声処理にも注目しろよ [435886538]

■ このスレッドは過去ログ倉庫に格納されています
0001番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW d68f-dLPv)2023/03/16(木) 11:27:24.26ID:eFrDprfD0?2BP(1000)

ディープラーニングの仕組みをわかりやすく解説丨音声認識との関連は?|トラムシステム
https://www.tramsystem.jp/voice/voice-4279/

0016番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ 3156-JIpj)2023/03/16(木) 11:32:42.90ID:AoHBHjWL0
指定したイラストじゃなくて動画を作ってくれるAIができるのは何年後だろう

0017番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW d68f-dLPv)2023/03/16(木) 11:32:49.85ID:eFrDprfD0?2BP(1000)

>>5
それ声質変換してたりしない?
音声生成してるとしてもノイズ酷かったり感情無かったり抑揚変だったり
音声処理に至ってはGPTみたいな技術革新がまだない気がする

おっさん声の配信者がある日突然有名声優になったりするの?

音声処理はもともとAI関係なく発達してるから
著作権とか面倒なんだろうな

0020番組の途中ですがアフィサイトへの転載は禁止です (オイコラミネオ MM3d-cpDT)2023/03/16(木) 11:33:15.25ID:Cs7W3tjyM
ht
tps://video.twimg.com/ext_tw_video/1617498731317985280/pu/vid/548x480/eB5K0xxpoovhcdNX.mp4
 

0021番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW a50f-4235)2023/03/16(木) 11:34:07.45ID:9ll2f+Ui0
>>16
既にある

0022番組の途中ですがアフィサイトへの転載は禁止です (ブーイモ MM4d-rS8L)2023/03/16(木) 11:34:16.54ID:PeS0zXixM
同人音声自作できるようになれば一生困らないんだがな

0023番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW 5518-5Ln4)2023/03/16(木) 11:34:50.79ID:C4B/8M+P0
>>20
たのしそう

きりたんがいるじゃん

もうとっくに溢れ返って問題になってんのに何言ってんだこいつ

ずんだもん

0027番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ 7aa4-JIpj)2023/03/16(木) 11:37:22.80ID:p0LVtprk0
今のカタコト音声から自然な音声にする事で得られる物ってそんな無さそう

0028番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW d68f-dLPv)2023/03/16(木) 11:37:36.11ID:eFrDprfD0?2BP(1000)

しゃーない、いっちょ作りますか…w
まず機械学習と深層学習の違いから調べるわ

つか、絵も文章も音楽もボイスも出来たら
それこそ作品を氾濫しすぎてカオスになりそうだな

>>3
4~6は無限ループせんだろ

政治家が絶対に許さない
自分の音声勝手にでっち上げて貶められるからな

0032番組の途中ですがアフィサイトへの転載は禁止です (ブーイモ MM9a-PCce)2023/03/16(木) 11:39:19.57ID:mv9ijIoOM
オリジナルの声をポンポン生み出せるようになったらスレ立てて

0033番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ a174-JIpj)2023/03/16(木) 11:40:04.85ID:RkGPW7wg0
結果的に完成が一番早いのは音声じゃねえかなぁ

0034番組の途中ですがアフィサイトへの転載は禁止です (テテンテンテン MMee-lD+f)2023/03/16(木) 11:40:39.52ID:ealdCobyM
https://www.techno-edge.net/article/2023/02/01/795.html
ちょっとググったら記事出てきたが

0035番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW fa4d-3Rkh)2023/03/16(木) 11:40:39.67ID:n3xqi2bs0
技術自体はあるからあとはリソースだろ

0036番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW d68f-dLPv)2023/03/16(木) 11:41:08.54ID:eFrDprfD0?2BP(1000)

>>26
あの声正直ボイスロイドの発展って感じ強くて好きじゃない
MoeGoe.exeの方が期待出来たけどクローズドになってから一切話題にならないしなぁ

0037番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ 4d97-Lp6G)2023/03/16(木) 11:41:10.46ID:hktsDzGG0
             /::::::::ソ::::::::: :゛'ヽ、
            /:::::::-、:::i´i|::|/:::::::::::ヽ
          .. /::::::,,、ミ"ヽ` "゛ / ::::::ヽ
          /::::::==       `-::::::::ヽ >>31
          ::::::::/.,,,=≡, ,≡=、、 l:::::::l 
    /´|    i::::::::l゛. ,ィェァ;  ィェァ   l:::::::! 
    | |  /´/.|`:::| :⌒ノ/.. i\:⌒  .|:::::i 
    | | / /  (i ″     i i     i // 
  __rート、 l' /   .ヽ      Vi     i / 
 { ! {、ヽ. l/.    lヽ   ー-―  ´/´  
 ハ_>Jノ l |      |、 ヽ  ` ̄´ /   
..{  /  /{  /\/ ヽ ` "ー-´/、

MATLABにdeep learning toolboxがあるぞ

声系も確かやってるだろ?
どちらにしても望んだ声をまるで人間みたいに話せるってのはかなり不味いんだけどな
普通に犯罪利用されるの間違いないし

0040番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW d68f-dLPv)2023/03/16(木) 11:44:24.00ID:eFrDprfD0?2BP(1000)

>>34
ツールってだけでモデルの公開じゃないしどうせ日本語入れたら破綻するパターンだろ
そういう話じゃないんだよ

声系は中華がすごいでしょ
modelも公開されてるし

0042番組の途中ですがアフィサイトへの転載は禁止です (テテンテンテン MMee-fWy/)2023/03/16(木) 11:47:32.36ID:kPz3KYfzM
声豚にしか需要がないからじゃね?

0043番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW 81f5-rnO6)2023/03/16(木) 11:48:21.38ID:baLeANYN0
合成音声で無気味の谷を越えるのは相当難しい
研究やネットの記事だとうまくいってるとこだけ見せようとするけど、実際に自然な発話ができる例は少ない
エンドユーザー向けで軽くてちゃんと動くのはVOICEPEAK以外見たことがない
画像生成の方ばっかりに才能が集まって、ピッチ、音量等のパラメータや音響特徴量の生成技術が未成熟なままで止まってる
音声波形を生成するニューラルボコーダーの技術もちゃんと広まってなくて、あちこちで車輪の再発明みたいな検討がされてる

要はこれをAIで出来ちまうようにしろってことだろ?
夢の技術だな

https://nico.ms/sm41314771

0045番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW ddaf-IkJP)2023/03/16(木) 11:49:30.27ID:kDLvrCXx0
もう出来てる

https://youtu.be/nS7hWpYvHlo

0046番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW d68f-dLPv)2023/03/16(木) 11:52:58.85ID:eFrDprfD0?2BP(1000)

>>45
面白いけど違和感しかねーだろw

まぁ色々難しいっぽいんだな
折角だし調べてみるわ

ゲーム会社は製作過程でセリフ変更多いから音声合成に注目してるみたいだな

これは結構凄い
イントネーションも違和感ない


AIでラブライブ!声優の喋りを生成するツール (日本語入力 可)
https://huggingface.co/spaces/CarlDennis/Lovelive-VITS-JPZH

ニュース記事を生成するAIきぼんぬ

日本にはミクさんとずんだもんがいるから( ´ ▽ ` )ノ

日本の声優の声からAIが英語版吹き替えを生成ってこの前話題になってたな

勝手に憂いてろバーカ死ねよ。

音声系のAIは動物の鳴き声を翻訳するほうに向かっていくんじゃね?
アニメキャラにしゃべらせるのは版権がうるさい

0054番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW 9d08-OJpK)2023/03/16(木) 12:15:20.51ID:BlZTLkmX0
>>52
死ぬのはAIの淘汰圧で余裕無い弱者男性だろw

0055番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW d68f-OJpK)2023/03/16(木) 12:18:42.32ID:eFrDprfD0
>>53
画像生成みたいにあらゆる声の特徴からオリジナルの萌え声生成なんてのはまだまだ先なのかね

0056番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW 190d-RaqI)2023/03/16(木) 12:28:51.49ID:14BmDSM+0
こんなこと言うのもなんだけど声の需要って文章や絵に比べるとあまり大きくないよね

死んだ声優AIで生き返らせてほしい
山田康雄とか

0058番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW e5af-xRbr)2023/03/16(木) 14:03:47.74ID:RzKyn8ZI0
>>7
素材が多いので作りやすいからな

0059番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW ddaf-IkJP)2023/03/16(木) 14:43:56.46ID:kDLvrCXx0
安倍はAI音声が不自然でも違和感ないのが凄い
本物が不自然だったからな

0060番組の途中ですがアフィサイトへの転載は禁止です (アウアウウー Sa89-8HOj)2023/03/16(木) 15:55:48.60ID:id30HPJva
>>3
それにどんな商業的需要があるの?
パクリをしたいだけだろ

0061番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ a587-QsVm)2023/03/16(木) 15:59:14.87ID:wXGFNE0X0
またいつものコテの人が貼りに来るぞ
ジャップはいろいろうるさいからハブられてるけどとっくに音声まで侵略されてる

0062番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW a50f-4235)2023/03/16(木) 16:00:06.27ID:9ll2f+Ui0
>>48
私のおまんこ見てください
とか普通に言うしオタク発狂やろ
ロリ声しかないぽいけど

>>55
大分前にVALL-Eが発表されたろ
3秒程度のサンプルで合成できるそうな
法的・倫理的にヤバイから公開しないそうだが

>>1
えっと

とっくに出てるんだが。。

>>63
OpenAIからもwhisper APIが出てる

>>48
日本語と判別できなくて音声がバグることがあるからpykakasi通した方が良いのでは?

■ このスレッドは過去ログ倉庫に格納されています