X

俺は今のAI事情を憂いている。画像処理とテキストばかり…そろそろ音声処理にも注目しろよ [435886538]

■ このスレッドは過去ログ倉庫に格納されています
1番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW d68f-dLPv)
垢版 |
2023/03/16(木) 11:27:24.26ID:eFrDprfD0?2BP(1000)

ディープラーニングの仕組みをわかりやすく解説丨音声認識との関連は?|トラムシステム
https://www.tramsystem.jp/voice/voice-4279/
2番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ f986-JIpj)
垢版 |
2023/03/16(木) 11:27:58.93ID:IN6UaIuW0
お前が作れば高卒
3番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW d68f-dLPv)
垢版 |
2023/03/16(木) 11:28:10.85ID:eFrDprfD0?2BP(1000)

1. アニメ作品からAIがキャラ毎にVoice抽出
2. VoiceをAIが文字起こし
3. Voiceとテキストを学習データに音声生成モデルを作成
4. AIでテキスト生成
5. AIでテキストに合わせたイラスト生成
6. テキストを3の萌えボAIで朗読
7. 4~6を無限ループ
これを実現のに1,2,3がまるで進歩してないんじゃ夢のまた夢だよ

画像やテキストに比べて音声処理ってそんなに複雑なの?
4番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW d68f-dLPv)
垢版 |
2023/03/16(木) 11:28:55.37ID:eFrDprfD0?2BP(1000)

>>2
落ち着けよ中卒
2023/03/16(木) 11:28:56.09ID:LUlseFTB0
AIで大統領だとかセレブリティに好き放題喋らせてる動画がYoutubeに溢れてるぞ
6番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW ddaf-+Zbp)
垢版 |
2023/03/16(木) 11:28:58.17ID:7w+mcn8Q0
声はもう出来てるでしょ!

ボデーをはよう!!
2023/03/16(木) 11:30:03.55ID:n2qCyuJ/0
お前ら絶対AIの安倍晋三作る気だろ
2023/03/16(木) 11:30:10.20ID:ifQC1C260
so-vits-svcとかすごいよな
2023/03/16(木) 11:30:58.70ID:fQGZw104M
AIで動く3Dモデルも頼む
10番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW fa8f-vD2A)
垢版 |
2023/03/16(木) 11:31:09.37ID:MnnVa0TC0
会話できないの?
11番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ d609-S+nL)
垢版 |
2023/03/16(木) 11:31:20.21ID:UkPlCYrN0
なんで他人任せなんだよ
お前が開発しろよ
こういうメンタリティーのゴミばかりだから昨今のAIブームでジャップは蚊帳の外なんだよ
2023/03/16(木) 11:31:50.20ID:fQGZw104M
AIで健康と家計簿の管理も頼む
13番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW a50f-4235)
垢版 |
2023/03/16(木) 11:31:52.06ID:9ll2f+Ui0
chatGPTが相手してくれる電話番号あるから一日中話してろよ
2023/03/16(木) 11:31:58.58ID:wJXZfoZua
JASRACが煩い
15番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW e5af-Lsq1)
垢版 |
2023/03/16(木) 11:32:20.73ID:8jwxXYbX0
なんに使うの?
ディープフェイク的な悪いことしか思いつかない
16番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ 3156-JIpj)
垢版 |
2023/03/16(木) 11:32:42.90ID:AoHBHjWL0
指定したイラストじゃなくて動画を作ってくれるAIができるのは何年後だろう
17番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW d68f-dLPv)
垢版 |
2023/03/16(木) 11:32:49.85ID:eFrDprfD0?2BP(1000)

>>5
それ声質変換してたりしない?
音声生成してるとしてもノイズ酷かったり感情無かったり抑揚変だったり
音声処理に至ってはGPTみたいな技術革新がまだない気がする
2023/03/16(木) 11:33:07.38ID:86nTLOUV0
おっさん声の配信者がある日突然有名声優になったりするの?
2023/03/16(木) 11:33:12.33ID:83viv8GXM
音声処理はもともとAI関係なく発達してるから
著作権とか面倒なんだろうな
20番組の途中ですがアフィサイトへの転載は禁止です (オイコラミネオ MM3d-cpDT)
垢版 |
2023/03/16(木) 11:33:15.25ID:Cs7W3tjyM
ht
tps://video.twimg.com/ext_tw_video/1617498731317985280/pu/vid/548x480/eB5K0xxpoovhcdNX.mp4
 
21番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW a50f-4235)
垢版 |
2023/03/16(木) 11:34:07.45ID:9ll2f+Ui0
>>16
既にある
22番組の途中ですがアフィサイトへの転載は禁止です (ブーイモ MM4d-rS8L)
垢版 |
2023/03/16(木) 11:34:16.54ID:PeS0zXixM
同人音声自作できるようになれば一生困らないんだがな
23番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW 5518-5Ln4)
垢版 |
2023/03/16(木) 11:34:50.79ID:C4B/8M+P0
>>20
たのしそう
2023/03/16(木) 11:36:27.20ID:CXYPxW3N0
きりたんがいるじゃん
2023/03/16(木) 11:36:31.68ID:Mse2DFVS0
もうとっくに溢れ返って問題になってんのに何言ってんだこいつ
2023/03/16(木) 11:37:16.71ID:8a6KouSX0
ずんだもん
27番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ 7aa4-JIpj)
垢版 |
2023/03/16(木) 11:37:22.80ID:p0LVtprk0
今のカタコト音声から自然な音声にする事で得られる物ってそんな無さそう
28番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW d68f-dLPv)
垢版 |
2023/03/16(木) 11:37:36.11ID:eFrDprfD0?2BP(1000)

しゃーない、いっちょ作りますか…w
まず機械学習と深層学習の違いから調べるわ
2023/03/16(木) 11:37:37.40ID:/9YCON4a0
つか、絵も文章も音楽もボイスも出来たら
それこそ作品を氾濫しすぎてカオスになりそうだな
2023/03/16(木) 11:37:59.84ID:q3/izmBhM
>>3
4~6は無限ループせんだろ
2023/03/16(木) 11:39:10.26ID:ISzVWPr60
政治家が絶対に許さない
自分の音声勝手にでっち上げて貶められるからな
32番組の途中ですがアフィサイトへの転載は禁止です (ブーイモ MM9a-PCce)
垢版 |
2023/03/16(木) 11:39:19.57ID:mv9ijIoOM
オリジナルの声をポンポン生み出せるようになったらスレ立てて
33番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ a174-JIpj)
垢版 |
2023/03/16(木) 11:40:04.85ID:RkGPW7wg0
結果的に完成が一番早いのは音声じゃねえかなぁ
34番組の途中ですがアフィサイトへの転載は禁止です (テテンテンテン MMee-lD+f)
垢版 |
2023/03/16(木) 11:40:39.52ID:ealdCobyM
https://www.techno-edge.net/article/2023/02/01/795.html
ちょっとググったら記事出てきたが
35番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW fa4d-3Rkh)
垢版 |
2023/03/16(木) 11:40:39.67ID:n3xqi2bs0
技術自体はあるからあとはリソースだろ
36番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW d68f-dLPv)
垢版 |
2023/03/16(木) 11:41:08.54ID:eFrDprfD0?2BP(1000)

>>26
あの声正直ボイスロイドの発展って感じ強くて好きじゃない
MoeGoe.exeの方が期待出来たけどクローズドになってから一切話題にならないしなぁ
37番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ 4d97-Lp6G)
垢版 |
2023/03/16(木) 11:41:10.46ID:hktsDzGG0
             /::::::::ソ::::::::: :゛'ヽ、
            /:::::::-、:::i´i|::|/:::::::::::ヽ
          .. /::::::,,、ミ"ヽ` "゛ / ::::::ヽ
          /::::::==       `-::::::::ヽ >>31
          ::::::::/.,,,=≡, ,≡=、、 l:::::::l 
    /´|    i::::::::l゛. ,ィェァ;  ィェァ   l:::::::! 
    | |  /´/.|`:::| :⌒ノ/.. i\:⌒  .|:::::i 
    | | / /  (i ″     i i     i // 
  __rート、 l' /   .ヽ      Vi     i / 
 { ! {、ヽ. l/.    lヽ   ー-―  ´/´  
 ハ_>Jノ l |      |、 ヽ  ` ̄´ /   
..{  /  /{  /\/ ヽ ` "ー-´/、
2023/03/16(木) 11:42:45.07ID:LP/IswJy0
MATLABにdeep learning toolboxがあるぞ
2023/03/16(木) 11:43:00.64ID:wja9oWsG0
声系も確かやってるだろ?
どちらにしても望んだ声をまるで人間みたいに話せるってのはかなり不味いんだけどな
普通に犯罪利用されるの間違いないし
40番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW d68f-dLPv)
垢版 |
2023/03/16(木) 11:44:24.00ID:eFrDprfD0?2BP(1000)

>>34
ツールってだけでモデルの公開じゃないしどうせ日本語入れたら破綻するパターンだろ
そういう話じゃないんだよ
2023/03/16(木) 11:47:12.57ID:n4LBVNu0a
声系は中華がすごいでしょ
modelも公開されてるし
42番組の途中ですがアフィサイトへの転載は禁止です (テテンテンテン MMee-fWy/)
垢版 |
2023/03/16(木) 11:47:32.36ID:kPz3KYfzM
声豚にしか需要がないからじゃね?
43番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW 81f5-rnO6)
垢版 |
2023/03/16(木) 11:48:21.38ID:baLeANYN0
合成音声で無気味の谷を越えるのは相当難しい
研究やネットの記事だとうまくいってるとこだけ見せようとするけど、実際に自然な発話ができる例は少ない
エンドユーザー向けで軽くてちゃんと動くのはVOICEPEAK以外見たことがない
画像生成の方ばっかりに才能が集まって、ピッチ、音量等のパラメータや音響特徴量の生成技術が未成熟なままで止まってる
音声波形を生成するニューラルボコーダーの技術もちゃんと広まってなくて、あちこちで車輪の再発明みたいな検討がされてる
2023/03/16(木) 11:49:12.54ID:VZVrAStn0
要はこれをAIで出来ちまうようにしろってことだろ?
夢の技術だな

https://nico.ms/sm41314771
45番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW ddaf-IkJP)
垢版 |
2023/03/16(木) 11:49:30.27ID:kDLvrCXx0
もう出来てる

https://youtu.be/nS7hWpYvHlo
46番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW d68f-dLPv)
垢版 |
2023/03/16(木) 11:52:58.85ID:eFrDprfD0?2BP(1000)

>>45
面白いけど違和感しかねーだろw

まぁ色々難しいっぽいんだな
折角だし調べてみるわ
2023/03/16(木) 11:53:09.42ID:VfasJzAlr
ゲーム会社は製作過程でセリフ変更多いから音声合成に注目してるみたいだな
2023/03/16(木) 11:56:04.82ID:4LME0wyY0
これは結構凄い
イントネーションも違和感ない


AIでラブライブ!声優の喋りを生成するツール (日本語入力 可)
https://huggingface.co/spaces/CarlDennis/Lovelive-VITS-JPZH
2023/03/16(木) 11:59:32.74ID:4F3NO9Ix0
ニュース記事を生成するAIきぼんぬ
2023/03/16(木) 12:01:19.95ID:WILTgSvXM
日本にはミクさんとずんだもんがいるから( ´ ▽ ` )ノ
2023/03/16(木) 12:06:56.65ID:8a6KouSX0
日本の声優の声からAIが英語版吹き替えを生成ってこの前話題になってたな
2023/03/16(木) 12:10:02.03ID:pKUWl6Yw0
勝手に憂いてろバーカ死ねよ。
2023/03/16(木) 12:14:46.63ID:Hw0hN0x0M
音声系のAIは動物の鳴き声を翻訳するほうに向かっていくんじゃね?
アニメキャラにしゃべらせるのは版権がうるさい
54番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW 9d08-OJpK)
垢版 |
2023/03/16(木) 12:15:20.51ID:BlZTLkmX0
>>52
死ぬのはAIの淘汰圧で余裕無い弱者男性だろw
55番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW d68f-OJpK)
垢版 |
2023/03/16(木) 12:18:42.32ID:eFrDprfD0
>>53
画像生成みたいにあらゆる声の特徴からオリジナルの萌え声生成なんてのはまだまだ先なのかね
56番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW 190d-RaqI)
垢版 |
2023/03/16(木) 12:28:51.49ID:14BmDSM+0
こんなこと言うのもなんだけど声の需要って文章や絵に比べるとあまり大きくないよね
2023/03/16(木) 12:41:50.98ID:kzL1WEDd0
死んだ声優AIで生き返らせてほしい
山田康雄とか
58番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW e5af-xRbr)
垢版 |
2023/03/16(木) 14:03:47.74ID:RzKyn8ZI0
>>7
素材が多いので作りやすいからな
59番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW ddaf-IkJP)
垢版 |
2023/03/16(木) 14:43:56.46ID:kDLvrCXx0
安倍はAI音声が不自然でも違和感ないのが凄い
本物が不自然だったからな
60番組の途中ですがアフィサイトへの転載は禁止です (アウアウウー Sa89-8HOj)
垢版 |
2023/03/16(木) 15:55:48.60ID:id30HPJva
>>3
それにどんな商業的需要があるの?
パクリをしたいだけだろ
61番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイ a587-QsVm)
垢版 |
2023/03/16(木) 15:59:14.87ID:wXGFNE0X0
またいつものコテの人が貼りに来るぞ
ジャップはいろいろうるさいからハブられてるけどとっくに音声まで侵略されてる
62番組の途中ですがアフィサイトへの転載は禁止です (ワッチョイW a50f-4235)
垢版 |
2023/03/16(木) 16:00:06.27ID:9ll2f+Ui0
>>48
私のおまんこ見てください
とか普通に言うしオタク発狂やろ
ロリ声しかないぽいけど
2023/03/16(木) 16:20:56.37ID:3M6R/+og0
>>55
大分前にVALL-Eが発表されたろ
3秒程度のサンプルで合成できるそうな
法的・倫理的にヤバイから公開しないそうだが
2023/03/16(木) 17:02:12.35ID:yOmjzBbUM
>>1
えっと

とっくに出てるんだが。。
2023/03/16(木) 17:02:45.36ID:yOmjzBbUM
>>63
OpenAIからもwhisper APIが出てる
2023/03/16(木) 17:42:53.07ID:nEvu3fpV0
>>48
日本語と判別できなくて音声がバグることがあるからpykakasi通した方が良いのでは?
■ このスレッドは過去ログ倉庫に格納されています
5ちゃんねるの広告が気に入らない場合は、こちらをクリックしてください。

ニューススポーツなんでも実況