最新の「合成音声読み上げソフト」がもはや人間にしか聞こえない ゆっくり失業か [573472858]
■ このスレッドは過去ログ倉庫に格納されています
2022/02/17
音声合成業界に激震! もはや人間の喋り声、入力文字読み上げソフトVOICEPEAKはビジネス用途でも自由に利用可能
日進月歩というより、秒進分歩で進化している感じのある音声合成、歌声合成の世界ですが、また新たな革命ともいえるAI音声合成ソフトが誕生しました。
これまでDTMステーションでも何度も取り上げてきた歌声合成ソフト、Synthesizer Vを開発するDreamtonics株式会社と株式会社AHSと共同開発する形で、
もはや人間の喋り声にしか聴こえない音声合成ソフト、VOICEPEAKを発表し、3月11日から発売を開始するのです。
Synthesizer Vと同様、Windows、Mac、Linuxでも動くマルチプラットフォームソフトで価格はダウンロード版で23,800円(税込み)となっています。
以下開発者インタビューあり
https://www.dtmstation.com/archives/55090.html MSedgeで音声読み上げすると英語はかなり綺麗に読んでくれる
インド人のタンタンした英語とか
日本人のおっさんのひどいカタカナ英語とかでもできる 体験してみようとおもったら体験版ソフトをダウンロードしないとダメなのか これオーディオブックのコストカットに良さそう
読み上げる人を用意する人件費のせいでめちゃくちゃ高くなってるんだろあれ なんかもうどんな技術も興味ないわ
この世の正体がわかるような量子力学とかだけ興味ある
はよこの世終わらしてくれ ゆっくりやボイスロイドに関してはぎこちない感じがウケてる面もあるからなぁ 別に人間らしさを求めてるわけではないからなぁ
動画投稿者的にはそれを求めてるかもしれんが ゆっくりはあの気の抜けた感じが動画をゆるくするのであって、別に人間がしゃべってる感じがほしいわけじゃないでしょ なかなかやるやんと思ったら広告だったわ糞が
ま、本編もなかなかやってたがね これでAIと組み合わせて完全なる配信者が誕生するのか
中の人とか要らないから >>12
どっちも聞いたことないな Windowsに
搭載されてたのか?XPの時は機械音声を
一回試したような記憶があるような
無いような・・・・それかな? 鼻声かかってんな
それでも今までの寄りはかなりマシ >>3
価格も数千円のものから〜の部分が結構機械っぽくなるけど
それ以外では、言われないとわからないレベルで綺麗だね
俺はゆっくりのあのトーンがすごい苦手だったからこっちが普及してくれると有り難い >>3
すごいな
電話対応がAIに置き換わるのも近そうだ クラウドワークスとかで募集して女に淡々と漫画読ませてるような動画はもう雇わなくていいレベルだな Windowsに入ってるMicrosoft Haruka Desktopが一番しっくりくる 老害みたいなこと言うけどゆっくりとかボイスロイドの読み上げの方が味あって好きだな ゆっくりよりできが良いのなんてすでにいくらでもあるからな
でもゆっくりが多用されてるんだから需要があるんだろう >>47
商用可能だしこのクオリティならめっちゃ売れるだろ 文字認識も人間なみになったら
音声ブックも安くなりそう
可能ならデジタル書籍とセット売りしてもらいたい 男声の最初のやつが少しだけもやもやさまーずの声に聞こえた 自分の声サンプリングしてナレーションできるようになったら買うわ Amazonはもうここ買収しろ
電子書籍の売上跳ね上がるぞ >>65
声フォントってサイトで自分の声をai化出来る
精度は>>1とあんまり変わらない Adobe Senseiの音声が本物と見分けつかなくて危険だから引っ込めてたよな まだ機械ってわかるな
ノイズを足せば完璧になりそう 感情の調整ができるのはすごい
適当な陰謀論作って自動音声教祖誕生させようぜ >>65
既にやろうと思えばUTAUとかで出来るような? もう何年も前からmisakiという人間レベルの読み上げ音声があるんやが ケンモスクリプトと合体させれば無限ラジオ配信出来そう ゆっくりはもうああいうものだろ
流暢に喋られても落ち着かないわ こういう頭の悪い声優が資料渡されて読んどるだけみたいなのは要らねえんだよ
本物の人間は言いたいところをもっと強く話す。こんなのはただの朗読だ これ抑揚を手入力してるやろ
完全自動化してない、ゴミ >>3
ほんとに僅かな違和感はあるけど、意識しなければ合成音声だとは分からんな >>69
>>76
なんか色々ありそうだな
ちょっくらみてみるわサンクス chmateに読み上げつけてくれよ
けんもFMみたいに本文だけ読むやつ >>82
おまえ雑談すらすべて演説調で会話してるのか…? 調教しないと変になるからそこらの動画なら
ゆっくりで十分というのは変わらんわ ポッドキャストがそろそろブレイクしてもいい頃
通勤時や家事中にわりと合うと思ってるんだが、聴取側のデータ通信量も少ないし
動画作成配信よりハードル低いしさ アクセントは自分で調教する必要があるのか?めんどくせえなその辺も全て自動でやれよ 男1はアンドロイドっぽい
けど、これはこれでありかもしれん れいむの声が1番すき
次がようむ
魔理沙はあまり好きではない
まあ、そもそもSofTalkにゆっくり関係ないけど もう後一歩って感じだな
3年ぐらいしたら人間と見分けつかなくなりそう
ソース、AHSのボイスピークかよ
CeVIO AIのTalkが凄いんだよ
人間が話しているみたいになるからな ■ このスレッドは過去ログ倉庫に格納されています