githubで公開されている音声自動生成AI、日本のアニメキャラ2890名分の音声を学習素材に超速度で進化中★4 [386780362]

**鄧晟鉉** (ﾎﾟｷｯｰ b14e-dYLF) · 2022/11/11(金) 19:41:37.93

githubで公開されている音声自動生成AI、日本のアニメキャラ2890名分の音声を学習素材に超速度で進化中★3
https://greta.5ch.net/test/read.cgi/poverty/1667913400/

各キャラごとの声質に寄せつつ、日本語以外にも英語中国語韓国語で音声を生成することも可能なようだ

https://i.imgur.com/xvOmV0y.png
https://i.imgur.com/1nHgIjd.png
https://i.imgur.com/yvYkW6E.png
https://i.imgur.com/S9FjVrm.png
https://i.imgur.com/KgZo70z.png
https://i.imgur.com/kINKEVU.png

包含2890名动画角色的VITS语音合成模型
https://www.bilibili.com/video/BV1P8411Y7v5/

2890名分のデータセットの場所はこちら

GitHub - CjangCjengh-TTSModels
https://github.com/CjangCjengh/TTSModels#voistock

Japanese & English & Korean & Chinese
↓
Voistockの箇所

**鄧晟鉉** (ﾎﾟｷｯｰ b14e-dYLF) · 2022/11/11(金) 19:42:02.59

正式名称「VITS文本转语音生成模型」((Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech))

github
vits: Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech
https://github.com/jaywalnut310/vits

GitHub - innnky-vits-japanese- 端到端语音合成模型VITS，日语数据训练
https://github.com/innnky/vits-japanese

GitHub - Francis-Komizu-Sovits- An implementation of the combination of Soft-VC and VITS
https://github.com/Francis-Komizu/Sovits

GitHub - luoyily-MoeTTS- Speech synthesis model -inference GUI repo for galgame characters based on Tacotron2, Hifigan and VI
https://github.com/luoyily/MoeTTS

GitHub - Francis-Komizu-VITS- ACG Text-to-Speech
https://github.com/Francis-Komizu/VITS

VITS 语音合成完全端到端TTS的里程碑
https://blog.csdn.net/Terry_ZzZzZz/article/details/120458064

GitHub - CjangCjengh-MoeGoe- Executable file for VITS inference
https://github.com/CjangCjengh/MoeGoe

MoeGoe_GUI
https://github.com/CjangCjengh/MoeGoe_GUI

Moe TTS And Voice Conversion Using VITS Model
https://huggingface.co/spaces/skytnt/moe-tts

MoeGoeリリースノート
https://github.com/CjangCjengh/MoeGoe/releases

MoeGoe製作者のCjangCjengh氏
CjangCjengh
https://space.bilibili.com/35285881

2022/11/11(金) 19:42:15.05

くぎゅうはよしろ

**鄧晟鉉** (ﾎﾟｷｯｰ b14e-dYLF) · 2022/11/11(金) 19:42:15.66

零基础炼丹秘籍 - 为自己喜爱的角色训练TTS（文字转语音）模型
TTS (text to speech) model for your favorite character
https://www.bilibili.com/read/mobile?id=17826415

デモページ
Audio Samples from "Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech"
https://jaywalnut310.github.io/vits-demo/index.html

VITS_TXT_to_Audio
https://github.com/alphanemeless/VITS_TXT_to_Audio

VITS长音声生成工具为你的小说，添加AI配音吧！（可可萝老师讲解）
https://www.bilibili.com/video/BV11d4y1r7cT/

論文
用于端到端文本到语音的具有对抗学习的条件变分自动编码器(Conditional Variational Autoencoder with Adversarial Learning for End-to-End Text-to-Speech)
https://arxiv.org/abs/2106.06103

論文の解説動画
论文分享会 | 用于端到端文本到语音的具有对抗学习的条件变分自编码器
https://www.bilibili.com/video/BV1QB4y1U7ZK/

**鄧晟鉉** (ﾎﾟｷｯｰ b14e-dYLF) · 2022/11/11(金) 19:42:28.35

喜怒哀楽による読み上げの変化をパラメータ化しツール化

VITS情感控制语音合成

解説動画
可控制情感的绫地宁宁语音合成！基于VITS模型
https://www.bilibili.com/video/BV1Vg411h7of/

GitHub - audeering-w2v2-how-to- How to use our public wav2vec2 dimensional emotion model
https://github.com/audeering/w2v2-how-to

VITS情感控制语音合成
https://github.com/innnky/emotional-vits

感情を数字で指定できる、参数がパラメータ、样本がカタログのこと
「使用情感样本id作为情感参数」→「情感样本ID」

デモページ
nene-emotion
https://huggingface.co/spaces/innnky/nene-emotion

**鄧晟鉉** (ﾎﾟｷｯｰ b14e-dYLF) · 2022/11/11(金) 19:42:42.22

中国声優データセット
用VITS神经网络模型
(VITS Neural Rendering using network model)

VITS仓库地址
https://github.com/jaywalnut310/vits/

声线转换
https://colab.research.google.com/drive/1W6aoDMuTku8EDTuH7-okVaj-6kzbXz1m

TTS
https://colab.research.google.com/drive/1kpHzOHfWqM4pXxUiqxON9SvDTOeXGNI1

声线转换模型
https://obs.baimianxiao.cn/share/obs/sankagenkeshi/G_1293000.pth

TTS模型（多人物）
https://obs.baimianxiao.cn/share/obs/sankagenkeshi/G_809000.pth

【真·CV失业计划#3】用VITS神经网络模型给原神角色PV配音会如何?(开放API使用)
https://www.bilibili.com/video/BV1NG4y1Y7bn/

**鄧晟鉉** (ﾎﾟｷｯｰ b14e-dYLF) · 2022/11/11(金) 19:42:54.88

「vits　模型」で検索すれば配布されてるデータセットが結構出てくるが消えるのが早い、気になるデータセットがあれば早めにダウンロードしておいても良さそうだ

百度网盘(Baidu Cloud)からダウンロードするには百度垢が必須
百度アカウント開設方法↓

このアプリをインスコ後、国コードで日本を選んでSMS認証すれば完了
https://adersaytech.com/tech-event/how-to-register-baidu-account.html

**鄧晟鉉** (ﾎﾟｷｯｰ b14e-dYLF) · 2022/11/11(金) 19:43:47.86

ケンモディスコ鯖で再配布しているデータセット
(百度网盘版は既に削除されているので注意)

マギレコキャラ10人分のデータセット

パスワード mgrc

VITS的魔法纪录10人模型 - 百度网盘
https://pan.baidu.com/s/1ieZ9bisRPb6k7Nl-AH3hBg?pwd=mgrc
基于VITS的魔法纪录10人模型
https://www.bilibili.com/video/BV1Ne4y1y7uT/

ウマ娘
トウカイテイオー
ハルウララ
マチカネフクキタル
マチカネタンホイザ

パスワード wzsq

帝宝乌拉拉福来诗宝四人模型 -百度网盘
https://pan.baidu.com/s/1RsC-3WJfbv3pn7egGepcMA?pwd=wzsq

プリコネなかよし部データセット

パスワード znzk

好朋友部三人模型 - 百度网盘
https://pan.baidu.com/s/1A20m3NtIsxj_bjnU_6UlXw?pwd=znzk

**鄧晟鉉** (ﾎﾟｷｯｰ b14e-dYLF) · 2022/11/11(金) 19:44:03.43

関連動画
プリコネキャラにごめゆいを言わせる動画、音声はすべて自動生成
【AI语音合成】用VITS给优衣说对不起公主连接17人模型
https://www.bilibili.com/video/BV1S24y1d74C/

なかよし部に中国語で喋らせる動画
【语音合成】基于VITS的好朋友部三人语音合成模型
https://www.bilibili.com/video/BV1JD4y167sQ

ルイズに喋らせる動画
【AI语音合成/VITS】来感受随时可以被钉宫辱骂的快感吧！
https://www.bilibili.com/video/BV1BP411G7P8/

ウマ娘&原神の声色再現動画
【AI语音合成】赛马娘&原神的中日结合模型尝试
https://www.bilibili.com/video/BV1UG4y1W7Ji/

VITS文本转语音生成模型の解説動画
【AI语音合成】基于VITS模型的优妮先辈语音合成
https://www.bilibili.com/video/BV1jY4y1c7JF

**鄧晟鉉** (ﾎﾟｷｯｰ b14e-dYLF) · 2022/11/11(金) 19:44:39.56

MoeGoeダウンロードして
https://github.com/CjangCjengh/MoeGoe/releases/tag/v3.0.0

MoeGoe_GUIダウンロードして
https://github.com/CjangCjengh/MoeGoe_GUI/releases/tag/v3.0.0

ここのリンクからモデルとコンフィグファイルをセットでダウンロードして
https://github.com/CjangCjengh/TTSModels

MoeGoe_GUI.exeを起動、MoeGoe.exeの位置とモデル(模型pth)、コンフィグ(配置・json)を指定したら
文本に文章入れて正規表現に変換できたら下のプルダウンメニューからキャラ名選んで保存ボタンで保存

2022/11/11(金) 19:45:35.60

なんかバズってたなこれ

**鄧晟鉉** (ﾎﾟｷｯｰ b14e-dYLF) · 2022/11/11(金) 19:46:01.83

日本語で音声を生成させる方法
https://space.bilibili.com/35285881/

**鄧晟鉉** (ﾎﾟｷｯｰ b14e-dYLF) · 2022/11/11(金) 19:46:48.92

データセットはいつ消されてもおかしくない
gifhubのmoegoe本体と2890名分のデータセットは最優先でダウンロード推奨

GitHub - CjangCjengh-MoeGoe- Executable file for VITS inference
https://github.com/CjangCjengh/MoeGoe

MoeGoe_GUI
https://github.com/CjangCjengh/MoeGoe_GUI

Moe TTS And Voice Conversion Using VITS Model
https://huggingface.co/spaces/skytnt/moe-tts

MoeGoeリリースノート
https://github.com/CjangCjengh/MoeGoe/releases

MoeGoe製作者のCjangCjengh氏
CjangCjengh
https://space.bilibili.com/35285881

2022/11/11(金) 19:47:08.36

安倍晋三は学習してないの？

**鄧晟鉉** (ﾎﾟｷｯｰ b14e-dYLF) · 2022/11/11(金) 19:48:23.62

MoeGoe_GUIに更新が来ています
3.0.1

2022/11/11(金) 19:48:35.28

声質の再現度高いのはわかったけどイントネーションなんとかならんのか

2022/11/11(金) 19:48:41.49

これ自分で学習塾させられないの？

2022/11/11(金) 19:48:48.49

GitHubとかいう
クッソ使いにくいダウンローダーなんでこんな人気なんだよ
わかりにくいんじゃぼけ

2022/11/11(金) 19:51:36.22

これの専用スレってどこ？

2022/11/11(金) 19:51:38.64

まだ画像生成ほど自然じゃないけど、これは次に来そうだなあ

2022/11/11(金) 19:52:36.99

>>19
ここだよ

**鄧晟鉉** (ﾎﾟｷｯｰ b14e-dYLF) · 2022/11/11(金) 19:52:42.36

今日までの鄧晟鉉の動き

件のMoegoe開発者グループに潜入成功
本当に1000人規模で開発していて草なんだ
そのうち取材を申し込む予定
https://i.imgur.com/rXwimv9.jpg
https://i.imgur.com/SxK8eWL.jpg

↓

テンセントQQのMoeGoe開発者グループの鯖管とフレンド登録完了、プロフは新古今和歌集か？
https://i.imgur.com/UjcIov2.jpeg
https://i.imgur.com/ZQKvY5Z.jpeg

↓

とりあえずインタビューしてみた
https://i.imgur.com/JTxzwnU.png

嗨大佬们我又来了八
我想要釆访你们
是关于人工知能开发事情的

第一
AI模型训练时使用的数据资源是什么？

第二
这数据资源你们怎么获得？
哪里购买？或者做制作的谁？

第三
你们今后的到达目标是什么？

2022/11/11(金) 19:53:31.91

>>18
git　cloneで一発DLだろ

?2BP(1000) · 2022/11/11(金) 19:55:58.67

嫌儲ディスコってどこで招待されてるのん

**鄧晟鉉** (ﾎﾟｷｯｰ b14e-dYLF) · 2022/11/11(金) 19:57:51.44

>>19
こことディスコ

あと消されたモデルデータ集の再配布をディスコでやってます

入る前にかならず規約の全文に目を通してね
https://disboard.org/ja/server/313289774440120332

2022/11/11(金) 19:58:04.16

ボイスロイドと融合したら完成かな

**鄧晟鉉** (ﾎﾟｷｯｰ b14e-dYLF) · 2022/11/11(金) 19:59:46.51

嗨大佬们
我是在日本的b站博主鄧晟鉉

我是日本最大的网站"5CH"记者的

我想要问您一件事，可以吗？

Q,日本网友说
"想要收费变声器Voidol软件为追加的vits萌声学习数据也很好"
这个,可能吗？

↓の回答
https://i.imgur.com/pDkrafe.png

**鄧晟鉉** (ﾎﾟｷｯｰ b14e-dYLF) · 2022/11/11(金) 20:01:53.80

音声関係ないけど

NovelAIの強化版が来た

NovelAI 再遭泄露?实测对比Anything-V3.0.ckpt 提升巨大
https://www.bilibili.com/read/cv19603218

2022/11/11(金) 20:02:10.94

これで旧スラダン声優で吹き替えできる？

2022/11/11(金) 20:02:33.91

>>21
えぇ…
嫌儲が主導とかもう終わりだよこのテクノロジー

2022/11/11(金) 20:02:36.10

エヴァンジェリンAKマクダウェルちゃんのモデルまだ？

?2BP(1000) · 2022/11/11(金) 20:04:37.99

嫌儲ディスコにはいれた！

2022/11/11(金) 20:05:09.76

アナウンサーとかはtraninigできないの？

2022/11/11(金) 20:05:50.86

まじで中国から輸入ばっかりになってしまったな

**鄧晟鉉** (ﾎﾟｷｯｰ b14e-dYLF) · 2022/11/11(金) 20:06:28.57

>>30

このツイートが日本最速
https://twitter.com/yocqn/status/1563452114160205826

日本で二番目ぐらいにこの話題を出したのが多分ワシ
https://twitter.com/5chan_nel (5ch newer account)

2022/11/11(金) 20:10:54.19

>>35
嫌儲はイナゴするだけで主導には向かないだろ
他の板に引っ越せ

2022/11/11(金) 20:12:22.45

>>32
それrecaptchやらないとすぐ追い出されたわ
気付かずに何度も入りなおしてた

**鄧晟鉉** (ﾎﾟｷｯｰ b14e-dYLF) · 2022/11/11(金) 20:12:46.31

まぁワシも知り合いの華僑経由で情報貰っただけだけどね
中国語圏でバズり散らかしたあとでようやく日本で騒がれ出した感じ
だいたい2ヶ月遅れぐらい

2022/11/11(金) 20:13:03.06

>>1
健太は！

2022/11/11(金) 20:13:25.00

>>38
健太は成長しないん！

2022/11/11(金) 20:14:11.15

合成音声紹介系で有名なやつも取り上げてんな

**鄧晟鉉** (ﾎﾟｷｯｰ b14e-dYLF) · 2022/11/11(金) 20:19:29.48

前スレより
CjangCjengh氏に色々取材しようと思って腾讯群聊(テンセントQQのグループチャト)のMOEGOE開発グループ覗いてみたが、満員(全508人、内モデレータ8人)で入れませんでした
メンバーのプロフィール見たら清華大学学生とか普通に居て草なんだ
あと第2鯖も埋まってて第3鯖が出来ていたので、最低でも1000人以上いる
Cjang Cjengh氏自身も機械工学系の上海交大出身、エリート集団が正に"人海戦術"で開発してる

2022年7月から開発開始
https://i.imgur.com/vVGD4Pt.jpg
https://i.imgur.com/djqeaAV.jpg
https://i.imgur.com/LazZpbq.jpg

moegoe開発者グループ

纸片人魔法交流群 - QQ群聊

第1群·702724269(満員)

第2群·768432324(加入時にモデレータによる審査あり)

第3群·546637589(加入時にモデレータによる審査あり)

**鄧晟鉉** (ﾎﾟｷｯｰ b14e-dYLF) · 2022/11/11(金) 20:20:18.19

開発鯖の管理人がなぜか鄧晟鉉のことを知っていたので、態々第2鯖に空きを作ってもらって入ってる感じ

2022/11/11(金) 20:21:01.44

はい

2022/11/11(金) 20:40:25.02

しゅごい

2022/11/11(金) 20:44:45.31

MoeGoe3.1来たみたいだけどあんま変化ないなら改良版から離れたくない

2022/11/11(金) 20:46:47.50

見てないけど現実の声優と二次元とがきちんと切り離せるのはいいな

**鄧晟鉉** (ﾎﾟｷｯｰ b14e-dYLF) · 2022/11/11(金) 20:53:25.75

鯖のモデレータより
我第一波的训练集是我手动从几万个音频里面找的(doge

https://i.imgur.com/38qIx3l.png
https://i.imgur.com/0Ca3cgF.png

2022/11/11(金) 20:54:57.04

GUIでもボイスチェンジさせて欲しい

**鄧晟鉉** (ﾎﾟｷｯｰ b14e-dYLF) · 2022/11/11(金) 20:56:25.59

「如果(模型训练数据集)是动画的话，目前常见的方法就是使用另一个网路提取」

2022/11/11(金) 21:14:51.45

凄すぎ
ダウンロードしてpythonで使います

**鄧晟鉉** (ﾎﾟｷｯｰ b14e-dYLF) · 2022/11/11(金) 21:27:06.14

「模型训练资源是分开日本动漫吗？」に対しての回答

https://i.imgur.com/KaOQ3QA.png
https://i.imgur.com/KaOQ3QA.png

**鄧晟鉉** (ﾎﾟｷｯｰ b14e-dYLF) · 2022/11/11(金) 21:27:38.20

urlミス
https://i.imgur.com/h4vcdA1.png
https://i.imgur.com/KaOQ3QA.png

2022/11/11(金) 21:50:27.10

ディスコードお礼しか書いてないけどキックされたぞ
なんでや( •᷄ὤ•᷅)

2022/11/11(金) 21:53:16.50

GUIの変更オリジナルでも検索出来るようになっただけ？
更新履歴どっかにないのかしら

2022/11/11(金) 21:55:44.62

>>54
ボットからrecaptchの認証しろとなんか来てるよ
そのリンククリックして認証しないと追い出されれる

2022/11/11(金) 22:05:53.00

Voistock の config.json、最初の方の
"text_cleaners":["cjke_cleaners2"],
を
"text_cleaners":["japanese_cleaners2"],
に書き換えると[JA]要らなくなったけど
変更前の[JA]書いた場合と発音がちょっと違ったりでよくわからん

>>56
ありがとう

2022/11/11(金) 22:07:44.16

ボイスデータってどうやって作るんだ？

2022/11/11(金) 22:13:23.40

ボイロ投稿者だからこの発展は嬉しい

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-dYLF) · 2022/11/11(金) 22:13:46.25

>>58
零基础炼丹秘籍 - 为自己喜爱的角色训练TTS（文字转语音）模型
TTS (text to speech) model for your favorite character
https://www.bilibili.com/read/mobile?id=17826415

2022/11/11(金) 22:19:51.91

これのおかげで捗りまくってるわ
下手な同人音声より良いわ
刺さるセリフを量産できるのはエグい

2022/11/11(金) 22:29:59.33

同人アニメ作り放題にゃｗ

2022/11/11(金) 22:44:41.71

あと1時間ぐらいしたらやってみるわ
スレ立ててんきゅー

2022/11/11(金) 23:14:03.20

とりまNGにしておくわ

2022/11/11(金) 23:21:03.75

>>60
この作り方だけだとtacotron2だからMoeGoeでは使えないはず
作り方にそんな差はないが

**鄧晟鉉** (ﾜｯﾁｮｲ b14e-dYLF) · 2022/11/11(金) 23:26:56.84

>>65
voistockに応用もできない感じですか？
https://i.imgur.com/38qIx3l.png

2022/11/11(金) 23:37:04.42

オーディオブックみたいにepub読ませられるようになったら教えて

2022/11/11(金) 23:39:35.46

サルでも導入できるように懇切丁寧な解説してくれや

2022/11/11(金) 23:44:52.86

よくわからんがGUIで学習できるようになるようお祈りします

2022/11/12(土) 00:06:38.11

先日各所に通報しといたけどなんの音沙汰もないな
声優文化なんて守る価値もないってことか…
もう好き放題無法地帯で暴れまくってぶっ壊してくれ中国さん

2022/11/12(土) 00:26:35.03

法律違反はしてないからじゃねえかなあ
機械学習に音声使うなとか条項いちいち旧時代に作らねえもん
モデルファイルは私的利用のみにしろって注釈もあるし

2022/11/12(土) 00:35:24.55

CUDA使ったら爆速になったわ

2022/11/12(土) 00:40:39.41

モデル作って配布は日本で違法じゃないしな

これ使ってエロゲ作ったらアウトにはなりそうだ
エロゲ量産されたら法規制とかありそう

2022/11/12(土) 00:57:42.84

散々威張り散らしてきた腐れカースト上位オタクどもが
ｷﾞｬｵりながら無産呼びしてる俺らに
権利振りかざしてんの見ると凄い脳汁出てくる

ウヨって普段こういう気持ちで左翼見てたんだろうな
とりあえずAI頑張れ！　オタク一匹残らず失業させろw

2022/11/12(土) 01:25:26.97

安倍晋三3万人分学習させようぜ

2022/11/12(土) 02:04:05.20

こんなのが文化盗用になるならジャップが西洋かぶれな生活してるのも文化盗用だろ

2022/11/12(土) 03:07:00.29

GUIを連結させて自動で喋らせすことできる？

2022/11/12(土) 06:27:17.13

自分用のデータセット作りたいけどこれもCUDAが使えるGPUやないとあかんのやろ
colabはスマホないからgoogleアカウント作れないのや

2022/11/12(土) 06:38:52.62

ローカル版だと韓国語が読めない

2022/11/12(土) 06:56:14.32

同人ゲームの音声が捗るな

2022/11/12(土) 06:57:27.27

>>79
解決策ありますか

**鄧晟鉉** (ﾜｯﾁｮｲ 154e-ESxH) · 2022/11/12(土) 07:11:43.20

[KR]でもダメ？

2022/11/12(土) 07:57:04.29

>>72
GPU使うようにするにはどうしたら良いのか教えてくれ

2022/11/12(土) 08:05:49.15

>>82
ダメだった

**鄧晟鉉** (ﾜｯﾁｮｲ 154e-7ucU) · 2022/11/12(土) 09:20:07.08

[JA]保守[JA]

2022/11/12(土) 09:29:09.26

[KO]でも[KR]でも息遣いになってしまうな
https://imgur.com/tsYxXys.jpg
https://uploader.cc/s/j6h6y15l4v5vmbjk12p2j7m2h4ewx0gujjtynb5a7t76rfy58rxf4ebtaorrm4j1.wav

**鄧晟鉉** (ﾜｯﾁｮｲ 154e-7ucU) · 2022/11/12(土) 10:18:20.51

[JA]保守[JA]

2022/11/12(土) 10:21:37.27

2800人超えモデルだとVITSでの音声合成がMoeGoeGUIだとできないのバグなのかな

2022/11/12(土) 10:30:23.23

5日くらい前にmodules.pyのDDSConvってクラスをタイプミスで修正してんだよね
そしてその修正は配布のMoeGoe.exeには含まれてない。何に使ってるクラスかよく見てないけどもしかするとそのせいかもね
自分でexe化しろってことかな

2022/11/12(土) 10:32:00.77

日本語アクセント補正に marine ってライブラリも使うようにしてみた
劇的には変わらず、語尾上がりが減ったかなって感じ
https://github.com/tasrr/WebApp_MoeGoe

2022/11/12(土) 10:51:16.05

韓国語だけじゃなくて、中国語も専ブラで打てないような機種依存文字が読めない
おま環かな

2022/11/12(土) 11:53:03.19

>>90
これCUDAつかえる？

2022/11/12(土) 12:11:08.66

>>92
ごめんねCPU
モデルデータ自体が書き出すときに cpu, gpu 両対応でやってない場合読み込めないとか
トラブルに対応できなそうであきらめた
後CUDA版torch を pyinstaller でまとめたら 4.8GB になったのもうーんって感じ
機会があったらCUDA版も作っときたいですね

2022/11/12(土) 13:15:40.96

>>90
有り難く頂いて、問題なく使えました
ありがとう

2022/11/12(土) 13:23:03.49

>>90
画像生成のエロスレでも見たわ
両方アプリ作ってるのか

2022/11/12(土) 14:11:44.66

>>95
スレチだけど向こうは情報量が多すぎて数日で知らない単語が増えていく
AI関係はワクワクして楽しいんだけどね

2022/11/12(土) 14:35:44.74

なんか片方しかキャラがいない版権があるのはどうして？

2022/11/12(土) 14:41:12.47

ボイチェンのやり方だれか教えてください

2022/11/12(土) 14:45:20.95

W2V2-VITS使いたいんだけど情感参考ってところ何入れたらいいんだろう
model.onnxはセットしてるけどnpyなんてファイル見当たらない

2022/11/12(土) 14:51:00.91

voicevoxみたいにアクセント調整できたら神アプリになりそうだが

2022/11/12(土) 15:15:32.03

どうしたら韓国語読めるんだろ

2022/11/12(土) 15:34:23.48

>>101
声優も韓国じゃないとだめなんじゃないかな
知らんけど

2022/11/12(土) 15:44:43.17

>>102
Web版だと普通に読めるのにローカルGUIだと読めない

2022/11/12(土) 15:55:11.58

>>103
試してないから適当なこと言うけど
GUIが日本語だから動かないんじゃね？

元のGUIなら動くとか？
https://github.com/CjangCjengh/MoeGoe_GUI

それともバージョンが上がって違いがあるとか？

まあ試さないとわからんね

2022/11/12(土) 16:02:24.44

同人コンテンツのボトルネックが声優だったから情勢がかなり変化しそうだな

2022/11/12(土) 16:07:42.25

軽く触ったけどイントネーションが外人すぎて簡単には使いこなせんわ

2022/11/12(土) 16:17:40.24

>>104
元のやつでも無理だった

2022/11/12(土) 16:28:01.08

複数（２行）のセリフを含めて出力するのと
それぞれ分けて出力するとアクセントが全然違う

2022/11/12(土) 16:37:29.13

確かにあえて改行したり文頭に…を入れたりで結構変わるね
↓↑は効いたり効かなかったりでわからん

2022/11/12(土) 16:45:02.31

アクセントとかあまり意識したことないからどっちかわからん時がある
でも効果は確実にある

2022/11/12(土) 16:51:11.31

生成するごとにイントネーション変わるから、たまにいいイントネーション引けることもあるぞ。

2022/11/12(土) 17:29:35.90

>>107
試したけど無理だわ
でも無理やり動かすことはできるぞ

webのmoettsから発音記号に変換して
発音記号をmoegoeに入力すると韓国語になったわ

日本語の発音が悪いのはここの変換でなんとかなるかもね

https://huggingface.co/spaces/skytnt/moe-tts
https://i.imgur.com/Ilnffmy.png

2022/11/12(土) 17:30:28.18

GUIでも対応してほしいね

2022/11/12(土) 17:42:53.84

中国製だから中華イントネーションなのかこれ

2022/11/12(土) 20:05:00.07

イントネーションと感情値が弄れたらボイロとか余裕で越える

**鄧晟鉉** (ﾜｯﾁｮｲ 154e-ESxH) · 2022/11/12(土) 21:40:48.52

[JA]保守[JA]

2022/11/12(土) 21:44:31.34

保守しても落ちちゃう

2022/11/12(土) 22:52:18.27

プリコネの精度良いけど3人以外も無いのかな…動画はあるっぽいけど

2022/11/12(土) 22:55:20.74

シンボリックの「N」とか「Q」とかのアルファベットとかどう使えと

**鄧晟鉉** (ﾜｯﾁｮｲ 154e-ESxH) · 2022/11/12(土) 23:03:03.62

ipaって読み上げ出来る？

('A', 'ei˥'),
('B', 'biː˥'),
('C', 'siː˥'),
('D', 'tiː˥'),
('E', 'iː˥'),
('F', 'e˥fuː˨˩'),
('G', 'tsiː˥'),
('H', 'ɪk̚˥tsʰyː˨˩'),
('I', 'ɐi˥'),
('J', 'tsei˥'),
('K', 'kʰei˥'),
('L', 'e˥llou˨˩'),
('M', 'ɛːm˥'),
('N', 'ɛːn˥'),
('O', 'ou˥'),
('P', 'pʰiː˥'),
('Q', 'kʰiːu˥'),
('R', 'aː˥lou˨˩'),
('S', 'ɛː˥siː˨˩'),
('T', 'tʰiː˥'),
('U', 'juː˥'),
('V', 'wiː˥'),
('W', 'tʊk̚˥piː˥juː˥'),
('X', 'ɪk̚˥siː˨˩'),
('Y', 'waːi˥'),
('Z', 'iː˨sɛːt̚˥')

2022/11/13(日) 00:54:54.23

これでエロ同人誌朗読させたらめっちゃ捗るのでは？

2022/11/13(日) 02:52:33.05

google colabで学習したvitsモデルを自作で作って300回くらい回してみたがテキストで喋らせると謎の言葉でしかない
合成音声方式だとちゃんとキャラの声になってきてるんだけどなんか手順が足りてないのかなあ、クリーナーとかってのがよくわからない

2022/11/13(日) 03:18:39.77

エヴァの続編で冬月先生出せるのええな

**鄧晟鉉** (ﾜｯﾁｮｲ 154e-ESxH) · 2022/11/13(日) 06:27:03.17

[JA]保守[JA]

2022/11/13(日) 06:54:22.85

>>123
やってみたけど別人の声だった

**鄧晟鉉** (ﾜｯﾁｮｲ 154e-7ucU) · 2022/11/13(日) 09:47:43.75

[JA]保守[JA]

2022/11/13(日) 11:38:00.97

>>122だけどわかったわテキスト書き起こししてないからだわ
この作業が一番きついな

2022/11/13(日) 11:42:30.82

colabでの学習方法教えて

2022/11/13(日) 11:59:29.55

https://www.bilibili.com/read/cv17826415
https://www.bilibili.com/read/cv18357171
tacotron2の学習方法と同じみたいなのでそっち見てからvits版のやり方にいじればいけると思う
URLの中にノートブックもあるよ、感情付きのほうも

2022/11/13(日) 12:17:52.92

テキストは漢字使ってもいいの

2022/11/13(日) 12:20:08.45

>>130
どっちかわからんかったのでひらがなでやってみて認識するようになったからそっちで作っていこうと思うんだけどどうなんだろ
あと全部のテキスト書き起こさなくてもある程度文章いれたら他のキャラでも学習してくれるっぽい気がする

2022/11/13(日) 12:23:18.58

もちろん素材が多い方が質は上がるよね

2022/11/13(日) 12:25:45.03

いや漢字もいけそうな気がする
訓練する前の前処理で文字を機械が読める文字に整理されるみたいだけど漢字にしててもa↑ri↓gatoo go↑zaima↓sU　みたいに変換してるわ

2022/11/13(日) 12:54:12.86

文字コードはShift-JIS？

2022/11/13(日) 13:15:13.78

>>134
あんま意識してなかったけどutf-8でやってた

2022/11/13(日) 13:18:07.48

ありがとう

2022/11/13(日) 14:03:29.38

あんまり素材が多すぎてもパンクする感じかな

**鄧晟鉉** (ﾜｯﾁｮｲ 154e-7ucU) · 2022/11/13(日) 15:00:38.54

嫌儲ディスコ鯖管理人としての緊急連絡

乗っ取られたカウントを発見したためBANしましたが、該当ユーザーから個別DMで不審な招待URLが送られていることを確認しました
もし不審なDMが来ていた場合、URLを絶対にクリックしないようお願いいたします

2022/11/13(日) 15:11:34.48

VITSへの変換方法を教えてたもれ

2022/11/13(日) 17:01:12.94

変換ってどうするの

2022/11/13(日) 17:06:58.92

anything v3.2ってどこよ

2022/11/13(日) 17:12:53.58

tacotron2で合成したけどVITSに変換できますか？

2022/11/13(日) 17:18:54.44

また元データは海賊版から？

2022/11/13(日) 17:46:54.15

VITSの方wavsフォルダがないけどどうするんですか

**鄧晟鉉** (ﾜｯﾁｮｲ 154e-ESxH) · 2022/11/13(日) 18:23:13.58

[JA]保守[JA]

2022/11/13(日) 18:32:23.36

ぶっちゃけ日本、絵やらアニメやら声優やら関わってる人多いのだから、
ネット上のアニメやら漫画やらをAIに学習させて活用するって発想して
実現するって動きが、そういう日本だからこそワンサカ出てくるものだろうと
予想していたのだがな

で、中国とかに持っていかれる

いくらコンテンツの生まれ出る国でも、技術音痴さで遅れて失う

この先どんな分野でも、そんな感じで衰退していくのであろう

**鄧晟鉉** (ﾜｯﾁｮｲ 154e-ESxH) · 2022/11/13(日) 18:37:30.14

>>146
開発者にインタビューしてきたけどアニメは学習素材にしてない

**鄧晟鉉** (ﾜｯﾁｮｲ 154e-ESxH) · 2022/11/13(日) 18:38:32.90

https://i.imgur.com/38qIx3l.png
https://i.imgur.com/0Ca3cgF.png

2022/11/13(日) 18:41:15.59

>>147
このAIに限った話ではなくって、自国産コンテンツにAIを採り入れての
更なるコンテンツの革新と生産についての話だったすまん

2022/11/13(日) 18:59:21.90

>>147
アニメ素材にしてなかったらアニメでしか音声なさそうな作品ちらほらあるのは無理な気がする

2022/11/13(日) 19:34:39.75

>>146
関わってる人が多いからこそ自動化して全員失業じゃ洒落にならんでしょ
新興国でしがらみのない中国だから出来ること

2022/11/13(日) 19:44:29.15

今期で放送されてるアニメとかアニメ素材無しでどうやってやったんだ？

2022/11/13(日) 19:47:22.56

>>152
Voistockっていうサイトがある

2022/11/13(日) 19:58:26.62

こんなサイトあったんだ
なんでもあるんだねぇ

2022/11/13(日) 19:59:38.78

冬月先生みたいに1つしか素材無いキャラは謎のショタボになるみたい
逆にクロコダイルとかバギーは4つしか素材無いけどかなりクオリティ高かったよ

2022/11/13(日) 19:59:40.61

声だけのモブ声優はもういらんな
トーク力や容姿がいいやつはその付加価値で生き残るだろうけど

2022/11/13(日) 20:01:48.92

>>153
いやそれも誰か素材にしたんだろう？

2022/11/13(日) 20:09:40.80

アニメから切り取った音声素材サイト使ってるけど直接アニメは使ってないってことじゃね
あっちの人的には

2022/11/13(日) 20:17:46.54

ソースロンダリングだな

**鄧晟鉉** (ﾜｯﾁｮｲ 154e-ESxH) · 2022/11/13(日) 20:19:14.92

>>159
それがアウトならGDPR違反のSDもアウトということになる
http://greta.5ch.net/test/read.cgi/poverty/1666517260/

2022/11/13(日) 20:30:31.27

中華は知らんが日本だと
アニメの音声を音声として聞いて楽しむためではなく
研究目的でのデータベースは合法でしょ

「～のかわいい声１００選（皆聞いてね）」なら違法になるけど
「少女キャラ、１００ボイス（サンプルボイス）」なら合法なんでしょ？

2022/11/13(日) 20:45:20.95

しかしこれ1回作ったモデルに後からキャラ足したり順番変えたりできんのね
いっぱい作りたいなら最初からキャラ枠と何個かのボイスはセットしとかないといけないわけか

**鄧晟鉉** (ﾜｯﾁｮｲ 154e-ESxH) · 2022/11/13(日) 20:49:35.92

[JA]保守[JA]

2022/11/13(日) 22:17:27.17

>>160
今の中国しらんけど、そういうの何でもOKな流れではもうない感じ？
今でもNHKの番組がbilibiliにあがるからありがたく見てるけど

**鄧晟鉉** (ﾜｯﾁｮｲ 154e-ESxH) · 2022/11/13(日) 22:56:18.23

ビリビリに動画上がってたから削除要請出してきた

日本5CH反应：悲报！中国人使用2890位动漫角色声音训练出最强音声AI了！
https://www.bilibili.com/video/BV1Ne4y147CT/

**鄧晟鉉** (ﾜｯﾁｮｲ 154e-7ucU) · 2022/11/14(月) 05:31:49.02

[JA]保守[JA]

2022/11/14(月) 05:40:44.64

ルイズあるやんけ

**鄧晟鉉** (ｵｯﾍﾟｹ Src1-Uv+W) · 2022/11/14(月) 07:56:51.37

[JA]保守[JA]

2022/11/14(月) 14:15:17.75

VITSの学習で、データセットの解凍まで終わったんだけどhparams_training_files:とhparams_validation_files:はどうすればいいの？

2022/11/14(月) 15:07:59.35

「No dashboards are active for the current data set.」ってエラーが出る

2022/11/14(月) 16:28:47.81

wavsフォルダを直下に移動したら今度は
「IndexError: tuple index out of range」ってエラーが出るようになった

**鄧晟鉉** (ﾜｯﾁｮｲ 154e-7ucU) · 2022/11/14(月) 19:37:00.32

c直下はどうですか？

**鄧晟鉉** (ﾜｯﾁｮｲ 154e-7ucU) · 2022/11/14(月) 19:37:08.80

[JA]保守[JA]