音源の数が必要なのなら20秒の台詞をカットして分割とかで数作れるけど
どういう形がベストなんだろ