顔はAIでできるんだから声もサンプリングして台詞は音源から生成できるようにならないのかね
車のナビの音声ガイドでさえ全部声優が入力してるみたいだからまだボカロが限界で肉声に近いのは無理なのか