关于演出效果问题,另一个重点是配音。
配音当然是只能用ai配音解决。
现有的ai配音有两种模式:
第一种:tts(text-to-speech),给一段文本台词,让角色声音念出来。
参考:BV15c411y7H9(若叶睦的午夜电台)
这种方法的角色声音断句和重音,问题很大,关键爆发性台词一定念不到激动人心的程度。

第二种:声音克隆(gpt-sovits等模型),把角色声线套到别人已经念好的台词上。
参考:BV1ynkwYxEYc(灵感菇)
这种方法的流程:
1 找到能够模仿角色语气、断句的志愿者(注意,声线不需要像,语气和断句像就行)
2 把写好的台词给她们,让她们完成收录
3 使用gpt-sovits等模型,将角色(灯,爱音...)的声音克隆到她们念好的台词上。
我双手双脚倾向第二种方案。