目前最强的声音克隆工具!
4.57GB 1 人已下载 手机查看
VoxCPM基于MiniCPM-4架构,采用分层语言建模技术,实现免分词的端到端语音合成。 通过180万小时双语语料训练,支持上下文感知的语音生成和零样本声音克隆。 仅需3-10秒参考音频即可复制说话人音色、口音和情感基调,在消费级GPU上实现高效推理,生成速度比播放速度快6倍。 VoxCPM能够根据文本内容智能推断语调风格,支持中英文跨语言合成。
Ctrl+D