内容简介

为助力更多企业及设备厂商获得一流的语音合成服务能力,腾讯打造了云小微智能语音与视频服务接入平台,以基于神经网络声码器模型的从文本到语音 (TTS) 合成技术为核心能力,通过端到端声学模型,实现文本到语音的高质量转化与表达;而传统声码器模型存在着诸如模型复杂,计算量大,时间较长,成本高昂等问题,为优化平台性能,腾讯与英特尔密切合作,基于第三代英特尔® 至强® 可扩展处理器的优异 AI 能力,如 BF16,英特尔® AVX-512,配合英特尔® oneDNN,共同构建了定制化 pWaveNet 声码器模型解决方案及定制化 WaveRNN 声码器模型解决方案,在提供更优异语音合成性能的同时,有效降低了用户总拥有成本;未来双方将继续携手,在架构云、数据上云、AI、高性能计算以及安全等领域中持续开展深入合作。