内容简介

为助力更多企业及设备厂商获得一流的语音合成服务能力，腾讯打造了云小微智能语音与视频服务接入平台，以基于神经网络声码器模型的从文本到语音（TTS）合成技术为核心能力，通过端到端声学模型，实现文本到语音的高质量转化与表达；而传统声码器模型存在着诸如模型复杂，计算量大，时间较长，成本高昂等问题，为优化平台性能，腾讯与英特尔密切合作，基于第三代英特尔® 至强® 可扩展处理器的优异 AI 能力，如 BF16，英特尔® AVX-512，配合英特尔® oneDNN，共同构建了定制化 pWaveNet 声码器模型解决方案及定制化 WaveRNN 声码器模型解决方案，在提供更优异语音合成性能的同时，有效降低了用户总拥有成本；未来双方将继续携手，在架构云、数据上云、AI、高性能计算以及安全等领域中持续开展深入合作。

下载 PDF 文档