语音合成

作者: Peter Berry

创建日期: 11 八月 2021

更新日期: 20 六月 2024

✍️文字转语音--最像人类声音的免费语音合成服务|微软azure（2021） — 视频: ✍️文字转语音--最像人类声音的免费语音合成服务|微软azure（2021）

内容

定义-语音合成是什么意思？
Microsoft Azure和Microsoft Cloud简介在本指南中，您将了解什么是云计算，以及Microsoft Azure如何帮助您从云迁移和运行业务。
技术百科解释语音合成

定义-语音合成是什么意思？

语音合成是通过计算机或其他设备对人的语音进行人工仿真。与语音识别相对应的是，语音合成主要用于将信息转换为音频信息，并用于诸如启用语音的服务和移动应用程序之类的应用中。除此之外，它还用于辅助技术中，以帮助视障人士阅读内容。

Microsoft Azure和Microsoft Cloud简介在本指南中，您将了解什么是云计算，以及Microsoft Azure如何帮助您从云迁移和运行业务。

技术百科解释语音合成

基于Bell实验室的声码器的Homer Dudleys VODER被认为是第一款全功能的语音合成器。语音合成中使用的计算机称为语音合成器或语音计算机。语音计算机的质量通常由其与人声的相似性来判断。自1990年代初以来，大多数计算机操作系统都集成了语音合成器。合成语音通常是通过将录制的语音片段连接在一起而生成的，该片段包含在数据库中。

语音合成的初始阶段是预处理，它消除了需要阅读特定单词的方式所带来的歧义，并且还包括处理同形异义词。在语音合成的下一个阶段，计算机将利用音素将声音转换成声音序列。最后一个阶段涉及使用人类录音或基本的声音生成技术来模仿人类的声音机制并读出整个声音。语音合成的流行分支之一是视听语音合成或多模式语音合成，它利用紧密同步的动画面孔来补充合成语音。多峰语音合成还向语音合并了其他功能，例如非语言提示，以帮助更准确地传达用户单词。许多语音合成系统允许用户选择语音类型，例如男性或女性语音。

尽管语音有时可能很沉闷，但是大多数语音合成系统都能够以非常智能的方式读取s并将其输出。然而，语音合成还没有发展出完全模仿广泛的人类语调和节奏的能力。