定义:声码器是一种用于的音频处理器以数字数据的形式传输语音或语音信号。声码器用作的缩写形式语音编码器。声码器主要用于语音的数字编码和语音模拟。可用的窄带声码器的比特率来自1.2至64 kbps。
声码器的工作原理是共振峰。共振峰基本上是由人类声音产生的语音的有意义的组成部分。
无论何时传送语音信号,都不需要传送精确的波形。我们可以简单地发送信息,通过这些信息我们可以重建特定的波形。在接收端重建的波形必须与实际发射的波形相似而不相同。
声码器以这样的方式工作,即它首先捕获信号的特征元素。然后,其他音频信号受到该特征信号的影响。
声码器用于语音合成。声码器接收两个信号,并使用两个输入信号的频谱信息创建第三个信号。它的目的是将语音信号的幅值和频率特征标记到合成信号上,同时保持语音信号的基音。
让我们看看下面显示的语音模型 -
语音模型用于模拟语音。言语包含一系列浊音和清音声音,这是语音模型操作的基础。
在进行进一步之前,最好先了解有浊音和清音声音。
声音听起来基本上是由此产生的声音声带的振动。
相反,发“s”、“p”或“f”等字母的音被称为“s”无声的声音。无声的声音是由排出空气通过嘴唇和牙齿。
从上图中我们可以看到声码器使用的语音模型。在这里,浊音是由脉冲发生器,其频率等于声带的基频。电路中的噪声源是用来模拟无声声音的。
开关的位置有助于确定声音是浊音还是浊音。
然后将选定的信号通过一个滤波器模拟扬声器的口腔、喉咙和鼻腔通道的效果。的过滤装置然后按照要求的字母发音的方式过滤输入。这样我们就可以得到一个合成的近似语音波形。
LPC的在语音和音乐应用程序的情况下广泛使用。LPC是一种首字母缩写线性预测编码。它基本上是一种技术估计未来值。简而言之,我们可以说,通过分析之前的两个样本,它预测了结果。
声码器由语音编码器和译码器。现在让我们详细讨论每一个的操作-
语音编码器
下面给出的图形显示了语音编码器的框图 -
语音信号的频谱(200Hz - 3200Hz)用15个带宽为200Hz的带通滤波器(BPF)分成15个频率范围。BPF的输出作为整流单元的输入。
这里,信号被整流并滤波以产生直流电压。该产生的DC电压与存在于滤波器的输出处存在的AC信号的幅度成比例。
频率判别器的输入是语音信号。频率鉴别器单元之后是20Hz的低通滤波器(LPF)。这LPF产生直流电压与声音频率成正比。频率代表的只是声音的音调。
这直流电压也表明讲话是否正确有声的或无声的笑。
现在,所有LPF的输出都是经过采样、多路复用和A/D转换的直流电压。因此,我们在编码器的输出端有一个数字等效的语音信号。这种编码语音信号包括从200Hz到3200Hz的频率分量,关于语音的音调和它是浊音还是浊音的信息。
声音解码器
首先对语音编码器产生的数字语音信号进行解码。然后使用语音合成器的语音解码器在其输出产生语音信号。它通常会生成一个近似语音信号。
语音解码器部分的框图如下所示 -
多路分解器和DAC部分将接收的编码信号转换回其模拟形式。这里,使用平衡调制器(BM)-Filter组合对应于编码器的整流器组合使用。该BM的载波是噪声发生器或脉冲发生器的输出。但这取决于交换机的位置。
然而,开关位置由译码器决定。因此,因为当接收到浊音信号时,开关将脉冲发生器输出连接到所有BM的输入。
类似地,当接收到未经帮助的信号时,开关将噪声发生器输出连接到所有BM的输入。但是,交换机的位置完全取决于解码器的决定。
如果接收到的信号是浊音的,只有特定的BM将提供输出。这完全取决于接收信号的频率分量。但如果接收到的信号是无声的,我们可以得到所有BM的输出。加法器因此将所有模拟信号加起来并产生语音或语音输出。
用声码器进行语音传输是一种有益的技术,但却是一种不利的技术。这是因为它会导致语音质量的下降。
发表评论