作 者:聂秀英 张恒升 黎家力 罗忠
音乐的编码技术主要有自适应变换编码(频域编码)、心理声学模型和熵编码等技术。
自适应变换编码:利用正交变换,把时域音频信号变换到另一个域,由于去相关的结果,变换域系数的能量集中在一个较小的范围,所以对变换域系数最佳量化后,可以实现码率的压缩。理论上的最佳量化很难达到,通常采用自适应比特分配和自适应量化技术来对频域数据进行量化。在MPEGlayer3和AAC标准及DolbyAC-3标准中都使用了改进的余弦变换(MDCT);在ITUG.722.1标准中则用的是重叠调制变换(MLT)。本质上它们都是余弦变换的改进。
心理声学模型:其基本思想是对信息量加以压缩,同时使失真尽可能不被觉察出来,利用人耳的掩蔽效应就可以达到此目的,即较弱的声音会被同时存在的较强的声音所掩盖,使得人耳无法听到。在音频压缩编码中利用掩蔽效应,就可以通过给不同频率处的信号分量分配以不同的量化比特数的方法来控制量化噪声,使得噪声的能量低于掩蔽阈值,从而使得人耳感觉不到量化过程的存在。在MPEGlayer2、3和AAC标准及AC-3标准中都采用了心理声学模型,在目前的高质量音频标准中,心理声学模型是一个最有效的算法模型。
熵编码:根据信息论的原理,可以找到最佳数据压缩编码的方法,数据压缩的理论极限是信息熵。如果要求编码过程中不丢失信息量,即要求保存信息熵,这种信息保持编码叫熵编码,它是根据信息出现概率的分布特性而进行的,是一种无损数据压缩编码。常用的有霍夫曼编码和算术编码。在MPEGlayer1、2、3和AAC标准及ITUG.722.1标准中都使用了霍夫曼编码;在MPEG4BSAC工具中则使用了效率更高的算术编码。
2.3数字音频编码的主要应用
对数字音频信息的编码进行压缩的目的是在不影响人们使用的情况下使数字音频信息的数据量最少。通常用如下6个属性来衡量:
—比特率;
—主观/客观的语音质量;
—计算复杂度和对存储器的要求;
—延迟;
—对于通道误码的灵敏度;
—信号的带宽。
由于不同的应用,人们对数字音频信息的要求是不同的,并且在选择数字音频信息编码所采用的技术时也需要了解人们对音频信息的各种应用。目前数字音频信息处理技术主要应用于:
■消费电子类数字音响设备
CD唱机、数字磁带录音机(DAT)、MP3播放机以及MD(MiniDisc)唱机已经广泛地应用了数字音频技术。
■广播节目制作系统
在声音节目制作系统,如录音、声音处理加工、记录存储、非线性编辑等环节使用了数字调音台、数字音频工作站等数字音频设备。
■多媒体应用
在多媒体上的应用体现在VCD、DVD、多媒体计算机以及Internet。VCD采用MPEG-I编码格式记录声音和图像;DVD-Audio格式支持多种不同的编码方式和记录参数,可选的编码方式包括无损的MLP、DSD、DilbyAC-3、MPEG2-layer2Audio等,而且是可扩充的、开放的,并可以应用未来的编码技术:Internet上采用MP3的音频格式传输声音,以提高下载能力。
■广播电视数字化
在广播电视和数字音频广播系统中,声音编码采用MUSICAM编码方法,符合MPEG-1Layer1高级音频编码。如当今的数字电视采用的音频标准就是DilbyAC-3和MPEG-layer2。
■通讯系统