模拟音频信号数字化技术

模拟音频信号数字化技术

声卡采样位数、采样频率:
文章摘要:采样位数与采样频率 音频信号是连续的模拟信号,而电脑处理的却只能是数字信号。因此,电脑要对音频信号进行处理,首先必须进行模/数(A/D)的转换。这个转换过程实际上

采样位数与采样频率
音频信号是连续的模拟信号,而电脑处理的却只能是数字信号。因此,电脑要对音频信号进行处理,首先必须进行模/数(A/D)的转换。这个转换过程实际上就是对音频信号的采样和量化过程,即把时间上连续的模拟信号转变为时间上不连续的数字信号,只要在连续量上等间隔的取足够多的点,就能逼真地模拟出原来的连续量。这个“取点”的过程我们称为采样(sampling),采样精度越高(“取点”越多)数字声音越逼真。其中信号幅度(电压值)方向采样精度,我们称之为采样位数(sampling resolution),时间方向的采样精度称为采样频率(sampling frequency)。

采样位数指的是每个采样点所代表音频信号的幅度。8bit的位数可以描述256种状态,而16bit则可以表示65536种状态。对于同一信号幅度而言,使用16bit的量化级来描述自然要比使用8bit来描述精细得多。其情形就尤如使用毫米为单位进行度量要比使用厘米为单位要精细一样。一般来说采样位数越高,声音就越清析。 采样频率是指每秒钟对音频信号的采样次数。单位时间内采样次数越多,即采样频率越高,数字信号就越接近原声。采样频率只要达到信号最高频率的两倍,就能精细描述被采样的信号。一般来说,人耳的听力范围在20hz到20Khz之间,因此,只要采样频率达到20Khz×2=40Khz时,就可以满足人们的要求。现时大多数声卡的采样频率都已达到44.1或48Khz,即达到所谓的CD音质水平了。

采样的位数编辑
采样位数可以理解为采集卡处理声音的解析度。这个数值越大,解析度就越高,录制和回放的声音就越真实。我们首先要知道:电脑中的声音文件是用数字0和1来表示的。连续的模拟信号按一定的采样频率经数码脉冲取样后,每一个离散的脉冲信号被以一定的量化精度量化成一串二进制编码流,这串编码流的位数即为采样位数,也称为量化精度。从码率的计算公式中可以清楚的看出码率和采样位数的关系:码率=取样频率×量化精度×声道数。

在电脑上录音的本质就是把模拟声音信号转换成数字信号。反之,在播放时则是把数字信号还原成模拟声音信号输出。采集卡的位是指采集卡在采集和播放声音文件时所使用数字声音信号的二进制位数。采集卡的位客观地反映了数字声音信号对输入声音信号描述的准确程度。8位代表2的8次方–256,16位则代表2的16次方–64K。比较一下,一段相同的音乐信息,16位声卡能把它分为64K个精度单位进行处理,而8位声卡只能处理256个精度单位。8位采样的差别在于动态范围的宽窄,动态范围宽广,音量起伏的大小变化就能够更精细的被记录下来,如此一来不论是细微的声音或是强烈的动感震撼,都可以表现的淋漓尽致,而CD音质的采样规格正式16位采样的规格。
16位二进制数的最小值是0000000000000000,最大值是1111111111111111,对应的十进制数就是0和65535,也就是最大和最小值之间的差值是65535,也就是说,它量化的模拟量的动态范围可以差65535,也就是96.32分贝,所以,量化精度只和动态范围有关,和频率响应没关系。动态范围定在96分贝也是有道理的,人耳的无痛苦极限声压是90分贝,96分贝的动态范围在普通应用中足够使用,所以96分贝动态范围内的模拟波,经量化后,不会产生削波失真的。
声音的位数就相当于画面的颜色数,表示每个取样的数据量,当然数据量越大,回放的声音越准确,不至于把开水壶的叫声和火车的鸣笛混淆。同样的道理,对于画面来说就是更清晰和准确,不至于把血和西红柿酱混淆。不过受人的器官的机能限制,16位的声音和24位的画面基本已经是普通人类的极限了,更高位数就只能靠仪器才能分辨出来了。比如电话就是3kHZ取样的7位声音,而CD是44.1kHZ取样的16位声音,所以CD就比电话更清楚。
如今市面上所有的主流产品都是16位的采集卡,而并非有些无知商家所鼓吹的64位乃至128位,他们将采集卡的复音概念与采样位数概念混淆在了一起。如今功能最为强大的采集卡系列采用的EMU10K1芯片虽然号称可以达到32位,但是它只是建立在Direct Sound加速基础上的一种多音频流技术,其本质还是一块16位的声卡。应该说16位的采样精度对于电脑多媒体音频而言已经绰绰有余了。 很多人都说,就算从原版CD抓轨,再刻录成CD,重放的音质也是不一样的,这个也是有道理的,那么,既然0101这样的二进数是完全克隆的,重放怎么会不一样呢?那是因为,时基问题造成的数模互换时的差别,并非是克隆过来的二进制数变了,二进制数一个也没变,时基误差不一样,数模转换后的模拟波的频率和源相比就会有不一样。 [1]
采样的频率编辑
采样频率是指录音设备在一秒钟内对声音信号的采样次数,采样频率越高声音的还原就越真实越自然。在当今的主流采集卡上,采样频率一般共分为22.05KHz、44.1KHz、48KHz三个等级,22.05 KHz只能达到FM广播的声音品质,44.1KHz则是理论上的CD音质界限,48KHz则更加精确一些。对于高于48KHz的采样频率人耳已无法辨别出来了,所以在电脑上没有多少使用价值。
5kHz的采样率仅能达到人们讲话的声音质量。
11kHz的采样率是播放小段声音的最低标准,是CD音质的四分之一。
22kHz采样率的声音可以达到CD音质的一半,目前大多数网站都选用这样的采样率。
44kHz的采样率是标准的CD音质,可以达到很好的听觉效果。
采样率类似于动态影像的帧数,比如电影的采样率是24赫兹,PAL制式的采样率是25赫兹,NTSC制式的采样率是30赫兹。当我们把采样到的一个个静止画面再以采样率同样的速度回放时,看到的就是连续的画面。同样的道理,把以44.1kHZ采样率记录的CD以同样的速率播放时,就能听到连续的声音。显然,这个采样率越高,听到的声音和看到的图像就越连贯。当然,人的听觉和视觉器官能分辨的采样率是有限的。对同一段声音,用20kHz和44.1kHz来采样,重放时,可能可以听出其中的差别,而基本上高于44.1kHZ采样的声音,比如说96kHz采样,绝大部分人已经觉察不到两种采样出来的声音的分别了。之所以使用44.1kHZ这个数值是因为经过了反复实验,人们发现这个采样精度最合适,低于这个值就会有较明显的损失,而高于这个值人的耳朵已经很难分辨,而且增大了数字音频所占用的空间。一般为了达到“万分精确”,我们还会使用48k甚至96k的采样精度,实际上,96k采样精度和44.1k采样精度的区别绝对不会象44.1k和22k那样区别如此之大,我们所使用的CD的采样标准就是44.1k。

发表评论