home > res > literature > Encyclopaedia >

?頻率史—從電源頻率到音頻采樣頻率與視頻幀率:29.97/44.1

Author:zhoulujun Date:

段子兩匹馬的屁股寬度決定了美國最先進的航天飛機推進器的直徑。本篇依次推演,從美蘇電源頻率50Hz 60Hz推演到PAL與NTSC制式場頻50Hz與59 94Hz 及音頻采樣頻率44 1kHz相關歷史淵源

電源頻率的標準:電流頻率50HZ和60HZ問題

60Hz為美國、日本、加拿大及親美國家廣泛使用。其二極發電機的同步轉速為1秒轉1圈。每分鐘3600轉。民用電標準:110V/60Hz

50Hz為歐洲及蘇聯及受蘇聯影響地區使用。其二極發電機的同步轉速為每分鐘3000轉。發電機轉速較低,對機器設備的制造、安裝和調試精度要求較低,相對成本也較低。民用電標準:220V/60Hz

60Hz的發電機是3600轉的,50Hz的是3000轉的

我國電力工業主要是蘇聯來的,所以同蘇聯,采用了50赫茲。解放前,50Hz與60Hz電網并存于世,之間以變頻機組聯結交換電力;解放后,60Hz的發電機逐步被淘汰。目前我國大陸、港澳已成為單一50Hz電網的國家。臺灣依舊是110V/60Hz。日本50Hz于60Hz并存。這里推薦閱讀《為何中國電壓是220V?220V電壓的由來

PAL制式與NTSC制式

世界上的錄像機主要有二大制式。就是歐洲的PAL制式和美國日本的NTSC制式。

NTSC制式:1952年由美國國家電視標準委員會指定的彩色電視廣播標準,它采用正交平衡調幅的技術方式,故也稱為正交平衡調幅制。美國、加拿大等大部分西半球國家以及中國的臺灣、日本、韓國、菲律賓等均采用這種制式。

NTSC制式,場頻59.94Hz(接近但不是60Hz,為了抗干擾),行頻15575Hz,每一場525條掃描線。適用于NTSC制式錄像機的編碼器,其采樣頻率就是44.056。早期,日本確有一些采用44.056kHz采用頻率的數碼錄音,但后來統一到44.1kHz了

PAL制式:1962在西德(德國蘇控區)被指定為彩色電視廣播標準,它采用逐行倒相正交平衡調幅的技術方法,克服了NTSC制相位敏感造成色彩失真的缺點。蘇聯、西德、英國等一些西歐國家,新加坡、中國大陸及香港,澳大利亞、新西蘭等國家采用這種制式。PAL制式中根據不同的參數細節,又可以進一步劃分為G、I、D等制式,其中PAL-D制是我國大陸采用的制式。

PAL制式錄像機的編碼器,其采樣頻率就是44.1kHz。

SECAM制式:SECAM是法文的縮寫,意為順序傳送彩色信號與存儲恢復彩色信號制,是由法國在1956年提出,1966年制定的一種新的彩色電視制式。它也克服了NTSC制式相位失真的缺點,但采用時間分隔法來傳送兩個色差信號。使用SECAM制的國家主要集中在法國、東歐和中東一帶。這里算是比較偏門,就不講了。

44.1kHz與44.056kHz的由來

44,100= 50 x294 x 3=50×9×7×7×2

44,056= 59.94 x 245 x3

50Hz和59.94Hz分別是PAL和NTSC的場頻, 294和245是從PAL和NTSC的線數上來的,因為是隔行掃描的,所以掃描線數要除2。故此PAL的掃描線就變成312.5而NTSC則變成262.5。但在模擬電視時代,為確保電視畫面內容完整,所以攝像機,錄像機,電視機都采用過掃描技術,最上,最下,最左,最右的部分都給舍去了。因此,無論PAL還是NTSC制式的實際掃描線,都比625和525少。PAL制式下可用掃描線數是294線,而NTSC則是245線。至于x3,則是在一條視頻掃描線的磁跡中,紀錄三個數碼音頻數據塊。于是,就有了上面的式子,就有了44.1kHz。

音頻采樣率列表

常見音頻采樣頻率:

  • 8,000 Hz - 電話所用采樣率, 對于人的說話已經足夠

  • 11,025 Hz-AM調幅廣播所用采樣率

  • 22,050 Hz和24,000 Hz- FM調頻廣播所用采樣率

  • 32,000 Hz - miniDV 數碼視頻 camcorder、DAT (LP mode)所用采樣率

  • 44,100 Hz - 音頻 CD, 也常用于 MPEG-1 音頻(VCD, SVCD, MP3)所用采樣率

  • 47,250 Hz - 商用 PCM 錄音機所用采樣率

  • 48,000 Hz - miniDV、數字電視、DVD、DAT、電影和專業音頻所用的數字聲音所用采樣率

  • 50,000 Hz - 商用數字錄音機所用采樣率

  • 96,000 或者 192,000 Hz - DVD-Audio、一些 LPCM DVD 音軌、BD-ROM(藍光盤)音軌、和 HD-DVD (高清晰度 DVD)音軌所用所用采樣率

以前一直被教育,說音頻范圍是20HZ~20KHZ,那么我就以為是人耳能聽見這范圍。其實人耳真正能聽到的范圍是在90-15.1K Hz(15.1K Hz是人耳的極限),這是最理想的時候,隨著年齡增大和其他原因,實際的聽力范圍要遠遠小于它,主要在高頻方面,隨著年齡增大下降明顯。人的聽力范圍是由生理結構所決定的,不可能超出,長時間生活在高頻的環境里,人只能感覺到煩躁,是不是主觀察覺到它的存在那只有天知道,低頻做為一種能量,人通過皮膚能察覺到,而非聽到。

指在安靜環境下,人耳在各個頻率能聽到聲音的閾值 

由于人耳對不同頻率的解析度不同,MPEG1/Audio將22khz內可感知的頻率范圍,依不同編碼層,不同取樣頻率,劃分成23~26個臨界頻帶。下圖列出理想臨界頻帶的中心頻率與頻寬。圖中可看到,人耳對低頻的解析度較好。

即時通訊音視頻開發(七):音頻基礎及編碼原理入門_2.gif 

對于音頻存儲于播放,20kHz足夠,但是對于音頻采樣,模擬時代的音頻生產中,由于濾波器、效果器的性能問題,一般會使用極高的采樣率,來給畸變留出空間。44.1Ksps是一個常用的采樣率,對應的帶寬是22.05KHz,這個頻率是由協議規則,取這樣一個值可能是考慮時鐘分頻的方便(9×7×7×2×100)。40KHz 以上的采樣一定可以確保準確還原 20KHz 的信號,這有香農定律證明;12幀的連續圖片看起來就是運動的,為什么還有電影的24幀、30幀、48幀、60幀以及120幀?同理高頻采樣可以跟細膩地還原低頻采樣,雖然邊際效應很明顯,但的確有所提高

即時通訊音視頻開發(七):音頻基礎及編碼原理入門_0_1278601535p7FL.gif 

Nyquist采樣定律:采樣率大于或等于連續信號最高頻率分量的2倍時,采樣信號可以用來完美重構原始連續信號。

實踐中 44.1KHz 和 48KHz 所留出的余地也足夠應付濾波器帶來的畸變等。在數字電路角度來考慮,高采樣其實是把大量的采樣噪聲向高頻轉移。反正高頻你聽不見,有噪聲就有噪聲唄~噪聲不能消除,但是巧妙的規避了。

音頻位深度 

44分貝 - 屬于人類可以接受的程度 

55分貝 - 開始感覺到煩 

60分貝 - 開始沒有睡意 

70分貝 - 令人精神緊張 

85分貝 - 長時間讓人無法接受而捂住耳朵 

100分貝 - 可讓你你的耳朵暫時失去聽覺 

120分貝 - 可以瞬間刺穿你的耳膜 

160分貝 - 碎玻璃 

200分貝 - 人類死亡

一般CD就是44.1Hz/16bit 采樣。我們常見的16Bit,可以記錄大概96分貝的動態范圍,每一個比特大約可以記錄6分貝的聲音。同理,20Bit可記錄的動態范圍大概就是120dB;24Bit就大概是144dB。

假如,我們定義0dB為峰值,那么聲音振幅以向下延伸計算,那么,CD音頻可的動態范圍就是"-96dB~0dB。",依次類推,24Bit的HD-Audio高清音頻的的動態范圍就是"-144dB~0dB。"。由此可見,位深度較高時,有更大的動態范圍可利用,可以記錄更低電平的細節。

頻域上的掩蔽效應

幅值較大的信號會掩蔽頻率相近的幅值較小的信號,如下圖:
即時通訊音視頻開發(七):音頻基礎及編碼原理入門_3.gif 

時域上的遮蔽效應

在一個很短的時間內,若出現了2個聲音,SPL(sound pressure level)較大的聲音會掩蔽SPL較小的聲音。時域掩蔽效應分前向掩蔽(pre-masking)和后向掩蔽(post-masking),其中post-masking的時間會比較長,約是pre-masking的10倍。

即時通訊音視頻開發(七):音頻基礎及編碼原理入門_4.gif 

參考文章:

CD為什么采用44.1kHz采樣頻率的問題  https://www.jianshu.com/p/d49cdc2f716d



轉載本站文章《?頻率史—從電源頻率到音頻采樣頻率與視頻幀率:29.97/44.1》,
請注明出處:http://www.qsexmk.tw/html/res/literature/Encyclopaedia/8020.html