Android音頻技術開發之基礎知識

音頻技術開發，我們得對聲音有所了解，掌握音頻的基礎知識，這才能更好地去做技術開發。
首先介紹音頻基礎知識，然后介紹音頻的量化與編碼，音頻壓縮技術，音頻編解碼器選型，AAC，希望對幫助大家。

聲音三要素

音調 : 就是音頻，男生->女生->兒童。

聲音頻率的高低叫做音調。表示人的聽覺分辨一個聲音的調子高低的程度。音調主要由聲音的頻率決定，同時也與聲音強度有關。對一定強度的純音，音調隨頻率的升降而升降；對一定頻率的純音、低頻純音的音調隨聲強增加而下降，高頻純音的音調卻隨強度增加而上升。

音量: 振動的幅度。

音量又稱響度、音強，是指人耳對所聽到的聲音大小強弱的主觀感受，其客觀評價尺度是聲音的振幅大小。這種感受源自物體振動時所產生的壓力，即聲壓。物體振動通過不同的介質，將其振動能量傳導開去。人們為了對聲音的感受量化成可以監測的指標，就把聲壓分成“級”——聲壓級，以便能客觀的表示聲音的強弱，其單位稱為“分貝”（dB）。

音色: 它與材質有很大關系，本質就是諧波。

音色（Timbre）是指不同的聲音的頻率表現在波形方面總是有與眾不同的特性。不同的物體振動都有不同的特點。

我們為什么要了解聲音，音頻技術不是有音頻采集，音頻編碼，音頻解碼，算法等等就行了么，還要了解這么基本的知識有必要么，如果你了解個音頻技術里的倍速播放功能時，就你會發現當你倍速播放時，音調也發生了變化。

音頻采集

音頻采集一般使用 AudioRecod或者 MediaRecord

音頻采集的來源是什么？

一般是指麥克風:MediaRecorder.AudioSource.MIC

關于音頻是怎么采集的，到時候專門寫一篇音頻采集的文章，這章主要是了解音頻基礎知識。當我們采集到了聲音數據后都要對聲音數據進行量化。

音頻量化的過程

獲取模擬數據（即采集到的音頻波片段的數據）——>采樣（對音頻波進行采樣）——>量化（根據采樣點的值進行一一量化）——>編碼（根據樣本序號進行編碼）——>轉換成數字信號（即把樣本一一轉換01這樣的機器能識別的數字信號）

音頻量化基本概念

采樣大小: 一個采樣用多少bit存放。常用的是16bit（也有用8bit存放）

16bit 表示Y軸振幅的高度 2的16次方（聲音的振幅最高也高示過65535）

采樣率: 采樣頻率可分為8k 、16k、 32k、 44.1k、 48k等（對于AAC來說是采用44.1K的采樣率）

以44.1K為例，就是說每秒在模擬信號上，我們采樣441000次，比如說20Hz的頻率（20Hz也就是人聽到的最低頻率，20Hz的頻率即每秒采樣了20次），每秒鐘正弦波里，要采集多少次呢，要采樣2000次，那么對于高頻呢，比如20000Hz，那么就要采樣2次

聲道數: 單聲道、雙聲道、多聲道（什么叫雙聲道？就是有兩個喇叭，多聲道就是有多個喇叭）

AudioFormat.CHANNEL_IN_MONO 單聲道，一個聲道進行采樣
AudioFormat.CHANNEL_IN_STEREO 雙聲道，兩個聲道進行采樣

音頻采樣精度

采樣精度:聲音樣本大小bit/s表示。位數越高，聲音的保真度越高。
采樣精度決定了記錄聲音的動態范圍，它以位(Bit)為單位，比如8位、16位。8位可以把聲波分成256級，16位可以把同樣的波分成65536級的信號。
它反映度量聲音波形幅度的精度。例如，每個聲音樣本用16位(2字節)表示，測得的聲音樣本值是在0～65535的范圍里，它的精度就是輸入信號的1/65536。樣本位數的大小影響到聲音的質量，位數越多，聲音的質量越高，而需要的存儲空間也越多；位數越少，聲音的質量越低，需要的存儲空間越少。

一般都采用這個 AudioFormat.ENCODING_PCM_16BIT(官方文檔表示，該采樣精度保證所有設備都支持)

碼率計算

要算一個PCM音頻的碼率是一件很輕松的事情，采樣率 * 采樣大小 * 聲道數
例如：
采樣率為44.1KHz
采樣大小為16bit
雙聲道的PCM編碼的WAV文件
它是碼率為 44.1k * 16 * 2 =1411200b=1411.2Kb/s

每秒傳送的比特(bit)數。單位為 bps(Bit Per Second)，比特率越高，傳送數據速度越快。

PCM

PCM是英文Pulse-code modulation的縮寫，中文譯名是脈沖編碼調制。

我們知道在現實生活中，人耳聽到的聲音是模擬信號，PCM就是要把聲音從模擬轉換成數字信號的一種技術，他的原理簡單地說就是利用一個固定的頻率對模擬信號進行采樣，采樣后的信號在波形上看就像一串連續的幅值不一的脈沖，把這些脈沖的幅值按一定的精度進行量化，這些量化后的數值還要進行編碼，就是用一組二進制碼組來表示每一個量化值，然后記錄到存儲介質中，所有這些組成了數字音頻的產生過程。

音頻壓縮技術

音頻壓縮技術有兩種方法，如下：

消除冗余數據（久損壓縮技術）

在音頻采集過程中，會采集到各種各樣的聲音，其中只有一部分聲音是我們人能夠識別出來的，其他聲音我們可以直接刪除掉，這樣能夠大大減少存儲的數據，刪除掉的這些數據，當我們壓縮完之后是完全沒有了也無法恢復。

哈夫曼無損編碼（無損壓縮技術）

將人無法識別的聲音刪除之后，留下來的聲音對其壓縮編碼，壓縮后的編碼還能恢復為原來一模一樣的數據，這就稱為無損壓縮技術。

音頻冗余信息

壓縮的主要方法是去除采集到的音頻冗余信息，所謂冗余信息包括人耳聽覺范圍外的音頻信號以及被掩蔽掉的音頻信號
信號的掩蔽可以分為：頻域掩蔽、時域掩蔽

頻域掩蔽: 人耳所能察覺的聲音信號的頻率范圍為20Hz～20KHz，在這個頻率范圍以外的音頻信號屬于冗余信號；或一個強純音會掩蔽在其附近同時發聲的弱純音，那么弱純音也被掩蔽，弱純音屬于冗余信號。

時域掩蔽: 在時間上相鄰的聲音之間也有掩蔽現象，主要原因是人的大腦處理信息需要花費時間。同步掩蔽效應和不同頻率聲音的頻率和相對竟是有關，而時間掩蔽則僅僅和時間有關。如果兩個聲音在時間上特別接近，分辨會有困難（如兩個聲音音量相差較大且兩個聲音間隔時間低于5毫秒，則其中弱的那個聲音會聽不到）。

下面簡單列出常見的音頻壓縮格式：
MP3，AAC，OGG，WMA，Opus，FLAC，APE，m4a，AMR，等等

音頻編碼的過程

時域轉頻域變換 —（聲學模型）—> 量化編碼 —> 比特流格式（也可以添加輔助的數據）—> 比特流

音頻編解碼器選型

常見的音頻編碼器

常見的音頻編碼器包括 OPUS、AAC、Vorbis、Speex、iLBC、AMR、G.711等
網上評測結果： OPUS>AAC>Vorbis

常見的音頻編碼器他們的性能對比就不一一列舉了，感興趣的可以網上查閱一下。下面重點介紹一下AAC編碼器。

AAC介紹

為什么重點介紹AAC呢？

AAC是的應用范圍廣（市面上95%以上的都是AAC編碼器）

傳輸協議是用rtmp，RTMP是支持AAC的不支持OPUS

AAC是的編碼質量非常高，有一個高保幀，保持音頻的高保幀，這樣也導致很多應用使用AAC

AAC為了解決什么問題？

AAC（Advanced Audio Coding）目的是取代MP3格式

MPEG-4標準出現后，AAC加入了SBR技術和PS技術

目前常用的規格有AAC LC、AAC HE V1、AAC HE V2

AAC規格

AAC +SBR -> AAC HE V1
AAC+SBR+PS -> AAC HE V2

AAC規格描述

AAC LC: （Low Complexity）低復雜度，碼流128k
AAC HE V1: AAC LC +SBR（Spectral Band Replication）碼流64k(碼流減少了，音頻質量也提高了)
AAC HE V2: AAC LC +SBR + PS（Parametric Stereo）碼流32k(碼流減少了，音頻質量也提高了)

AAC格式

ADIF（Audio Data Interchange Format）這種格式只能從頭開始解碼，常用在磁盤文件中
ADTS（Audio Data Transport Stream）這種格式每一幀都有一個同步字，可以在音頻流的任何位置開始解碼，它似于數據流格式

AAC編碼庫那個好？

市面上的庫：
Libfdk_AAC > ffmpeg AAC > libfaac > libvo_aacenc
Libfdk_AAC的編碼效率更高

?著作權歸作者所有,轉載或內容合作請聯系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市，隨后出現的幾起案子，更是在濱河造成了極大的恐慌，老刑警劉巖，帶你破解...
沈念sama閱讀 227,572評論 6贊 531
死咒
序言：濱河連續發生了三起死亡事件，死亡現場離奇詭異，居然都是意外死亡，警方通過查閱死者的電腦和手機，發現死者居然都...
沈念sama閱讀 98,071評論 3贊 414
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人，你說我怎么就攤上這事。” “怎么了？”我有些...
開封第一講書人閱讀 175,409評論 0贊 373
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長。經常有香客問我，道長，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 62,569評論 1贊 307
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮，結果婚禮上，老公的妹妹穿的比我還像新娘。我一直安慰自己，他們只是感情好，可當我...
茶點故事閱讀 71,360評論 6贊 404
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著，像睡著了一般。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發上，一...
開封第一講書人閱讀 54,895評論 1贊 321
城市分裂傳說
那天，我揣著相機與錄音，去河邊找鬼。笑死，一個胖子當著我的面吹牛，可吹牛的內容都是我干的。我是一名探鬼主播，決...
沈念sama閱讀 42,979評論 3贊 440
雙鴛鴦連環套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了？” 一聲冷哼從身側響起，我...
開封第一講書人閱讀 42,123評論 0贊 286
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后，有當地人在樹林里發現了一具尸體，經...
沈念sama閱讀 48,643評論 1贊 333
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 40,559評論 3贊 354
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發現自己被綠了。大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 42,742評論 1贊 369
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖，靈堂內的尸體忽然破棺而出，到底是詐尸還是另有隱情，我是刑警寧澤，帶...
沈念sama閱讀 38,250評論 5贊 356
?日本核電站爆炸內幕
正文年R本政府宣布，位于F島的核電站，受9級特大地震影響，放射性物質發生泄漏。R本人自食惡果不足惜，卻給世界環境...
茶點故事閱讀 43,981評論 3贊 346
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧，春花似錦、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 34,363評論 0贊 25
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至，卻和暖如春，著一層夾襖步出監牢的瞬間，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 35,622評論 1贊 280
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人。一個月前我還...
沈念sama閱讀 51,354評論 3贊 390
代替公主和親
正文我出身青樓，卻偏偏與公主長得像，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 47,707評論 2贊 370

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

Android音頻技術開發之基礎知識

Android音頻技術開發之基礎知識

聲音三要素

音頻采集

音頻采集的來源是什么？

音頻量化的過程

音頻量化基本概念

碼率計算

音頻壓縮技術

音頻冗余信息

音頻編碼的過程

音頻編解碼器選型

AAC介紹

AAC規格

AAC規格描述

AAC格式

AAC編碼庫那個好？

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美 国产 综合 欧美 视频

Android音頻技術開發之基礎知識

聲音三要素

音頻采集

音頻采集的來源是什么？

音頻量化的過程

音頻量化基本概念

碼率計算

音頻壓縮技術

音頻冗余信息

音頻編碼的過程

音頻編解碼器選型

AAC介紹

AAC規格

AAC規格描述

AAC格式

AAC編碼庫那個好？

推薦閱讀更多精彩內容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频