時域指標(biāo)
音頻中采樣率對應(yīng)時域:你采不采樣,音頻模擬信號就在那里------->采樣率:一秒采集多少模擬信號樣本
視頻中的幀率對應(yīng)時域:你抓不抓圖像,圖像就在那里------->幀率:一秒抓取多少圖像
音頻中的時域指標(biāo)是采樣率
視頻中的時域指標(biāo)是幀率
音頻處理是聲波---(傳感器)---->模擬電------->數(shù)字電---(揚(yáng)聲器)---->聲波
視頻處理是現(xiàn)實(shí)圖像---(攝影設(shè)備)--->圖片---(播放設(shè)備:幀播放)--->電影(這句話可能有問題,以后再說)
視頻中的采樣:
采樣
采樣是指模擬信號向數(shù)字信號轉(zhuǎn)化的過程中,先把復(fù)合視頻信號中的亮度和色度分離,得到Y(jié)UV 或YIQ 分量,然后對三個分量分別采樣并進(jìn)行數(shù)字化,最后再轉(zhuǎn)換成RGB 空間。通俗點(diǎn)講,就是一個采樣點(diǎn)里面包含了一組亮度樣本(Y)和兩組色差樣本(Cr,Cb),無數(shù)個采樣點(diǎn)組合起來就是我們所看到的最終圖像。因此,每個采樣點(diǎn)中亮度樣本和色差樣本的多少成了衡量一幅圖像精細(xì)度的關(guān)鍵,樣本數(shù)值越高,畫面的精度就越高。常見的有4:4:4、4:2:2、4:2:0,比例越高,色彩信息越多,越精細(xì),后期調(diào)色或者有摳像需求的空間也越大,相應(yīng)的,比例越高,文件體積越大。
音頻:
音頻中叫采樣率,是指把音頻信號數(shù)字化(AD采樣)后一個通道1秒鐘有多少個樣本,對應(yīng)而來的就是原始的數(shù)據(jù)。如44.1kHz的采樣率,就是指1個通道1秒鐘有44.1k個數(shù)據(jù),這數(shù)據(jù)可以是16位,也可以是24或者其他,這就是采樣精度。
碼率就是音頻文件或者音頻流中1秒中的數(shù)據(jù)量,如1.44Mbps,就是1秒鐘內(nèi)的數(shù)據(jù)量達(dá)1.44Mbits。
原始的音頻數(shù)據(jù)和實(shí)際傳輸?shù)囊纛l流的大小一般不一致,是因?yàn)榇嬖趬嚎s算法這東東。壓縮后的音頻流一般是固定比特率,這樣有利于穩(wěn)定地傳輸。也可能是可變比特率,同樣大小的文件能取得更好的壓縮效果。
CD音質(zhì),一般2通道,原始音頻數(shù)據(jù)1秒鐘的數(shù)據(jù)量是44.1k162=1411.2kbits, 壓縮成128kbps的MP3,1秒鐘數(shù)據(jù)就變成了128kbits了。丟了少許一般人耳或者設(shè)備還原不了的細(xì)節(jié),節(jié)省了大量的磁盤空間或帶寬。
--
視頻:
視頻中對應(yīng)時域的概念叫幀率,如電影的24fps,還有各種30fps,60fps,甚至高速攝影中的120fps,就是指1秒鐘抓多少幅圖像。耳朵比眼睛靈敏多了,眼睛還有視覺殘留,所以這個幀率比音頻采樣率低太多了。但是圖像細(xì)節(jié)更多,所以視頻有尺寸大小,分辨率,也有采樣精度(8b/10b)之類的區(qū)別。假設(shè)都是1920x1080的圖像,30fps。圖像原始的格式是RGB888,一秒鐘的數(shù)據(jù)量就是(8+8+8)1920108030 = 1,492,992,000 bits。
同樣視頻也存在壓縮算法,如H.264,壓縮完1秒鐘的數(shù)據(jù)就叫碼率。假設(shè)H.264壓縮1080p的視頻,碼率是10Mbps,就是說1秒中的數(shù)據(jù)量為101024*1024= 10,485,760 bits。
兩者差別這么大,也是通過色彩空間轉(zhuǎn)化,壓縮,丟掉一些人眼感知不到的細(xì)節(jié),換取磁盤空間或帶寬。
總結(jié)
=====================
一般而言,采樣率(幀率)越高,就能越真實(shí)低保留【原始模擬的音視頻細(xì)節(jié)】。采樣率(幀率)越高,碼率就越高,能保留的【數(shù)字化后的音視頻內(nèi)容】細(xì)節(jié)就越多,還原出來的音質(zhì)或者畫質(zhì)就越好。但是,技術(shù)是在不斷進(jìn)步的,現(xiàn)在5W的LED比20年前5W的白熾燈要亮太多了。所以得結(jié)合各種采樣方式,壓縮算法質(zhì)量,甚至音視頻特性來分析。