深度剖析視頻基礎知識(1)

花濰?趣拍云產品經理

深度分解視頻基礎知識

“視頻技術發展到現在已經有100多年的歷史,雖然比照相技術歷史時間短,但在過去很長一段時間之內都是最重要的媒體。

由于互聯網在新世紀的崛起,使得傳統的媒體技術有了更好的發展平臺,應運而生了新的多媒體技術。而多媒體技術不僅涵蓋了傳統媒體的表達,又增加了交互互動功能,成為了目前最主要的信息工具。

在多媒體技術中,最先獲得發展的是圖片信息技術,由于信息來源更加廣泛,生成速度高生產效率高,加上應用門檻較低,因此一度是互聯網上最有吸引力的內容。

然而隨著技術的不斷進步,視頻技術的制作加工門檻逐漸降低,信息資源的不斷增長,同時由于視頻信息內容更加豐富完整的先天優勢,在近年來已經逐漸成為主流。

那么接下來我就對視頻信息技術做一個詳細的介紹。今天我們首先講的是模擬時代和數字化時代的視頻技術。”

模擬時代的視頻技術

最早的視頻技術來源于電影,電影技術則來源于照相技術。由于現代互聯網視頻信息技術原理則來源于電視技術,所以這里只做電視技術的介紹。

世界上第一臺電視誕生于1925年,是由英國人約翰貝德發明。同時也是世界上第一套電視拍攝、信號發射和接收系統。而電視技術的原理大概可以理解為信號采集、信號傳輸、圖像還原三個階段。

攝像信號的采集,通過感光器件獲取到光線的強度(早期的電視是黑白的,所以只取亮度信號)。然后每隔30~40毫秒,將所采集到光線的強度信息發送到接收端。而對于信號的還原,也是同步的每隔30~40毫秒,將信號掃描到熒光屏上進行展示。

那么對于信號的還原,由于熒光屏電視采用的是射線槍將射線打到熒光圖層,來激發熒光顯示,那么射線槍繪制整幅圖像就需要一段時間。射線槍從屏幕頂端開始一行一行的發出射線,一直到屏幕底端。然后繼續從頂部開始一行一行的發射,來顯示下一幅圖像。但是射線槍掃描速度沒有那么快,所以每次圖像顯示,要么只掃單數行,要么只掃雙數行。然后兩幅圖像疊加,就是完整的一幀畫面。所以電視在早期都是隔行掃描。

那么信號是怎么產生的呢?

跟相機感光原理一樣,感光器件是對光敏感的設備,對于進光的強弱可以產生不同的電壓。然后再將這些信號轉換成不同的電流發射到接收端。電視機的掃描槍以不同的電流強度發射到熒光屏上時,熒光粉接收到的射線越強,就會越亮,越弱就會越暗。這樣就產生了黑白信號。

那么幀和場的概念是什么?

前面說到,由于攝像采集信號屬于連續拍攝圖像,比如每隔40毫秒截取一張圖像,也就是說每秒會產生25副圖像。而每個圖像就是一幀畫面,所以每秒25副圖像就可以描述為幀率為25FPS(frames per second)。而由于過去電視熒光屏掃描是隔行掃描,每兩次掃描才產生一副圖像,而每次掃描就叫做1場。也就是說每2場掃描生成1幀畫面。所以幀率25FPS時,隔行掃描就是50場每秒。

模擬時代在全世界電視信號標準并不是統一的,電視場的標準有很多,叫做電視信號制式標準。黑白電視的時期制式標準非常多,有A、B、C、D、E、G、H、I、K、K1、L、M、N等,共計13種(我國采用的是D和K制)。到了彩色電視時代,制式簡化成了三種:NTSC、PAL、SECAM,其中NTSC又分為NTSC4.43和NTSC3.58。我國彩色電視采用的是PAL制式中的D制調幅模式,所以也叫PAL-D制式。有興趣的可以百度百科“電視制式”來詳細了解。

另外你可能會發現,場的頻率其實是和交流電的頻率一致的。比如我國的電網交流電的頻率是50Hz,而電視制式PAL-D是50場每秒,也是50Hz。這之間是否有關聯呢?可以告訴你的是,的確有關聯,不過建議大家自己去研究。

彩色信號又是怎么產生的呢?

其實有了基礎的黑白攝像技術之后,人們就一直想實現彩色攝像。早在1861年,英國物理學家麥克斯韋就論證了所有彩色都可以使用紅、藍、綠三種基色來疊加生成。但是感光器件只是對光線敏感,但是對顏色卻無法識別。為了實現對顏色的識別,人們用分光鏡加濾光片的方式,將光線分解成為三種基色的純色模式。然后分別對三個基色的純色亮度進行采集,然后再把信號疊加實現了對彩色信號的采集能力。

色彩信號是如何表達的?

因為原來黑白電視的時候,基本上只需要一路信號就可以還原圖像(同步信號后面講)。但是有了彩色之后,一路信號能否表達一副完整的彩色圖像,以及如何表達呢?

彩色電視出現之后,為了兼容早期的黑白電視信號(也就是黑白電視機可以接收彩色信號,但是只顯示黑白),科學家引入了YUV色彩表示法。

YUV信號有多種叫法,可以稱作色差信號(Y,R-Y,B-Y),也可以稱作分量信號(YCbCr,或者Component、YPbPr)。它是由一個亮度信號Y (Luminance或Luma),和兩個色度信號U和V組成(Chrominance或Chroma)。黑白電視只使用亮度信號Y,彩色電視可以額外使用兩個色度信號,來實現彩色效果。但是YUV信號是怎么來的呢?

首先,是因為考慮到黑白電視兼容,所以基礎信號仍然采用亮度信號。而顏色表達本身是通過RGB三基色的疊加來實現的,為了能夠將YUV信號可以還原成三基色RGB色彩值,數學家利用了色差算法,即選取一路Cr信號和一路Cb信號。Cr信號是指RGB的紅色信號部分與RGB亮度值之間的差異,Cb信號是指RGB的藍色信號與RGB亮度值之間的差異。所以YUV信號有時候也表達為Y,R-Y和B-Y,所以也叫色差信號。

為什么YUV色彩會延續至今?

如果大家平時經常拿手機拍攝視頻,你可以把拍攝的視頻文件傳輸到電腦上,然后用MediaInfo軟件打開,你會發現很多關于視頻的參數信息。而這些參數信息里面,你一定會發現手機拍攝的視頻色彩也是使用YUV信號模式。為什么不用RGB來表達?現在早都沒有黑白電視了啊?

其實不必考慮兼容性的原因,因為你無論是什么信號模式拍攝的視頻,只要是數字化的信息文件形式,都可以與播放設備的信號模式無關。因為播放設備在播放視頻文件時需要解碼,再進行渲染。這時候不管什么信號模式還是色彩空間,都能轉化成設備兼容的方式。

至于為什么YUV信號模式一直會持續至今,最主要的原因不是因為兼容性考慮,而是YUV信號有個巨大的優勢,就是節省帶寬。這在數字媒體領域是很重要的。

人眼的視覺特點是,人眼對于亮度信號最為敏感,對色度信號敏感度要弱一些。所以可以適當減少色度信號的容量,也不會被人眼觀察到差異。就好比音頻里面的MP3壓縮格式,是將耳朵不敏感的頻率信號容量降低或去除掉,以大大降低文件的大小,但是人耳卻基本聽不到差異。

至于YUV信號是如何做到降低信息容量的,可以看下面的引文:

YUV主要的采樣格式有YCbCr 4:2:0、YCbCr 4:2:2、YCbCr 4:1:1和 YCbCr 4:4:4。其中YCbCr 4:1:1 比較常用,其含義為:每個點保存一個 8bit 的亮度值(也就是Y值),每 2x2 個點保存一個 Cr 和Cb 值,圖像在肉眼中的感覺不會起太大的變化。所以, 原來用 RGB(R,G,B 都是 8bit unsigned) 模型, 1個點需要 8x3=24 bits(如下圖第一個圖),(全采樣后,YUV仍各占8bit)。按4:1:1采樣后,而現在平均僅需要 8+(8/4)+(8/4)=12bits(4個點,8*4(Y)+8(U)+8(V)=48bits), 平均每個點占12bits。這樣就把圖像的數據壓縮了一半。

以上內容引自百度百科“YUV”條目。限于篇幅原因,對于YUV的各種采樣模式不再祥加描述,大家可以參考百度百科中的詳細解釋。

數字化時代的視頻技術

視頻技術發展到了數字化時代,其實原理上并沒有太多變化。這也就是為什么前面要提到模擬時代視頻技術的知識的原因。

但是數字化的視頻技術,雖然基礎原理沒有改變,但是各方面的性能和功能有了很大的提升。這些就重點講一下數字化之后的視頻技術有了哪些突破:

彩色攝像的演進

前面講到,實現彩色攝像其實是把光線分解成為三個基色分別取亮度值,但是這種結構比較復雜,成本也高。因為實現彩色攝像需要有一個分光用的棱鏡,然后采集光線必須要用到三片感光器件(CCD或CMOS)。這種結構帶來第二個不好的地方就是結構會比較龐大,不利于小型化微型化。

后來呢,德國人拜耳發明了一種濾鏡,是一種馬賽克濾鏡。將含三基色的馬賽克濾鏡覆蓋在感光器件上面,這樣就可以實現用一片感光器件來采集三種顏色,同時也取消了分光棱鏡這種結構。這樣下來,不僅成本降低了,結構也簡化了。

有了這種技術之后,攝像設備就可以越做越小,現在集成在手機上的攝像頭整體厚度只有2~3毫米,尺寸只有1~3毫米。當然在專業領域,高端的攝像機仍然采用分光棱鏡加3CCD的技術,原因不是他們不愿意改,而是3CCD的色彩豐度更好。而且專業攝像機CCD技術也從IT型發展到了FIT型,感興趣的同學可以查看一下SONY公司關于FIT型CCD專業攝像機的介紹來了解。總而言之,就是民用領域和專業領域發展方向不一樣,所以路線也不同。

場概念消失

在模擬電視時代,受限于顯像管技術原因,采用的是隔行掃描技術來還原圖像顯示。但是現在都是平板電視了(液晶電視、等離子電視、激光電視),電視的成像方式不再是一條線一條線的掃描,而是一次性全畫面呈現。所以現在的視頻拍攝一般都沒有場的概念,當然為了向前兼容,在視頻文件信息中,你會看到掃描模式的參數。利用手機拍攝的視頻文件,其掃描模式的參數都是Progressive,就是逐行掃描的意思。

采樣率和采樣精度

大家都知道模擬和數字的最大差別就是信息存儲和傳遞方式,一個是模擬量一個是數字量化的。那么數字化對于連續過程的量化就必須用到采樣過程,也可以理解為片段化。例如音頻數字化,就是把音頻在每個很小的時間間隔上獲取音頻的信息然后進行數字量化,最后把所有連續采樣的數字量化數據組合,來形成最終的信息。視頻也是這樣,按照一定的時間間隔,把獲取到的圖像進行數字量化,然后連續的數字量化的集合就是一段完整的視頻文件。

但是視頻的采樣率并非是大家理解的那樣,每秒鐘產生25幀的圖像,采樣率就是25Hz。實際上,ITU(International Telecommunications Union,國際電信聯盟)在CCIR 601標準中,對于視頻的采樣標準有了明確的界定:

一、采樣頻率:為了保證信號的同步,采樣頻率必須是電視信號行頻的倍數。CCIR為NTSC、PAL和SECAM制式制定的共同的電視圖像采樣標準:

f s=13.5MHz

這個采樣頻率正好是PAL、SECAM制行頻的864倍,NTSC制行頻的858倍,可以保證采樣時采樣時鐘與行同步信號同步。對于4:2:2的采樣格式,亮度信號用fs頻率采樣,兩個色差信號分別用

f s/2=6.75MHz的頻率采樣。由此可推出色度分量的最小采樣率是3.375MHz。

二、分辨率:根據采樣頻率,可算出對于PAL和SECAM制式,每一掃描行采樣864個樣本點;對于NTSC制則是858個樣本點。由于電視信號中每一行都包括一定的同步信號和回掃信號,故有效的圖像信號樣本點并沒有那么多,CCIR 601規定對所有的制式,其每一行的有效樣本點數為720點。由于不同的制式其每幀的有效行數不同(PAL和SECAM制為576行,NTSC制為484行),CCIR 定義720×484為高清晰度電視HDTV(High Definition TV)的基本標準。實際計算機顯示數字視頻時,通常采用下表的參數:

三、數據量:CCIR 601規定,每個樣本點都按8位數字化,也即有256個等級。但實際上亮度信號占220級,色度信號占225級,其它位作同步、編碼等控制用。如果按f s 的采樣率、4:2:2的格式采樣,則數字視頻的數據量為:

13.5(MHz)×8(bit)+2×6.75(MHz)×8(bit) = 27Mbyte / s同樣可以算出,如果按4:4:4的方式采樣,數字視頻的數據量為每秒40兆字節!按每秒27兆字節的數據率計算,一段10秒鐘的數字視頻要占用270兆字節的存儲空間。按此數據率,一張680兆字節容量的光盤只能記錄約25秒的數字視頻數據信息,而且即使當前高倍速的光驅,其數據傳輸率也遠遠達不到每秒27兆字節的傳輸要求,視頻數據將無法實時回放。這種未壓縮的數字視頻數據量對于當前的計算機和網絡來說無論是存儲或傳輸都是不現實的,因此,在多媒體中應用數字視頻的關鍵問題是數字視頻的壓縮技術。

由上述引文可知,YUV的采樣率和采樣精度,是數字視頻從模擬向數字化過渡中兼容性的解決方案。延續了模擬視頻以行為單位掃描的機制(模擬視頻沒有分辨率概念,只有行的概念)。由于這套標準是面向數字電視廣播系統制定的統一標準,一般只在廣播電視領域中才會看到,而在其他的數字化視頻體系中基本沒有體現。比如你在視頻文件信息中找不到關于采樣率的參數。

視頻分辨率

視頻分辨率也是數字化視頻時代的主要特征,由于模擬視頻采用線掃描機制,也就是按行顯示圖像,而每一行的視頻線中并沒有進行數字量化,所以模擬視頻都是以多少行來界定的。比如PAL制式采用576行,NTSC制式采用480行。

到了數字化時代,為了量化視頻的具體信息,就必須對每行的信息進行采樣并量化,就形成了分辨率的概念。如果采用PAL制式的視頻,每行量化的圖像點為768個,那么分辨率就是768×576。也就是說把PAL制的視頻圖像可以分解為768×576個像素點組成。

雖然簡單的看視頻分辨率的概念挺簡單的,但實際上并沒有那么簡單。原因就是數字化視頻的應用領域非常的多,從最早的廣播電視應用,到監控安防,到互聯網應用,后來又到了高清數字電視,以及移動互聯網等等。而因為涉及的行業很多,每個行業都會制定自己的標準,所以就形成了對視頻圖像分辨率的定義有了很多標準。我們就拿最常見的廣播電視、監控安防為例:

大家在計算機領域也都有接觸過分辨率的概念,比如VGA(640×480)、SVGA(800×600)、XGA(1024×768)、SXGA(1280×1024)、SXGA+(1400×1050)、UXGA(1600×1200)、WXGA(1280×800)、WXGA+(1280×854/1440×900)、WSXGA(1600×1024)、WSXGA+(1680×1050)、WUXGA(1920×1200)等等。現在最高的標準是WQUXGA(3840×2400)。這個標準最早是由IBM制定的模擬信號的電腦顯示標準,后來被各廠家繼續沿用和升級。再后來被VESA標準化組織統一制定。

但是為什么分辨率就不能是簡單的數字,非要在前面弄一堆字母呢?這一堆字母絕對能把一大群人搞暈掉。

原因在于制定一個輸出的分辨率,并不是簡單的設置有多少個像素點,而是還要考慮到實現這個像素點成像的方法。包括色階多少、帶寬多大、掃描方式怎樣,如果深入的講還有電路形式、增益控制、時序方式、尋址方式等等。如果沒有詳細制定這些圖像是如何生成的,那么各個廠家之間的產品可能很難兼容,也就不會見到今天如此發達的計算機市場了。

同樣的道理,制定標準化的分辨率和實現方式,有助于行業的統一和兼容。

監控安防領域有什么分辨率標準呢?下面請看:

這里解釋一下,CIF是 Common Intermediate Format 的縮寫,即通用影像傳輸視頻會議(video conference)中常使用的影像傳輸格式,是ITU H.261協議中的一部分。大家可能發現了,每個分辨率的色度取樣個數和行數都是對應分辨率的一半。沒錯,因為這個標準因為考慮到攝像頭的性能和傳輸的性能影響,采取的是間隔像素采樣和隔行掃描機制,而間隔像素采樣通過插值進行補齊。

不過這些參數貌似現在很難見到了,為什么呢?很簡單,因為監控安防現在都是高清化了,都是D2、D3這種級別的,對應分辨率是720P和1080P這一類。

那么在廣播電視領域,對于分辨率的定義又是怎樣呢?

前面已經提到了關于PAL制和NTSC制式的視頻分辨率標準,另外還有一個SECAM制式,SECAM的分辨率為720×576。那么你會發現SECAM制式和PAL制的行數是一樣的,只有每行的分辨率不同。這是由于SECAM調制載波方式不同造成的。

在標清電視時代,對于分辨率方面理解與現在其實有所不同。比如SECAM制式每幀圖像是625行,但是分辨率是720×576,也就是只有576行。是因為視頻信號傳輸過程中分幀正程和幀逆程,而幀逆程就是回掃,反向回去。在視頻信號正常顯示時,需要消除行幀逆程掃描對畫面的干擾,所以就變成了576行。

到了高清時代,數字電視推出了HDTV標準,它對于顯示分辨率的定義為1280×720逐行掃描,也就是俗稱的720P;1920×1080隔行掃描,也就是俗稱的1080i;1920×1080逐行掃描,也就是所謂的1080P。

當然高清數字電視已經逐漸普及了,目前正在面向4K高清過渡,也就是所謂的UHDTV(Ultra High Definition Television,超高清數字電視)。UHDTV草案定義了兩個分辨率標準,及4K(3840×2160)和8K(7680×4320),支持50Hz、60Hz、和59.94Hz三種幀率,只采用逐行掃描。UHDTV采用正交采樣,像素縱橫比(PAR)為1:1,顯示縱橫比(DAR)為16:9。

關于像素縱橫比和顯示縱橫比的概念,相對比較簡單,這里就不做解釋了。

關于信號同步

信號同步是在廣播電視領域中非常重要的技術,因為它如果出現問題,你的電視畫面一定是沒法看的,比如下面這種情況:

產生這種畫面的原因,在于信號沒有同步。導致行掃描時,沒有在指定的位置。

要想圖像內容在正確的位置顯示,就必須提供同步信號來進行約束。而不管是模擬電視時代,還是在數字電視時代,不管是電視機還是顯示器都需要信號同步。

同步信號一般有兩種,分別為場同步(VSYNC)和行同步(HSYNC)。不論是什么類型的信號接口,都包含有一個或兩個同步信號。

VGA信號線的引腳定義

另外一種形式的VGA接口,也叫RGBHV接口

DVI接口引腳定義

專業設備中的專用視頻同步接口

雖然有很多設備如電視機的復合信號輸入(Composite)、HDMI輸入,顯示器的DisplayPort輸入,專業設備的SDI和HD SDI輸入,都沒有專門的視頻場同步和行同步信號接口,但并不是說這些信號不需要同步。而是這些信號接口把場同步和行同步信號已經調制到了信號中。

也就是說我們平時見到的視頻信號接口中,并非只有純粹的視頻信息,還包含了很多的信息,比如同步信號、時鐘信號(TC,TimeCode)、CEC控制信號、HDCP版權保護信息、SerialClock設備與分辨率識別信息等。

未完待續

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,702評論 6 531
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,143評論 3 415
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 175,553評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,620評論 1 307
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,416評論 6 405
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 54,940評論 1 321
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,024評論 3 440
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,170評論 0 287
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,709評論 1 333
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,597評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,784評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,291評論 5 357
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,029評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,407評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,663評論 1 280
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,403評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,746評論 2 370

推薦閱讀更多精彩內容