視訊編碼概念

        視訊是由一連串的二維影像所組成,如果我們用靜態影像的標準來壓縮每一張畫面,雖然對每個單張畫面可能有不錯的壓縮效果,但是這樣對視訊整體來說並無法得到有效率的壓縮比。

1.視訊編碼原理

2.動作向量與動作補償

3.Discrete Cosine Transform(DCT)

4. I & P & B Frames

1.視訊編碼原理   

        視訊既然由一連串靜止畫面組成,若我們在做視訊壓縮時,考慮畫面間的關聯性,則可對視訊做有效壓縮。通常畫面與畫面間有極大的相似性,因此會產生時間上累贅( temporal  redundancy ),壓縮時參考兩張畫面的關聯性,只對不同的地方做壓縮,或者直接使用前一張畫面,以減少資料量,達到壓縮效果。

        單張畫面內鄰近之點的關聯性也很高,有空間上的累贅( spatial redundancy ),我們可對此做進一步的壓縮。

        再加上視訊的接收端為人類的視覺系統,考慮人類對視訊的感覺,移除人眼無法察覺的失真,再將資料做有效率的儲存。

        視訊編碼的主要工作便是累贅( Redundancy )的去除與探討 back to top

 

2.動作向量與動作補償  

     利用畫面間的相關性,使用區塊( block )為基礎的方式來描述運動的向量,稱為動作向量(motion vector簡稱MV),動作向量是描述運動資訊的向量。利用動作向量可以達到畫面間的動作補償預測( motion compensation prediction )

        在參考畫面中找到與目前畫面最匹配之巨方塊( macroclock,簡稱MB ) ,達成MV的動作估計。動作補償預測就是以前一個畫面加上每個方塊的MV來建立現在畫面的預測影像。back to top

 

3.Discrete Cosine Transform(DCT) 

        Discrete Cosine Transform(DCT)是一個無損的,可逆的數學過程,它是一種空間域到頻率域的轉換,經由DCT轉換後的能量會集中在幾個低頻係數的數值上,而高頻的係數則會趨近於零,DCT轉換可減少spatial redundancy back to top

 

4. I & P & B Frames  

       一般視訊編碼的畫面可分為以下三種

I Frame:不用參考過去畫面,所編碼的靜止frame,是張完整的畫面。視訊中若沒有I frame則無法隨意選取畫面。

P Frame:它是從最近解出來的I frameP frame所預測出來的畫面。

B Frame:它是從最近解出來的兩個I framesP frames所預測出來的,一個是前面的畫面,一個是後來的。back to top