|
視訊是由一連串的二維影像所組成,如果我們用靜態影像的標準來壓縮每一張畫面,雖然對每個單張畫面可能有不錯的壓縮效果,但是這樣對視訊整體來說並無法得到有效率的壓縮比。 3.Discrete Cosine Transform(DCT) 視訊既然由一連串靜止畫面組成,若我們在做視訊壓縮時,考慮畫面間的關聯性,則可對視訊做有效壓縮。通常畫面與畫面間有極大的相似性,因此會產生時間上累贅( temporal redundancy ),壓縮時參考兩張畫面的關聯性,只對不同的地方做壓縮,或者直接使用前一張畫面,以減少資料量,達到壓縮效果。 單張畫面內鄰近之點的關聯性也很高,有空間上的累贅( spatial redundancy ),我們可對此做進一步的壓縮。 再加上視訊的接收端為人類的視覺系統,考慮人類對視訊的感覺,移除人眼無法察覺的失真,再將資料做有效率的儲存。 視訊編碼的主要工作便是累贅( Redundancy )的去除與探討。 back to top
利用畫面間的相關性,使用區塊( block )為基礎的方式來描述運動的向量,稱為動作向量(motion vector,簡稱MV),動作向量是描述運動資訊的向量。利用動作向量可以達到畫面間的動作補償預測( motion compensation prediction ) 。 在參考畫面中找到與目前畫面最匹配之巨方塊( macroclock,簡稱MB ) ,達成MV的動作估計。動作補償預測就是以前一個畫面加上每個方塊的MV來建立現在畫面的預測影像。back to top
3.Discrete Cosine Transform(DCT) Discrete Cosine Transform(DCT)是一個無損的,可逆的數學過程,它是一種空間域到頻率域的轉換,經由DCT轉換後的能量會集中在幾個低頻係數的數值上,而高頻的係數則會趨近於零,DCT轉換可減少spatial redundancy 。back to top
一般視訊編碼的畫面可分為以下三種︰ I Frame:不用參考過去畫面,所編碼的靜止frame,是張完整的畫面。視訊中若沒有I frame則無法隨意選取畫面。 P Frame:它是從最近解出來的I frame或P frame所預測出來的畫面。 B Frame:它是從最近解出來的兩個I frames或P frames所預測出來的,一個是前面的畫面,一個是後來的。back to top
|