研究動機與目的
因為人身安全與財產保障的重視,近年來視訊監控系統需求大增,相關的技術與功能也不斷的更新,雖然這些硬體設備在使用上已非常方便,但仍存在許多限制及不便之處,例如:儲存設備的空間限制、缺乏對目標作即時性的追蹤,造成無法適時發現入侵者。且由於現今社會逐漸走向未來智慧型軟體控制的趨勢,因此可移動式鏡頭自動控制的開發,便成為一項重要的課題。
主要研究的問題(目標)簡單說明如下,先去了解H.264與PTZ攝影機,再針對我們的主題“自動得到一個最佳鏡頭”實作,最佳鏡頭指的就是攝影機能上下左右的移動到我們有興趣的位置(人的所在),且鏡頭會拉近拉遠到適當的位置(物體太近鏡頭拉開拉遠,物體太遠鏡頭拉近),最後完成整個系統並能在網路上做主從式(client/server)的連線:
1. H.264 視訊編碼資訊
由於硬體儲存設備的空間限制,一般的監控系統會使用視訊壓縮的技術來讓空間有效利用,像是MPEG4 或H.264 都現在新穎的壓縮技術,都是利用空間、時間上畫面的冗餘性來減少不必要的重複儲存。其中H.264具有:(1)Multi-reference frame,(2) Variable block size,(3) Integer DCT之優勢,使得壓縮出的影像品質較好。
計畫中主要利用H.264偵測出畫面中的移動向量(Motion Vector)、block size資訊等,控制攝影機鏡頭對移動物體做出適當的判斷,以達最佳鏡頭。因此對於H.264如何獲得MV等資訊,以及所具有上述之優勢,是首要探討的主題。
2. PTZ攝影機內部操作指令
計畫中所使用之攝影機為Sony
EVI-D70,對於一台先進的硬體設備,功能必定十分強大,因此首要工作需研讀攝影機使用手冊,以了解攝影機與電腦的溝通介面、內部操作指令、使用限制等,且試圖找出與本計畫相關的攝影機功能加以應用,達成預期目標。
3. 自動追蹤實作
在熟悉攝影機的操作指令後,我們應如何將H.264所偵測到的MV等資訊,應用在程式中,進而控制攝影機,當畫面中的移動物體(通常是人)與鏡頭有所改變時,例如:靠近、遠離、向左或向右移動等,能自動且及時追蹤,使物體保持在最佳畫面的位置。計畫中首要考慮為偵測時機,也就是何時應對移動物體作追蹤(利用Sony PTZ的alarm function)。更進一步的,考慮當物體移動到某些程度時,攝影機須作出何種判斷,例如:左右平移、放大、縮小等。而當物體已為最佳鏡頭時,又如何控制攝影機使物體保持在畫面中心?由此可知,須對最佳鏡頭作明確的定義,以利鏡頭判斷。
4. 網路傳輸
獲得完整的追蹤畫面後,須建立網路的server 端及client 端, client 端用來控制攝影機及處理影像編解碼,server 端用來將client 端傳來的H.264資料流(data stream)做即時解碼顯示在螢幕上,在server 端的管理者或用戶除了可以得到畫面資訊外,還可以遠端手動控制攝影機。
關於這個”最佳鏡頭”的題目,也就是自動左右移到我們有興趣的區域,而且可以利用鏡頭拉近拉遠(Zooming)讓物體太靠近鏡頭時做拉遠(Zoom out),物體太遠離鏡頭時,也就是物體太小看不清楚時做自動的拉近(Zoom in),以得到一個好的觀看位置,這個自動拉近拉遠的想法在過去已經有人討論過 [1],且把它叫做”zoom tracking”,雖然有的文獻中所指的”zoom tracking”是另外一件事[2],我們在這裡還是以“zoom tracking”或是“變焦追蹤”來表示,另外也有一些將它實作在物體追蹤(object tracking)之上的文獻[3]~[8]。不過,這些方法都是直接對空間、時間域(spatial, temporal domain)做分析,這如果在硬體實現上會很耗硬體的成本,且沒有效率。
監視畫面的儲存,因為硬體空間的有限,一般都會需於壓縮以有效的儲存,而現在最新穎的,也是最有潛力視訊編碼標準就是H.264[9],許多H.264的加速研究、最佳化研究或相關的產品都不斷推出,所以近年來也有很多關於H.264在硬體上實現的研究[10][11]。我們這裡提出來的主要想法就是想在壓縮域(compression domain)上操作最佳監視鏡頭,即利用H.264所偵測出的編碼資訊拿來做分析,像是移動向量(motion vector)、區塊大小(block size)等,這些都和物體的變動區域很有關係。這樣作法有利於硬體實現,記憶體、頻寬與處理單元都得以減少。
另一方面,我們在”最佳鏡頭”這個題目所使用的PTZ攝影機也是發展國際一流大學及頂尖研究中心計畫(五年五百億計畫)的研究重點之一,目前我們所研究出來的追蹤攝影機較一般是售常見的攝影機相比起來功能齊全許多,不論是在軟體上偵測移動所需時間、追蹤速度或者是在硬體上的需求,相較於同等的監視攝影機我們都有明顯的改善,而這也是我們所樂見的。此外,因為我們所追求的是”最佳鏡頭”,因此所拍攝出來的畫面也叫一般監視攝影機清楚(因為我們力求物體在畫面中大小固定,不因移動、拉近、拉遠而影響他在畫面的位置大小),這對於人身安全與財產保障有很大的助益,而這也是我們一開始所研究的動機之所在。