以多相機架構為基礎應用隱藏式馬可夫模型之運動影像編輯系統
林侑諴
隨著數位化攝錄影設備的普及,不論是電視錄製的影片或是家用影片取得的管道也越來越便利,針對數位影片作為研究發展的領域也日益增長,從早期的Shot detection,進而發展到Video content analysis、Video structure analysis、Abstraction、High extraction等應用,使得影片可以更方便的觀賞及保存。電視上影片剪輯效果以往都需要經過專業的訓練,在這篇論文裡,我們提供了一個應用在多視角拍攝的棒(壘)球影片自動化剪輯系統,並且藉由推導出來的數學模型來模擬專業剪輯師的剪輯手法,讓個人化影片及家用影片也可以達到專業的編輯效果。
本論文目標為建立自動化棒(壘)球影片剪輯系統,以多視角拍攝並且結合影片內容分析及模擬專業剪輯,並且加入一般運動影片常用特效來達到更多樣化效果。本系統主要可分為四個部分,(1)影片同步化( Video synchronization ) (2) 場景的影片切割(Video shot cutting) (3)影片內容分析及事件偵測( Video content analysis and event detection) (4)建立事件的馬可夫隱藏式機率模型( Event model constructed using Hidden Markov Model )。多視角影片同步化主要是將我們在各個拍攝角度所取得的影片調整至同一時間軸。為瞭解決多個錄影機之間切換的問題,我們分析了電視上專業剪接人員所剪接出的影片,並且從專業剪接者的角度建構了一個機率模型,此機率模型記錄著不同事件發生時所會產生場景之間切換的機率,此機率模型會套用到我們所拍攝的影片內容上,藉此可以達到模擬專業剪接師拍攝時的效果。本系統預先定義了事件的種類,再將所拍攝的影片偵測出不同事件並將它們做分類,針對個人化影片的內容以及拍攝時所會產生的人為問題,系統選取的特徵滿足了不受環境因素幹擾以及人為影響的特性,可以提高事件偵測的準確率。事件分類完成後,系統會挑選適合的機率模型套用到每個事件中,並且結合我們所提出的演算法來進行場景切換,即可達到模擬專業剪輯的效果。