估計移動攝像機的運動是計算機視覺領域中普遍存在的問題。隨著自動駕駛汽車和無人駕駛飛機等技術的現多日益普及,需要一種快速有效的目標算法來實現車載視頻處理,從而以較低的跟蹤計算成本返回及時,準確的使用攝像信息。攝像機運動的機運計實這種估計或“姿勢估計”也是移動車輛或平臺上目標跟蹤的重要組成部分。
楊百翰大學的動估研究人員已在IEEE/CAA自動化學報上發表了他們的研究結果,這是現多由電氣電子工程師學會和中國科學院共同出版的。他們發現了一種方法,目標可以通過巧妙地“播種”一種已經在計算機視覺行業中使用的跟蹤算法來大大減少姿態估計的計算時間和復雜性。
姿勢估計算法利用來自移動攝像機的使用攝像視頻饋送的幀來生成關于攝像機如何在每個連續幀的過程中移動的假設。迄今為止,機運計實用于姿態估計的動估算法需要針對視頻輸入中的數據,針對攝像機的移動方式最多生成五到十個假設。然后,根據這些假設對數據的擬合程度對其進行評分,并選擇得分最高的假設作為最佳姿勢估計。不幸的是,多個假設的產生在計算上是昂貴的,并且導致用于穩健的姿勢估計的返回時間變慢。
研究人員找到了一種方法,可以通過在每幀之間提供信息來為計算機視覺中已經使用的算法提供種子或提示,從而大大減少了產生許多假設的需要。“在每次迭代中,我們都使用當前的最佳假設來播種算法。”所需假設的減少直接導致了計算時間和復雜性的減少;“我們證明了這種方法顯著減少了必須生成和評分以估計姿勢的假設的數量,從而可以實時執行算法。”
然后,研究小組將其播種方法與其他最新的姿態估計算法進行了比較,以分類減少假設數量如何影響計算的準確性。“經過100次迭代,使用先驗信息的播種方法的誤差與OpenCV五點多項式求解器相當,盡管事實是,每次迭代僅生成一個假設,而不是大約四個假設的平均值。”此外,當及時檢查這兩種算法時,團隊的算法明顯優于其他現有技術。在大多數情況下,新算法快十倍。
該小組隨后修改了他們的算法以實現目標跟蹤,并在多旋翼無人機上對其進行了測試。該算法以640x480的分辨率成功跟蹤了多個目標。結果與他們先前的分析一致。“完整的算法每幀需要29毫秒的運行時間,這意味著它能夠以每秒34幀(FPS)的速度實時運行。”至于下一步,該團隊計劃將其應用于3D場景重建和更復雜的跟蹤方法。