圖像識別中圖像表達的關鍵技術研究.pdf_第1頁
已閱讀1頁,還剩78頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、物體和場景識別在基于內(nèi)容的圖像檢索,自主機器人導航,醫(yī)學圖像分類等領域有著廣泛應用。本文從近些年視覺認知的主要進展出發(fā),對認知中的關鍵技術進行了探索,力圖進一步提升認知準確率。
  經(jīng)典的物體、場景識別可以分為特征描述和特征判別兩個部分,前者力圖得到關于物體的最具判別意義的表達,而后者通過對訓練樣本的學習,得到不同類別判決函數(shù)的計算模型。同樣,這一框架也適用與視頻目標的自組織識別。然而,視頻目標具有其獨特特性與挑戰(zhàn):
  ◇

2、視頻中目標特性往往經(jīng)歷長期漸變的過程,故而其特征也必然經(jīng)歷這一變化過程。這就要求對于特征有效性的分析必然是一個遞進的過程。
  ◇視頻中目標往往伴隨場景出現(xiàn),即目標和背景具有很強的相關性。如何利用這一相關性,提高識別性能,也是面臨的挑戰(zhàn)之一。
  然而現(xiàn)有物體識別方法性能與人類相比仍然有著巨大的差距,研究表并沒有證據(jù)表明人類模式識別的算法比標準機器學習算法優(yōu)越,并且人類并沒有過多依賴于訓練數(shù)據(jù)的量的大小,故而影響人類認知精度

3、的關鍵可能在于特征的選擇。事實上,相對于特征判別的學習方法,特征描述在物體識別的性能中起著更加重要的作用。為此,研究重點之一集中在如何有效描述視頻中目標特征這一問題上。一方面,目標特性的漸變要求建立目標特征的在線評價機制:特定特征可能僅僅在特定時間段內(nèi)有效;另一方面,目標與場景的相關性,可以通過場景全局特征與目標局部特征的混合表達實現(xiàn)。
  研究以詞袋模型為起點,將高維特征視為一維特征的疊加,進一步將一維特征視為未知概率分布的觀測

4、。故此,特征有效性的在線評價轉化為概率密度的在線估計和比較問題。借鑒了蒙特卡洛方法的思想,實驗采用混合高斯模型逼近該概率分布,以KL距離為主要度量方式,從互信息的角度將特征遞推的認知過程分析分為特征的魯棒性分析和對決策結果的影響分析,初步探索了在線特征評價模型。
  在特征評價機制的基礎之上,研究過程中,仔細對比和分析不同特征描述模型的優(yōu)缺點,設計了基于混合表達的視覺認知模型。該模型分別對場景全局特征和目標的局部特性表達進行了融合

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論