![](https://static.zsdocx.com/FlexPaper/FileRoot/2019-3/14/17/c33f9176-419c-4735-8fd9-443eb0fdf0f4/c33f9176-419c-4735-8fd9-443eb0fdf0f4pic.jpg)
![基于圖像特征及上下文的圖像標(biāo)注算法研究與實(shí)現(xiàn).pdf_第1頁(yè)](https://static.zsdocx.com/FlexPaper/FileRoot/2019-3/14/17/c33f9176-419c-4735-8fd9-443eb0fdf0f4/c33f9176-419c-4735-8fd9-443eb0fdf0f41.gif)
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、近些年來(lái),隨著信息技術(shù)、互聯(lián)網(wǎng)尤其是移動(dòng)互聯(lián)網(wǎng)的迅速發(fā)展,網(wǎng)絡(luò)上各種數(shù)據(jù)信息呈爆發(fā)式增長(zhǎng),人們正從信息時(shí)代步入大數(shù)據(jù)時(shí)代,對(duì)這些數(shù)據(jù)進(jìn)行整理、分析、理解將產(chǎn)生巨大的價(jià)值。不同于傳統(tǒng)數(shù)據(jù)分析處理的結(jié)構(gòu)化數(shù)據(jù),網(wǎng)絡(luò)上絕大多數(shù)據(jù)屬于非結(jié)構(gòu)化數(shù)據(jù),而這些非結(jié)構(gòu)化數(shù)據(jù)中圖像占了較大部分,對(duì)互聯(lián)網(wǎng)中圖像的分析、研究顯得愈發(fā)重要。由于人們所理解的語(yǔ)義信息與圖像底層特征之間“語(yǔ)義鴻溝”的存在,用戶想要從海量的互聯(lián)網(wǎng)圖片中尋找出自己感興趣的圖片是較為困難
2、的,迫切需要一種方法來(lái)方便用戶尋找到所期望的圖片,因此,連接高層語(yǔ)義與低層圖像特征的方法逐步成為研究的一個(gè)熱點(diǎn),而圖像自動(dòng)標(biāo)注技術(shù)(Automatic Image Annotation,AIA)是一個(gè)較好的填補(bǔ)用戶與圖片之間“語(yǔ)義鴻溝”的方法。
傳統(tǒng)的“圖像自動(dòng)標(biāo)注技術(shù)”僅僅著眼于圖像本身,對(duì)圖像相關(guān)信息的利用局限于圖像本身特征而沒(méi)有考慮其他信息,在互聯(lián)網(wǎng)時(shí)代,圖像大多存儲(chǔ)在網(wǎng)絡(luò)上,而這些互聯(lián)網(wǎng)上圖像有著豐富的上下文信息,對(duì)這
3、些上下文信息加以分析利用將有助于對(duì)圖像產(chǎn)生更準(zhǔn)確、豐富的標(biāo)注。
本文對(duì)圖像自動(dòng)標(biāo)注問(wèn)題進(jìn)行了研究。采用了一種基于圖像特征和上下文信息的互聯(lián)網(wǎng)圖像自動(dòng)標(biāo)注方法來(lái)對(duì)圖像進(jìn)行標(biāo)注,該方法分為兩個(gè)階段,通過(guò)圖像特征進(jìn)行標(biāo)注以及通過(guò)上下文對(duì)圖像進(jìn)行補(bǔ)充標(biāo)注。
在利用圖像特征進(jìn)行標(biāo)注過(guò)程中,本文同時(shí)利用了圖像深度學(xué)習(xí)特征和SURF特征對(duì)圖像進(jìn)行標(biāo)注,并對(duì)二者的標(biāo)注結(jié)果按一定權(quán)重進(jìn)行融合。本文并沒(méi)有像傳統(tǒng)方法那樣利用一個(gè)訓(xùn)練好的分
4、類器,然后根據(jù)圖像特征對(duì)圖像進(jìn)行分類,而采用了一種新的標(biāo)注方法,利用已經(jīng)標(biāo)注圖像與待標(biāo)注圖像的相似性,來(lái)對(duì)待標(biāo)注圖像進(jìn)行標(biāo)注,這樣就將圖像的自動(dòng)標(biāo)注問(wèn)題轉(zhuǎn)化為圖像的檢索問(wèn)題。
為了加快圖像的檢索過(guò)程,本文采用B+樹(shù)森林結(jié)構(gòu)來(lái)實(shí)現(xiàn)高維向量的快速近似最近鄰(ANN)檢索。該結(jié)構(gòu)基于圖像特征,通過(guò)構(gòu)造多個(gè)由隨機(jī)向量構(gòu)成的隨機(jī)分類平面來(lái)對(duì)樣本圖像特征進(jìn)行劃分,位于隨機(jī)分類平面兩側(cè)的特征分別被劃分到分類平面的不同子樹(shù)中,再采用與上層不同
5、的隨機(jī)分類平面對(duì)分類結(jié)果進(jìn)行二分類,重復(fù)以上過(guò)程,直至該類中的圖片數(shù)量不超過(guò)閾值為止,最終形成B+樹(shù)類型的數(shù)據(jù)結(jié)構(gòu),通過(guò)構(gòu)造多個(gè)這樣的B+樹(shù)形成B+樹(shù)森林。
在利用深度學(xué)習(xí)進(jìn)行圖像標(biāo)注時(shí),利用上述數(shù)據(jù)結(jié)構(gòu)對(duì)待標(biāo)注圖片特征進(jìn)行劃分,理論上,和待標(biāo)注圖片劃分在相同葉子節(jié)點(diǎn)的樣本圖片與待標(biāo)注圖片相似度高,利用這些圖片與待標(biāo)注圖片的相似度對(duì)樣本圖像的標(biāo)注進(jìn)行加權(quán)投票,可得到待標(biāo)注圖像的深度學(xué)習(xí)標(biāo)注。
對(duì)于SURF特征標(biāo)注過(guò)程
6、,采用與深度學(xué)習(xí)標(biāo)注類似的思想,在樣本圖像庫(kù)中檢索SURF特征最相似的TopN張圖片,對(duì)這TopN張圖片的標(biāo)注進(jìn)行加權(quán),可得到待標(biāo)注圖像的SURF特征標(biāo)注。對(duì)深度學(xué)習(xí)標(biāo)注結(jié)果和SURF標(biāo)注結(jié)果按照一定的權(quán)重進(jìn)行融合即可得到圖像特征標(biāo)注。
圖像的上下文往往包含與圖像內(nèi)容相關(guān)的信息,通過(guò)對(duì)圖像上下文信息的分析挖掘,將產(chǎn)生更加豐富準(zhǔn)確的標(biāo)注。本文通過(guò)圖像上下文信息對(duì)圖像進(jìn)行補(bǔ)充標(biāo)注。利用RAKE算法對(duì)圖像的上下文信息進(jìn)行核心關(guān)鍵詞提
7、取,可得到圖像的上下文關(guān)鍵詞及對(duì)應(yīng)的權(quán)重,為了防止引入無(wú)關(guān)的上下文信息,產(chǎn)生錯(cuò)誤的標(biāo)注結(jié)果,本文利用該關(guān)鍵詞標(biāo)注與圖像特征標(biāo)注的杰卡德距離來(lái)對(duì)上下文關(guān)鍵詞標(biāo)注的權(quán)重進(jìn)行重新加權(quán),然后對(duì)加權(quán)之后關(guān)鍵詞標(biāo)注集合與特征標(biāo)注集合進(jìn)行合并,對(duì)每個(gè)標(biāo)注按照其權(quán)重大小進(jìn)行排序,并按照一定的閾值進(jìn)行選取,即可得到最終的圖像標(biāo)注結(jié)果。
與傳統(tǒng)方法相比,本文所方法的優(yōu)點(diǎn)是無(wú)需對(duì)每個(gè)標(biāo)簽進(jìn)行單獨(dú)訓(xùn)練、標(biāo)注效率高,且由于本文方法不受訓(xùn)練集或者標(biāo)注詞集
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于圖像與標(biāo)注語(yǔ)義上下文的圖像自動(dòng)標(biāo)注算法研究.pdf
- 基于上下文的圖像標(biāo)注研究.pdf
- 基于上下文信息的Web圖像標(biāo)注研究.pdf
- 基于上下文的圖像理解算法研究.pdf
- 基于語(yǔ)義上下文建模的圖像語(yǔ)義自動(dòng)標(biāo)注研究.pdf
- 基于語(yǔ)義上下文的社群圖像標(biāo)簽填充算法的研究與實(shí)現(xiàn).pdf
- 基于上下文的視頻多語(yǔ)義標(biāo)注研究及實(shí)現(xiàn).pdf
- 基于圖像視覺(jué)上下文的多元IB聚類算法.pdf
- 基于上下文語(yǔ)義的圖像編輯.pdf
- 基于上下文信息的語(yǔ)義圖像分類研究.pdf
- 基于上下文分類的圖像壓縮方法研究.pdf
- 基于上下文相關(guān)的圖像檢索方法研究.pdf
- 基于上下文的靜止圖像和極光圖像壓縮.pdf
- 基于上下文的圖像插值方法(1)
- 基于上下文的圖像插值方法.pdf
- 基于形狀上下文的圖像內(nèi)容檢索方法研究.pdf
- 基于稀疏表示及上下文信息的PolSAR圖像分類.pdf
- 基于局部特征和視覺(jué)上下文的圖像檢索系統(tǒng).pdf
- 基于上下文的形狀匹配算法研究與實(shí)現(xiàn).pdf
- 基于上下文的音視頻標(biāo)注研究.pdf
評(píng)論
0/150
提交評(píng)論