社交媒體下的圖像標簽優(yōu)化研究.pdf_第1頁
已閱讀1頁,還剩63頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、數(shù)字影像設備、網(wǎng)絡技術的發(fā)展使互聯(lián)網(wǎng)圖像數(shù)量呈爆炸式增長,F(xiàn)lickr、Zooomr等社交網(wǎng)站的出現(xiàn)為海量圖像資源管理提供了新思路。這類網(wǎng)站的一個重要特點是用戶可以手工對共享的圖像進行標注,這一過程稱為社會化標注,社交媒體下用戶為資源提供的初始標簽稱為社會化標簽。社會化標簽在信息資源的管理、傳播、分享等方面發(fā)揮著非常重要的作用,但是由于社會化標注過程是完全自由、不受約束的,再加上用戶文化程度、生活背景等差異,導致社會化標簽存在諸多問題。

2、標簽缺失和低質(zhì)量標簽是其中最主要的問題,這些問題嚴重阻礙了社會化標簽在個性化推薦、圖像檢索等相關領域的進一步發(fā)展與應用。
  如何改善社會化標簽,使標簽能更全面、更精確地描述資源內(nèi)容具有十分重要的現(xiàn)實意義,同時也是當前計算機研究領域的熱點問題。本文結合機器學習和模式識別等方法對社交媒體下的圖像標簽優(yōu)化問題展開研究與探索,主要工作和研究成果包括以下三個方面:
  (1)首先系統(tǒng)地研究了社交媒體下標簽中存在的主要問題以及形成原因

3、,并且分析了圖像標簽優(yōu)化相關方法的研究現(xiàn)狀。在已有研究成果的基礎上,結合豐富的互聯(lián)網(wǎng)數(shù)據(jù)、詞典語義知識庫等信息,提出了一種綜合度量標簽相關性的方法,與傳統(tǒng)方法相比,該方法從不同語義角度(內(nèi)容相關性、層級相關性)探討了標簽-標簽關系。此外,還基于圖像特征提取、語義分析等技術探索了圖像-圖像相互關系。
  (2)針對社交媒體下圖像標簽缺失的問題,提出了一種基于標注詞語義與圖像視覺的標簽豐富算法。算法的主要思想是:首先根據(jù)用戶提供的初始

4、標簽為待豐富圖像推薦一組候選標簽集合,候選標簽滿足多樣性、相關性的要求。然后利用圖像信息、標簽信息進一步度量候選標簽與圖像之間的相關度,最終只保留相關度高的候選標簽。與其他方法相比,該算法充分融入了圖像-圖像、標簽-標簽相互關系,能準確召回缺失標簽,并且具有計算簡潔、成本代價低等優(yōu)勢。基于MIRFlickr數(shù)據(jù)展開實驗,實驗結果充分驗證了本算法能有效實現(xiàn)標簽豐富。
  (3)針對社交媒體下存在噪聲標簽、語義模糊等低質(zhì)量標簽的問題,

5、提出了一種高效的圖像標簽優(yōu)化算法。算法的主要思想是:首先基于隨機游走模型對圖像標簽信息進行初始化;然后利用標簽、圖像之間的語義關聯(lián)建立數(shù)學模型,進一步把標簽優(yōu)化問題轉(zhuǎn)換為該模型的求解問題。與已有的標簽優(yōu)化模型相比,該模型綜合考慮了圖像視覺與標簽語義的一致性、噪聲稀疏性、標注稀疏性這三個方面,充分保證了圖像與標簽之間正確的對應關系,提升了標簽優(yōu)化效果。最后基于MIRFlickr數(shù)據(jù)展開實驗,分別驗證了模型的有效性、預處理對模型的優(yōu)勢以及本

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論