![](https://static.zsdocx.com/FlexPaper/FileRoot/2019-3/16/16/411c0af1-22c4-408a-92f8-48df9b5dadfb/411c0af1-22c4-408a-92f8-48df9b5dadfbpic.jpg)
![層次化視頻語義標(biāo)注與檢索.pdf_第1頁](https://static.zsdocx.com/FlexPaper/FileRoot/2019-3/16/16/411c0af1-22c4-408a-92f8-48df9b5dadfb/411c0af1-22c4-408a-92f8-48df9b5dadfb1.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、隨著多媒體、計算機和網(wǎng)絡(luò)的發(fā)展,視頻數(shù)據(jù)飛速增長。為了對這些海量視頻數(shù)據(jù)進(jìn)行存儲、管理、和索引,需要研究高效的基于內(nèi)容的方法對視頻數(shù)據(jù)進(jìn)行檢索,而視頻標(biāo)注是視頻索引和視頻搜索的基礎(chǔ)。本文研究如何利用機器學(xué)習(xí)和視頻的特征,對視頻進(jìn)行多層次的、基于內(nèi)容的標(biāo)注。 視頻在結(jié)構(gòu)上共分四個層次:視頻(video)、場景(Scene)、鏡頭(shot)、圖象幀(frame)。通常視頻標(biāo)注主要在其中的視頻層和鏡頭層中進(jìn)行。視頻層的標(biāo)注是對整段視
2、頻標(biāo)注其類型屬性。鏡頭層的標(biāo)注主要是依據(jù)從該鏡頭中提取的關(guān)鍵幀,標(biāo)注其對應(yīng)的語義概念。根據(jù)所標(biāo)注的語義概念對應(yīng)的是圖象幀層次還是物體層次的,鏡頭層標(biāo)注又可進(jìn)一步分為圖象幀層標(biāo)注和物體層標(biāo)注。本文研究在視頻層、圖象幀層、和物體層上進(jìn)行視頻標(biāo)注時的關(guān)鍵問題,主要工作和創(chuàng)新之處歸納為以下幾點: 1.目前視頻類型層標(biāo)注的研究工作通常僅僅標(biāo)注了幾種簡單的類型,或者是局限在電影、體育運動等某個特定的類型內(nèi)標(biāo)注其子類型,而且使用的分類器也過于
3、簡單。本文定義了一個相對完備的視頻類型分層表示,分析并提取一系列與類型相關(guān)的時空域特征,并提出使用局部和全局優(yōu)化的多類SVM二叉樹提高分類精度。實驗結(jié)果表明,本文提出的局部和全局優(yōu)化的SVM二叉樹與另外兩種典型的SVM多類分類算法、以及現(xiàn)有的視頻分類工作中使用的分類器相比,能夠獲得更高的精確度。 2.當(dāng)蘸盼視頻類型層標(biāo)注工作都是采用被動監(jiān)督學(xué)習(xí)的方法,需要大量的訓(xùn)練數(shù)據(jù)和費時費力的手工標(biāo)注。本文將主動學(xué)習(xí)引入視頻類型層標(biāo)注,并提
4、出使用后驗概率來計算分類器對未標(biāo)注樣本的置信度,然后依據(jù)此置信度選擇分類器最不確定的樣本,也即最“有用”的樣本提供給用戶進(jìn)行標(biāo)注,從而用更少的訓(xùn)練樣本獲得和大量訓(xùn)練樣本近似的分類效果,減輕用戶標(biāo)注訓(xùn)練數(shù)據(jù)的負(fù)擔(dān)。實驗結(jié)果表明,本文提出的基于后驗概率的主動學(xué)習(xí)樣本選擇策略要略好于現(xiàn)有的基于變型空間的主動學(xué)習(xí)樣本選擇策略、以及被動學(xué)習(xí)的樣本選擇策略。 3.對于圖象幀層視頻標(biāo)注,本文考慮一種經(jīng)常遇到的實際應(yīng)用:僅擁有一小部分相關(guān)的正例,如俺學(xué)
5、習(xí)該目標(biāo)概念的模型。此時進(jìn)行視頻標(biāo)注主要存在下面兩個問題:第一,對于僅有正例的訓(xùn)練數(shù)據(jù),傳統(tǒng)的區(qū)分型分類器如SVM等無法直接使用;第二,區(qū)分各種語義概念的底層特征有很大的不同,使用統(tǒng)一的特征無法適應(yīng)各種語義概念的變化。本文提出一個基于流形排序的關(guān)鍵幀圖象層視頻標(biāo)注框。對第一個問題,用流行排序解決僅有正例的不足,同時可以利用未標(biāo)注數(shù)據(jù)的分布信息。對第二個問題,定義一個特征選擇準(zhǔn)則,引入特征選擇為不同的語義概念選擇不同的特征。此關(guān)鍵幀圖象層
6、視頻標(biāo)注框架支持新定義的目標(biāo)概念和新特征的引入。 4.在物體層視頻標(biāo)注中,傳統(tǒng)的多實例學(xué)習(xí)表達(dá)忽略了各種語義概念之間的語義相關(guān)性。因此本文提出existence-based多實例表達(dá)來描述這種概念間的語義相關(guān)性,并根據(jù)existence-based表達(dá)設(shè)計一種新的多實例學(xué)習(xí)算法MI-AdaBoost。算法首先對訓(xùn)練數(shù)據(jù)中的每個包進(jìn)行特征映射,轉(zhuǎn)換成包級特征空間的一個特征矢量,從麗將多實例學(xué)習(xí)轉(zhuǎn)換為傳統(tǒng)的監(jiān)督學(xué)習(xí)。這種特征映射會為
7、每個包建立一個包含大量噪聲的高維特征矢量,可以用AdaBoost進(jìn)行特征選擇并構(gòu)建分類器。 5。不同的語義概念對應(yīng)的底層特征有很大的不同,因此特征選擇對視頻標(biāo)注是非常關(guān)鍵的一個問題。以前的研究工作在將多實例學(xué)習(xí)應(yīng)用于視頻標(biāo)注時,都忽略了如何在多實例學(xué)習(xí)情況下做特征選擇的問題。由于傳統(tǒng)的單實例學(xué)習(xí)下的特征選擇算法通常都無法在多實例學(xué)習(xí)中直接應(yīng)用,本文提如了一種多實例學(xué)習(xí)下的特征選擇算法EBMIL,能夠在選擇映射后的包級特征的同時,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 圖像語義標(biāo)注與檢索方法研究.pdf
- 基于語義標(biāo)注的視頻相關(guān)反饋檢索系統(tǒng).pdf
- 圖像與視頻自動語義標(biāo)注方法研究.pdf
- 圖像的語義化標(biāo)注和檢索關(guān)鍵技術(shù)研究.pdf
- 圖像的語義化標(biāo)注和檢索關(guān)鍵技術(shù)研究
- 基于語義的視頻檢索.pdf
- 視頻語義標(biāo)注研究及原型實現(xiàn).pdf
- 多媒體交叉參照檢索和語義自動標(biāo)注.pdf
- 網(wǎng)球視頻多層次分析與檢索.pdf
- 基于多特征學(xué)習(xí)的視頻語義標(biāo)注.pdf
- 基于語義的圖像標(biāo)注和檢索算法研究.pdf
- 工程文檔語義標(biāo)注與檢索中若干關(guān)鍵問題研究.pdf
- 基于語義數(shù)碼相片標(biāo)注與檢索系統(tǒng)的開發(fā).pdf
- 視頻語義標(biāo)注方法和理論的研究.pdf
- 基于內(nèi)容的圖像檢索和視頻標(biāo)注.pdf
- 基于模糊圖論的視頻語義自動標(biāo)注.pdf
- 視頻語義標(biāo)注的若干問題研究.pdf
- 圖像語義標(biāo)注與檢索及其在遙感圖像處理中的應(yīng)用.pdf
- 新聞視頻語義概念探測與語義檢索關(guān)鍵技術(shù)研究.pdf
- 協(xié)同圖像檢索與標(biāo)注.pdf
評論
0/150
提交評論