壓縮域體育視頻摘要技術(shù)研究.pdf_第1頁(yè)
已閱讀1頁(yè),還剩110頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、多媒體信息分析與檢索是當(dāng)前信息領(lǐng)域研究的熱點(diǎn)之一。隨著數(shù)字化技術(shù)的發(fā)展,數(shù)字多媒體資源特別是視頻產(chǎn)品越來(lái)越豐富。多媒體具有蘊(yùn)涵信息量大、直觀和印象深刻等優(yōu)點(diǎn),已經(jīng)逐漸成為網(wǎng)絡(luò)和個(gè)人電腦上最重要的信息載體,傳統(tǒng)的基于文本的信息檢索技術(shù)很難對(duì)多媒體信息進(jìn)行有效的結(jié)構(gòu)化分析和快速檢索。多媒體信息分析與檢索通過(guò)對(duì)多媒體從低層特征到高層語(yǔ)義進(jìn)行處理、分析的過(guò)程獲取其內(nèi)容并根據(jù)內(nèi)容進(jìn)行檢索。由此可見(jiàn),多媒體信息分析與檢索具有重要的理論意義和應(yīng)用價(jià)值

2、。體育節(jié)目是觀眾最喜歡的視頻之一,然而觀眾和體育專(zhuān)業(yè)人士在冗長(zhǎng)的體育節(jié)目中很難定位其中的重要內(nèi)容。視頻摘要是對(duì)視頻內(nèi)容的概括,能夠簡(jiǎn)潔表現(xiàn)視頻的重要內(nèi)容,目的在于幫助人們更快捷、更方便定位視頻的重要內(nèi)容,是多媒體信息分析與檢索研究中的重要研究工作?;趬嚎s域處理可以實(shí)時(shí)生成視頻摘要。為此,本論文從靜態(tài)摘要、動(dòng)態(tài)摘要和基于語(yǔ)義的摘要三個(gè)方面來(lái)討論壓縮域體育視頻摘要技術(shù),研究?jī)?nèi)容涉及交互式壓縮域關(guān)鍵視頻對(duì)象選擇模型:壓縮域攝像機(jī)運(yùn)動(dòng)估計(jì)和交

3、互式壓縮域關(guān)鍵幀選擇模型;壓縮域重放場(chǎng)景檢測(cè)和基于重放場(chǎng)景的壓縮域體育視頻摘要;基于本體的壓縮域語(yǔ)義體育視頻摘要模型。在對(duì)現(xiàn)有方法分析的基礎(chǔ)上,獲得以下主要研究成果: 1、提出一種開(kāi)放的交互式壓縮域關(guān)鍵視頻對(duì)象選擇模型。引入交互計(jì)算模型將壓縮域關(guān)鍵視頻對(duì)象選擇模型擴(kuò)展為基于交互計(jì)算的壓縮域關(guān)鍵對(duì)象選擇模型。將壓縮域關(guān)鍵視頻對(duì)象選擇算法形式化為壓縮域關(guān)鍵視頻對(duì)象選擇模型,證明該模型滿(mǎn)足歸納法準(zhǔn)則;用緊湊和全面策略分別表示關(guān)鍵視頻對(duì)

4、象間內(nèi)容不相關(guān)性和關(guān)鍵視頻對(duì)象準(zhǔn)確表達(dá)視頻信息這兩種行為,將用戶(hù)選擇這些策略的過(guò)程形式化為交互式壓縮域關(guān)鍵視頻對(duì)象選擇模型,證明該交互式模型滿(mǎn)足余歸納法準(zhǔn)則。交互式壓縮域關(guān)鍵視頻對(duì)象選擇方法是一個(gè)開(kāi)放系統(tǒng),不僅可以根據(jù)不同的策略選取相應(yīng)的關(guān)鍵視頻對(duì)象,而且緊湊策略的失真率比[Kirn2002]的方法低0.8%,全面策略的失真率比[Kim2002]的方法低3.8%。 2、以攝像機(jī)運(yùn)動(dòng)參數(shù)為特征,提出一種開(kāi)放的交互式壓縮域關(guān)鍵幀選擇

5、模型?;贛估計(jì)進(jìn)行外點(diǎn)過(guò)濾,基于極線(xiàn)距離約束驗(yàn)證去除外點(diǎn)的正確性,并利用BFGS方法獲得攝 像機(jī)運(yùn)動(dòng)參數(shù)的最佳估計(jì)。并以攝像機(jī)運(yùn)動(dòng)參數(shù)為特征,提出基于最短路徑約束的最小化失真率方法和基于最小化失真率約束的最短路徑方法,這兩種方法分別對(duì)應(yīng)緊湊和全 面策略。將壓縮域關(guān)鍵幀選擇算法形式化為壓縮域關(guān)鍵幀選擇模型,證明該模型滿(mǎn)足歸納法準(zhǔn)則;將用戶(hù)選擇緊湊和全面策略的過(guò)程形式化為交互式壓縮域關(guān)鍵幀選擇模型,證明該交互式模型滿(mǎn)足余歸納法準(zhǔn)則。用

6、戶(hù)可以根據(jù)偏好選擇不同的策略,同時(shí),緊湊和全面策略的失真率分別比[Porter2003]的方法低8.5%和9.1%。因此交互式壓縮域關(guān)鍵幀選擇方法具有良好的開(kāi)放性。 3、提出一種有效的基于重放場(chǎng)景組織兩層壓縮域體育視頻摘要的方法。利用壓縮域的宏塊、運(yùn)動(dòng)矢量特征進(jìn)行重放場(chǎng)景檢測(cè),基于攝像機(jī)和顏色信息根據(jù)重放鏡頭檢測(cè)原精彩片段,從而組織體育視頻摘要。重放場(chǎng)景檢測(cè)的查全率為91.2%,查準(zhǔn)率為100%,而目重放場(chǎng)景檢測(cè)算法可以識(shí)別高速

7、攝像機(jī)產(chǎn)生的重放鏡頭,克服了[Koblal999]方法的不足。檢測(cè)原精彩片段的算法主要針對(duì)文[yasugi2001]中未考慮攝像機(jī)縮放運(yùn)動(dòng)進(jìn)行了改進(jìn)?;谥胤艌?chǎng)景提出一種新的兩層體育視頻摘要瀏覽模式,第一層為關(guān)鍵場(chǎng)景,給用戶(hù)提供了視頻內(nèi)容的概括:第二層為關(guān)鍵鏡頭,為動(dòng)態(tài)和靜態(tài)摘要瀏覽方式的結(jié)合。 4、提出一種基于本體的壓縮域語(yǔ)義體育視頻摘要模型。引入OWL本體描述語(yǔ)言對(duì)體育視頻本體進(jìn)行描述,并由此提出基于壓縮域的層次化視頻摘要策

8、略。在三級(jí)層次化摘要中,關(guān)鍵場(chǎng)景展現(xiàn)了體育視頻的全面語(yǔ)義信息,關(guān)鍵鏡頭展示了視頻中的重要?jiǎng)幼?,關(guān)鍵幀顯示了鏡頭的細(xì)節(jié)。因此三級(jí)層次化摘要能夠在不同的層次表示視頻的重要信息。進(jìn)一步,我們對(duì)體育視頻進(jìn)行語(yǔ)義建模,運(yùn)用Tableau算法進(jìn)行推理,基于視頻注釋信息生成語(yǔ)義體育視頻摘要。由于目前視頻摘要研究側(cè)重于基于低層語(yǔ)義特征,基于本體的體 育視頻摘要建立了推理機(jī)制,不失為語(yǔ)義體育視頻摘要的有益嘗試,同時(shí)與文[Zhu2003]相比,我們提出的

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論