大規(guī)模RDF圖數(shù)據(jù)的子圖匹配查詢研究.pdf_第1頁(yè)
已閱讀1頁(yè),還剩45頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、子圖匹配(Basic Subgraph Pattern Matching)是RDF圖數(shù)據(jù)管理中的一種基本查詢類型,又稱子圖同構(gòu)(Subgraph Isomorphism),是一個(gè)NP-Complete問題。隨著語義網(wǎng)的發(fā)展和開放鏈接數(shù)據(jù)運(yùn)動(dòng)的發(fā)展,越來越多的數(shù)據(jù)通過RDF格式發(fā)布出來。高時(shí)間復(fù)雜度和巨大的數(shù)據(jù)規(guī)模給RDF圖數(shù)據(jù)的管理帶來了巨大挑戰(zhàn)。目前的單機(jī)查詢算法由于受限與子圖匹配問題的特性,往往會(huì)引入大量的連接操作,效率較低;基于M

2、apReduce的分布式查詢方案受限于MapReduce的迭代機(jī)制,查詢效率很難提升。因此,如何高效地在大規(guī)模的RDF圖數(shù)據(jù)上解決子圖匹配問題,成為一個(gè)具有挑戰(zhàn)性的工作。
  本文提出了集中式和分布式兩種RDF圖數(shù)據(jù)查詢方案。在集中式查詢方案中,數(shù)據(jù)圖根據(jù)頂點(diǎn)度數(shù)的大小拆分成星狀的小規(guī)模子圖,并將這每個(gè)子圖編碼成一個(gè)二進(jìn)制串。將子圖匹配的部分操作轉(zhuǎn)換成二進(jìn)制位的“與”和“或”操作。使用該二進(jìn)制串來過濾出可能的子結(jié)果。然后將子結(jié)果拼

3、接成完整的查詢結(jié)果。該方案避免了大多數(shù)的連接操作,使得每次訪問索引獲得一條三元組信息優(yōu)化到每次訪問索引獲得一組三元組信息。這種查詢方案提高了每次查詢獲得的信息量,大大減少了連接操作數(shù)量。在分布式查詢方案中,將RDF圖中的每個(gè)頂點(diǎn)都視為可執(zhí)行計(jì)算的單元,將整個(gè)圖映射成可互相傳遞消息的頂點(diǎn)集。這種模型基于BSP計(jì)算模型設(shè)計(jì),充分利用了圖的特點(diǎn),使用消息傳遞的方式逐步完善查詢圖,逐一減少變量數(shù)量,最終得到查詢結(jié)果,避免了迭代的MapReduc

4、e計(jì)算模型在解決圖計(jì)算問題時(shí)存在的很多限制,查詢效率明顯提高。本文設(shè)計(jì)的實(shí)驗(yàn)從索引的空間代價(jià)和查詢響應(yīng)時(shí)間等方面對(duì)上述兩種方法做了評(píng)價(jià),集中式查詢方案在查詢響應(yīng)時(shí)間上優(yōu)于目前性能最好的通用RDF集中式查詢引擎RDF-3X和gStore,分布式查詢方案也較MapReduce框架下實(shí)現(xiàn)的查詢方案有較大的性能提升。
  綜上所述,本文針對(duì)RDF圖數(shù)據(jù)上的子圖匹配問題提出了單機(jī)集中式查詢和集群分布式查詢兩種查詢方案,在索引結(jié)構(gòu)、數(shù)據(jù)編碼、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論