政府類開放關(guān)聯(lián)數(shù)據(jù)集調(diào)查研究_第1頁
已閱讀1頁,還剩16頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、<p>  政府類開放關(guān)聯(lián)數(shù)據(jù)集調(diào)查研究</p><p>  摘 要:作為開放關(guān)聯(lián)數(shù)據(jù)云圖中重要的數(shù)據(jù)集合,政府開放關(guān)聯(lián)數(shù)據(jù)集擁有龐大的數(shù)據(jù)規(guī)模和發(fā)達的數(shù)據(jù)共享實踐,受到廣泛關(guān)注。文章對曼海姆關(guān)聯(lián)數(shù)據(jù)目錄中的284個政府類開放關(guān)聯(lián)數(shù)據(jù)集進行調(diào)查,從數(shù)據(jù)集的發(fā)布國家分布、主題分布、數(shù)據(jù)集格式、鏈出情況、鏈入情況、連接謂詞、詞表和開放協(xié)議等方面進行統(tǒng)計分析,發(fā)現(xiàn)政府類開放關(guān)聯(lián)數(shù)據(jù)集具有數(shù)據(jù)集國家分布較集中、

2、數(shù)據(jù)集主體涵蓋政府工作各個方面、數(shù)據(jù)集之間關(guān)聯(lián)關(guān)系緊密、質(zhì)量控制和版權(quán)保護較為嚴格等特點。 </p><p>  關(guān)鍵詞:政府;關(guān)聯(lián)數(shù)據(jù);開放關(guān)聯(lián)數(shù)據(jù)集 </p><p>  中圖分類號: G203 文獻標(biāo)識碼: A DOI:10.11968/tsyqb.1003-6938.2016083 </p><p>  Investigation and Research

3、on Government Linked Open Data Sets </p><p>  Abstract As an important part of the Linking Open Data (LOD) data sets, government data sets have a large volume data and advanced data sharing practice, and rec

4、eive a widespread attention. 284 government linked open data sets from Mannheim Linked Data Catalog are investigated, and aspects of distribution in countries, themes, formats, outgoing and incoming links, predicates for

5、 interlinking, used vocabularies and licensing information. Consequently, the paper summarizes the features of governme</p><p>  Key words government;linked data;open linked data sets </p><p>&l

6、t;b>  1 引言 </b></p><p>  2016年3月,中央發(fā)布的“十三五”規(guī)劃綱要中提出,要全面實施促進大數(shù)據(jù)發(fā)展行動,加快政府?dāng)?shù)據(jù)開放共享。《綱要》指出,要全面推進重點領(lǐng)域大數(shù)據(jù)高效采集、有效整合,深化政府?dāng)?shù)據(jù)和社會數(shù)據(jù)關(guān)聯(lián)分析、融合利用,提高宏觀調(diào)控、市場監(jiān)管、社會治理和公共服務(wù)精準(zhǔn)性和有效性。2015年9月,國務(wù)院印發(fā)《促進大數(shù)據(jù)發(fā)展行動綱要》,稱要在2018年底前建成國家政

7、府?dāng)?shù)據(jù)統(tǒng)一開放平臺,率先在氣象、環(huán)境、信用、交通、醫(yī)療、衛(wèi)生等20余個重要領(lǐng)域,實現(xiàn)公共數(shù)據(jù)資源合理適度向社會開放,政府?dāng)?shù)據(jù)開放作為國家大數(shù)據(jù)發(fā)展戰(zhàn)略中重要的組成部分被提上了建設(shè)日程。 </p><p>  不僅中國,各國政府都把開放數(shù)據(jù)提到了前所未有的高度。在2009年奧巴馬簽署開放政府的行政命令后,政府?dāng)?shù)據(jù)的開放已成為近年來世界性的趨勢。美國聯(lián)邦數(shù)據(jù)平臺Data.gov上線后,英國、加拿大、新西蘭等國也都建立

8、起了政府?dāng)?shù)據(jù)開放平臺,開放政府?dāng)?shù)據(jù)已成為政府的一項重要工作。在我國,2011年香港特別區(qū)政府開放政府?dāng)?shù)據(jù)網(wǎng)站“資料一線通(data.gov.hk)”;上海在2012年6月推出了中國大陸第一個數(shù)據(jù)開放平臺。之后,北京、武漢、無錫、佛山、南海等城市也都上線了自己的數(shù)據(jù)平臺。盡管如此,在我國開放政府?dāng)?shù)據(jù)過程中還存在各種問題,如開放數(shù)據(jù)總量偏低,可機讀性差,大多為靜態(tài)數(shù)據(jù),數(shù)據(jù)按承諾更新比例低,整體都未嚴格符合開放授權(quán)等。 </p>

9、<p>  從2006年Tim Berners-Lee提出通過關(guān)聯(lián)數(shù)據(jù)發(fā)展數(shù)據(jù)網(wǎng)絡(luò)(Data Web)后,國際互聯(lián)網(wǎng)協(xié)會(W3C)的關(guān)聯(lián)開放數(shù)據(jù)(Linking Open Data,LOD)運動正式啟動。近年來關(guān)聯(lián)數(shù)據(jù)引起了學(xué)者的廣泛關(guān)注,同時也在政府部門的開放數(shù)據(jù)領(lǐng)域展開了實踐探索。關(guān)聯(lián)數(shù)據(jù)的核心目的就是促進數(shù)據(jù)資源的共享和重用,以此增加數(shù)據(jù)資源的應(yīng)用價值。政府開放數(shù)據(jù)涵蓋各個領(lǐng)域的數(shù)據(jù)資源,包括醫(yī)療、交通、旅行和環(huán)境等

10、領(lǐng)域數(shù)據(jù)。關(guān)聯(lián)政府開放數(shù)據(jù)同時也促進領(lǐng)域資源之間的互聯(lián),即通過關(guān)聯(lián)數(shù)據(jù)技術(shù),將具有相關(guān)性的政府開放數(shù)據(jù)進行鏈接,實現(xiàn)數(shù)據(jù)資源之間的關(guān)聯(lián)發(fā)現(xiàn)。如美國倫斯勒理工學(xué)院(Rensselaer Polytechnic Institute,簡稱RPI)開發(fā)的Data-gov Wiki可以將data.gov中的數(shù)據(jù)集轉(zhuǎn)換為RDF格式,以關(guān)聯(lián)數(shù)據(jù)的形式重新呈現(xiàn)[1];英國政府發(fā)布的關(guān)聯(lián)數(shù)據(jù)主要包括統(tǒng)計數(shù)據(jù)[2]和地理空間數(shù)據(jù)[3]。 </p>

11、;<p>  從國際上相關(guān)研究上來看,Hendler等[4]和Shadbolt等[2]分別介紹了數(shù)據(jù)集“Semantic.data.gov”和“Data.gov.uk”的建設(shè)和發(fā)布情況:Shadbolt 和O'Hara[5]通過研究英國開放數(shù)據(jù)集的發(fā)展現(xiàn)狀,認為在關(guān)注政府領(lǐng)域開放關(guān)聯(lián)數(shù)據(jù)時,要關(guān)注質(zhì)量、消費動力問題,要跟蹤數(shù)據(jù)出處、保護公民隱私等;Galiotou等[6]介紹了希臘基于關(guān)聯(lián)數(shù)據(jù)技術(shù),應(yīng)用于希臘政府門

12、戶網(wǎng)站的政府開放關(guān)聯(lián)數(shù)據(jù)技術(shù)的案例;Janssen和Hoven[7]探討了在建設(shè)和利用開放關(guān)聯(lián)大數(shù)據(jù)(Big and Open Linked Data,BOLD)時需要關(guān)注透明度和隱私問題;Vert[8]分析了運用關(guān)聯(lián)數(shù)據(jù)解決開放政府?dāng)?shù)據(jù)處理的生命周期中所需要的數(shù)據(jù)發(fā)現(xiàn)、清洗、造型、出版等步驟,并以羅馬尼亞為例介紹LOGD在智慧城市中的應(yīng)用;Corradi等[9]以博洛尼亞為例,分析關(guān)聯(lián)數(shù)據(jù)在開放政府中的應(yīng)用;Yuan等[10]認為,通

13、過關(guān)聯(lián)數(shù)據(jù)技術(shù)發(fā)布的政府?dāng)?shù)據(jù)可以提高數(shù)據(jù)的透明度和重用度,并對中國智慧城市建設(shè)中使用的關(guān)聯(lián)政府?dāng)?shù)據(jù)進行了研究。   目前,國內(nèi)還沒有實現(xiàn)大規(guī)模的政府開放關(guān)</p><p>  本文通過對國際上政府類開放關(guān)聯(lián)數(shù)據(jù)集進行較為詳細的調(diào)查研究,重點關(guān)注不同國家和不同管理單位對于開放關(guān)聯(lián)數(shù)據(jù)集的應(yīng)用情況,希望對我國開放關(guān)聯(lián)政府?dāng)?shù)據(jù)集的研究和實踐起到一定的參考指導(dǎo)作用。 </p><p>  2 開

14、放關(guān)聯(lián)政府?dāng)?shù)據(jù)集統(tǒng)計分析 </p><p>  2.1 數(shù)據(jù)來源選擇 </p><p>  隨著開放關(guān)聯(lián)數(shù)據(jù)計劃(The Linking Open Data Project,簡稱 LOD)的發(fā)展,越來越多的數(shù)據(jù)提供者和網(wǎng)絡(luò)應(yīng)用開發(fā)者將各自的數(shù)據(jù)發(fā)布到網(wǎng)絡(luò)上,并與其它數(shù)據(jù)源關(guān)聯(lián)在一起,形成了一個巨大的數(shù)據(jù)網(wǎng)絡(luò)。筆者以德國曼海姆大學(xué)發(fā)布的關(guān)聯(lián)數(shù)據(jù)目錄(Mannheim Linked Data

15、Catalog)為主要調(diào)查對象,結(jié)合LOD云圖2014年發(fā)布成果進行檢索,檢索時間為2016年3月20日。檢索結(jié)果顯示,截止調(diào)查時間為止,在互聯(lián)網(wǎng)上發(fā)布的開放關(guān)聯(lián)數(shù)據(jù)集共有1484個,主要集中于政府、出版物、生命科學(xué)、用戶生成內(nèi)容、跨領(lǐng)域、媒體、地理、社交網(wǎng)絡(luò)等八大主題領(lǐng)域(見表1),與2014年8月LOD云圖發(fā)布的數(shù)據(jù)相對比,可以看到,關(guān)聯(lián)數(shù)據(jù)集數(shù)量增長了46.35%。其中,政府主題的數(shù)據(jù)集增長了55.19%。本次調(diào)查的樣本在曼海姆關(guān)

16、聯(lián)數(shù)據(jù)目錄中滿足標(biāo)簽信息為“government”的284個關(guān)聯(lián)數(shù)據(jù)集。 </p><p>  2.2 開放關(guān)聯(lián)政府?dāng)?shù)據(jù)集概況分析 </p><p>  2.2.1 數(shù)據(jù)集發(fā)布國家分布概況 </p><p>  從表2可知,284個數(shù)據(jù)集分布在20個國家或國際組織之間。其中,英國以153個占據(jù)首位,發(fā)布機構(gòu)有英國內(nèi)政部、英國統(tǒng)計局、Data.gov.uk團隊等, &

17、lt;/p><p>  注:檢索時間為2016年3月20日。 </p><p>  發(fā)布平臺有Opendatacommunities.org、data.gov.org等,數(shù)據(jù)集內(nèi)容包括地方政府財政、政府預(yù)算、居民住房和家庭情況、社會福利、復(fù)合剝奪指數(shù)、部門業(yè)務(wù)計劃以及地理數(shù)據(jù)等。歐盟提供有30個關(guān)聯(lián)開放政府?dāng)?shù)據(jù)集,發(fā)布機構(gòu)有歐盟統(tǒng)計局、歐盟議會、歐盟環(huán)境署、歐洲中央銀行等。美國提供有20個關(guān)聯(lián)

18、開放政府?dāng)?shù)據(jù)集,發(fā)布機構(gòu)為美國證券交易委員會、美國聯(lián)邦統(tǒng)計機構(gòu)、美國國會等。西班牙提供有15個,市政府、市統(tǒng)計局等為主要發(fā)布機構(gòu)。還有一些國際組織也紛紛發(fā)布了關(guān)聯(lián)開放政府?dāng)?shù)據(jù)集,如國際清算銀行、國際援助透明度倡議組織、國際糧食政策研究所、國際貨幣基金組織、經(jīng)濟合作與發(fā)展組織和世界銀行等。 </p><p>  三元組數(shù)量排名前20的數(shù)據(jù)集部分屬性信息 </p><p> ?。ㄒ姳?)中,前

19、五位有3個關(guān)聯(lián)開放政府?dāng)?shù)據(jù)集都是由美國data.gov發(fā)布的政府?dāng)?shù)據(jù),占到政府類數(shù)據(jù)集三元組總數(shù)的52.18%。 </p><p>  2.2.2 數(shù)據(jù)集主題分布 </p><p>  政府信息資源涉及到綜合政務(wù)、經(jīng)濟管理、交通運輸、信息產(chǎn)業(yè)、城市建設(shè)、科技教育等多個領(lǐng)域,在調(diào)查涉及的284個關(guān)聯(lián)開放政府?dāng)?shù)據(jù)集中,其主題分布在民政社區(qū)、政法監(jiān)察、綜合政務(wù)、經(jīng)濟建設(shè)等幾個方面(見表4)。其中

20、,93個(占總體32.75%)關(guān)聯(lián)開放政府?dāng)?shù)據(jù)集的主題為民政和社區(qū),內(nèi)容包括人口數(shù)據(jù)(如2001年西班牙人口普查數(shù)據(jù)“2001 Spanish Census to RDF”;英國國家統(tǒng)計局發(fā)布的2001年年中到2007年年中的人口數(shù)據(jù)集“EnAKTing Population Dataset”等)、社會福利(如由英國社區(qū)暨地方發(fā)展部進行的區(qū)域社會復(fù)合剝奪指數(shù)“Index of Multiple Deprivation,簡稱 IMD”系列

21、調(diào)查而生成的關(guān)聯(lián)數(shù)據(jù)集“English Index of Multiple Deprivation Ranking 2010”等)、民意調(diào)查(如歐洲標(biāo)準(zhǔn)調(diào)查數(shù)據(jù)集“Standard Eurobarometer”,提供歐洲社會科學(xué)研究中應(yīng)用最廣泛的數(shù)據(jù)來源)等。 </p><p>  在政法監(jiān)察類數(shù)據(jù)集中,有代表性的為英國國家檔案館發(fā)布的法律主題數(shù)據(jù)集“UK Legislation”、國際透明組織發(fā)布的包括腐敗感知

22、指數(shù)和數(shù)據(jù)來源的數(shù)據(jù)集“Transparency International Linked Data”、希臘警察局發(fā)布的犯罪事件數(shù)據(jù)集“Hellenic Police”等。 </p><p>  2.2.3 數(shù)據(jù)集格式分布 </p><p>  從曼海姆關(guān)聯(lián)數(shù)據(jù)目錄中提供的數(shù)據(jù)集格式可以看出,不同的數(shù)據(jù)集或采用單一的格式,或?qū)⒍喾N格式進行組合呈現(xiàn)。本次調(diào)查的284個關(guān)聯(lián)開放政府?dāng)?shù)據(jù)集共采用

23、了26種數(shù)據(jù)集格式,其中排名前15名的見圖1。可以看出,example/rdf+xml、api/sparql和meta/void是LOGD最常采用的格式,特別是example/rdf+xml,有85.21%的關(guān)聯(lián)開放政府?dāng)?shù)據(jù)集選擇了此格式,如為了便于數(shù)據(jù)集的管理和互操作,由英國社區(qū)以及地方政府管理部成立的開放關(guān)聯(lián)數(shù)據(jù)網(wǎng)站OpenDataCommunities.org中所提供的所有數(shù)據(jù)集格式都統(tǒng)一為example/rdf+xml格式。而與

24、醫(yī)學(xué)相關(guān)領(lǐng)域的開放關(guān)聯(lián)數(shù)據(jù)集進行對比,關(guān)聯(lián)開放政府   數(shù)據(jù)集更常采用meta/void、meta/rdf-schema來組織數(shù)據(jù)集格式[16]。 </p><p>  2.3 開放關(guān)聯(lián)數(shù)據(jù)集關(guān)聯(lián)應(yīng)用統(tǒng)計分析 </p><p>  關(guān)聯(lián)數(shù)據(jù)的提供者通過設(shè)置RDF連接,將單一的數(shù)據(jù)集鏈接到數(shù)據(jù)云圖中,使得數(shù)據(jù)集可以通過RDF鏈接更易被發(fā)現(xiàn)和利用。在2014年對LOD云圖中數(shù)據(jù)集的統(tǒng)計中發(fā)現(xiàn)

25、,一共有56.11%的數(shù)據(jù)集可以鏈接到至少一個數(shù)據(jù)集[17]。本次調(diào)查通過參考“鏈出”(outgoing links)和“鏈入”(incoming links)概念[16]來描述開放關(guān)聯(lián)數(shù)據(jù)集之前的關(guān)聯(lián)關(guān)系,根據(jù)在曼海姆關(guān)聯(lián)數(shù)據(jù)目錄中對284個關(guān)聯(lián)開放政府?dāng)?shù)據(jù)集進行調(diào)研,各個數(shù)據(jù)集的鏈出和鏈入情況詳細描述如下。 </p><p>  2.3.1 數(shù)據(jù)集鏈出統(tǒng)計 </p><p>  關(guān)聯(lián)數(shù)

26、據(jù)的云圖并不是強連接,并不是每一個數(shù)據(jù)集都存在于其他數(shù)據(jù)集的連接,即可能會出現(xiàn)數(shù)據(jù)集“孤島”[18]。在本次調(diào)查的284個關(guān)聯(lián)開放政府?dāng)?shù)據(jù)集中,有103個數(shù)據(jù)集沒有鏈接到其他數(shù)據(jù)集,有70個數(shù)據(jù)集僅與一個數(shù)據(jù)集建立連接關(guān)系,而鏈出數(shù)量最高的為數(shù)據(jù)集“Community R&D Information Service (CORDIS) (RKBExplorer)”,鏈出至20個數(shù)據(jù)集(見圖2)。其中鏈出數(shù)據(jù)集數(shù)量在5個以上的數(shù)據(jù)集

27、具體分布情況(見表5)。 </p><p>  2.3.2 數(shù)據(jù)集鏈入統(tǒng)計 </p><p>  在284個數(shù)據(jù)集中,有57個數(shù)據(jù)集被本領(lǐng)域的其他數(shù)據(jù)集鏈入(非本領(lǐng)域的數(shù)據(jù)集鏈入情況不統(tǒng)計),具體分布情況(見圖3)。 </p><p>  根據(jù)LOD2014報告顯示,在LOD2014年發(fā)布的關(guān)聯(lián)數(shù)據(jù)中,鏈出數(shù)量最高的為數(shù)據(jù)集“DBpedia”,其入度(indegre

28、e)達到了207。在本次調(diào)查涉及的政府信息相關(guān)的關(guān)聯(lián)數(shù)據(jù)中,數(shù)據(jù)集“reference.data.gov.uk”和“statistics.data.gov.uk”的鏈入數(shù)據(jù)集最多,占到了所有關(guān)聯(lián)開放政府?dāng)?shù)據(jù)集的29.23%,這兩個數(shù)據(jù)集分別提供英國有關(guān)人口、部門、行政區(qū)劃等信息,因此其鏈入的數(shù)據(jù)集多為在平臺opendatacommunities.org上發(fā)布的數(shù)據(jù)集。 </p><p>  而從LOD整體數(shù)據(jù)集來

29、看,被關(guān)聯(lián)開放政府?dāng)?shù)據(jù)集引用次數(shù)較多的數(shù)據(jù)集還有:跨領(lǐng)域數(shù)據(jù)集“dbpedia.org”,鏈入數(shù)據(jù)集71個;地理數(shù)據(jù)集“geonames.org”鏈入數(shù)據(jù)集33個;跨領(lǐng)域數(shù)據(jù)集“w3.org”鏈入數(shù)據(jù)集10個;跨領(lǐng)域數(shù)據(jù)集“l(fā)exvo.org”鏈入數(shù)據(jù)集9個??珙I(lǐng)域數(shù)據(jù)集提供標(biāo)準(zhǔn)被LOGD廣泛的使用,如由Wikipedia中抽取結(jié)構(gòu)化信息生成的Dbpedia數(shù)據(jù)集為包括聯(lián)合國糧農(nóng)組織關(guān)聯(lián)數(shù)據(jù)、國際貨幣基金組織關(guān)聯(lián)數(shù)據(jù)和Europeana

30、關(guān)聯(lián)開放數(shù)據(jù)等在內(nèi)的關(guān)聯(lián)開放政府?dāng)?shù)據(jù)集所引用。地理數(shù)據(jù)集geonames.org包含了超過800萬個地理名稱,涉及地理信息的關(guān)聯(lián)開放政府?dāng)?shù)據(jù)集,如世界銀行關(guān)聯(lián)數(shù)據(jù)集、OECD關(guān)聯(lián)數(shù)據(jù)集合、美國國會數(shù)據(jù)集、希臘政府消防數(shù)據(jù)集等被廣泛引用。 </p><p>  2.3.3 連接謂詞統(tǒng)計分析 </p><p>  關(guān)聯(lián)數(shù)據(jù)中的連接謂詞是RDF聲明語句中的屬性,定義了主體和客體之間的聯(lián)系,一般由

31、一個URI表示。謂詞的選擇能使得知識連接的RDF描述語義更加明確,用戶和網(wǎng)絡(luò)抓取程序也能容易獲取知識連接,并通過謂詞的詞間關(guān)系建立更多的知識鏈接[19]。政府類關(guān)聯(lián)開放數(shù)據(jù)集常用的連接謂詞(見圖4)。dct:publisher定義了責(zé)任者屬性,通過該屬性將不同責(zé)任者制作的數(shù)據(jù)集建立關(guān)聯(lián),形成基于同一內(nèi)容不同出版者之間的數(shù)據(jù)操作。dct:spatial定義了空間屬性,數(shù)據(jù)集之間可以通過該屬性將不同實體地理坐標(biāo)的數(shù)據(jù)集建立關(guān)聯(lián),形成互操作[

32、20]。owl:sameAs在LOD整體使用較多,表示“兩個URI引用實際上指向同一事物”,使用這一屬性能夠有效聚合指向同一事務(wù)對象的所有數(shù)據(jù)。 </p><p>  2.3.4 開放關(guān)聯(lián)數(shù)據(jù)集所用詞表統(tǒng)計 </p><p>  為了使應(yīng)用程序更好的理解關(guān)聯(lián)數(shù)據(jù),數(shù)據(jù)提供者使用詞表來盡可能的定義數(shù)據(jù)。在研究關(guān)聯(lián)數(shù)據(jù)的時候,一般認為,當(dāng)一個詞表被至少2個數(shù)據(jù)集使用,即認為是非專有詞表,反之則

33、為專有詞表。 </p><p>  從表7中可以看到,關(guān)聯(lián)開放政府?dāng)?shù)據(jù)集最常使用的詞表是作為描述語言的rdf和rdfs,都柏林核 </p><p>  心詞表dcterms使用也較為廣泛,有近半數(shù)的關(guān)聯(lián)開放政府?dāng)?shù)據(jù)集選擇了該詞表。除此之外,關(guān)聯(lián)開放政府?dāng)?shù)據(jù)集還較常使用詞表cube(The RDF Data Cube Vocabulary),這是一個用來發(fā)布規(guī)范的多維數(shù)據(jù)集語言,使用W3C

34、RDF標(biāo)準(zhǔn)構(gòu)建,主要用于表達各種統(tǒng)計數(shù)據(jù)[21],代表性數(shù)據(jù)集包括英國復(fù)合剝奪指數(shù)系列數(shù)據(jù)集等。FOAF(Friend of a Friend Vocabulary)也是一個得到廣泛應(yīng)用的本體,用于描述與人相關(guān)的資源,包括個人、組織和項目等,代表性數(shù)據(jù)集為2011年美國國會議員數(shù)據(jù)集“2011 US Congress People”、巴西政治家數(shù)據(jù)集“Brazilian Politicians”和西班牙政府?dāng)?shù)據(jù)集“Datos Abier

35、tos de Zaragoza”等。而在其他領(lǐng)域被廣泛使用的網(wǎng)絡(luò)本體語言owl詞表在關(guān)聯(lián)開放政府?dāng)?shù)據(jù)集使用率相對較低(僅為20.77%,相比于LOD 2014數(shù)據(jù)為36.49%[17],出版領(lǐng)域59.38%[22]、醫(yī)學(xué)領(lǐng)域71/85[16]),使用owl詞表的有聯(lián)合國糧農(nóng)組織的地緣政治本體、歐洲關(guān)聯(lián)數(shù)據(jù)本體中心等。 </p><p>  2.5 開放關(guān)聯(lián)數(shù)據(jù)集開放協(xié)議統(tǒng)計 </p><p&g

36、t;  在發(fā)布關(guān)聯(lián)開放政府?dāng)?shù)據(jù)集的時候,不同的機構(gòu)對數(shù)據(jù)集有不同等級和側(cè)重的開放許可協(xié)議。數(shù) </p><p>  據(jù)開放許可協(xié)議一般分為面向內(nèi)容和數(shù)據(jù)兩方面的協(xié)議。本次調(diào)查的284個關(guān)聯(lián)開放政府?dāng)?shù)據(jù)集中,聲明數(shù)據(jù)開放許可的情況(見表8)。 </p><p>  在284個關(guān)聯(lián)開放政府?dāng)?shù)據(jù)集中,有72.54%的數(shù)據(jù)集采用各種形式使用了許可信息,與2011年(LOD的207個開放數(shù)據(jù)集中有1

37、8個數(shù)據(jù)集公開了其協(xié)議信息[23])相比,越來越多的數(shù)據(jù)集發(fā)布者開始使用各種關(guān)聯(lián)數(shù)據(jù)訪問協(xié)議來保護利益相關(guān)者,為政府類的關(guān)聯(lián)數(shù)據(jù)能穩(wěn)定健康的發(fā)展和利用提供了法律保障,其中常用的協(xié)議主要包括知識共享(Creative Commons,CC)、公共數(shù)據(jù)協(xié)議(Open Government License,OGL)、開放數(shù)據(jù)共用(Open Data Commons,ODC)等針對關(guān)聯(lián)數(shù)據(jù)自身特點而制定的協(xié)議。英國由data.gov.uk發(fā)布的

38、系列數(shù)據(jù)集(如商業(yè)、環(huán)境、專利、交通等)采用了英國皇家版權(quán)協(xié)議。還有16個數(shù)據(jù)集使用借鑒“開放知識”[24]的定義,從不同維度規(guī)定了開放協(xié)議的基本權(quán)利。   而通過調(diào)查數(shù)據(jù)集發(fā)布者的信息可以得知,在284個關(guān)聯(lián)開放政府?dāng)?shù)據(jù)集中,由第三方發(fā)布的有83個,其中僅有2個沒有提供開放許可信息;由制作者發(fā)布的有26個,其中有3個沒有提供開放許可信息。而在175個沒有明確標(biāo)注發(fā)布者信息的數(shù)據(jù)集中,則有73個都無法提供明確的開放許可信息???lt;

39、/p><p>  3 開放關(guān)聯(lián)政府?dāng)?shù)據(jù)集的特點 </p><p>  根據(jù)上文中對關(guān)聯(lián)開放政府?dāng)?shù)據(jù)集的發(fā)布國家、主題分布、關(guān)聯(lián)應(yīng)用和開放協(xié)議等方面的統(tǒng)計,筆者總結(jié)出開放關(guān)聯(lián)政府?dāng)?shù)據(jù)集的特點,為我國建設(shè)開放關(guān)聯(lián)政府?dāng)?shù)據(jù)集提供啟示。 </p><p>  3.1 數(shù)據(jù)集國家分布呈現(xiàn)較為集中,主要發(fā)布國之間數(shù)據(jù)開放程度高 </p><p>  在201

40、5年英國開放基金會(OKF)公布的全球開放數(shù)據(jù)指數(shù)中,臺灣以78%政府?dāng)?shù)據(jù)開放成為全球第一,緊隨其后的是英國(76%)和丹麥(70%),而我國僅以18%的指數(shù)排在第93位,其中國家統(tǒng)計數(shù)據(jù)、全民普選數(shù)據(jù)等多個關(guān)鍵數(shù)據(jù)集均顯示并無法公開可訪問, “數(shù)據(jù)僅為公開、尚未達到開放的標(biāo)準(zhǔn)”[25]。而在由獨立學(xué)術(shù)組織世界正義項目(World Justice Project)發(fā)布的“全球開放政府指數(shù)”中,得分最高的前三個國家分別是瑞典、新西蘭、挪威

41、,我國以0.43分位列全部國家和地區(qū)中的第87名[26]。 </p><p>  通過關(guān)聯(lián)數(shù)據(jù)發(fā)布的政府?dāng)?shù)據(jù)利用本體技術(shù),整合政府運作過程中產(chǎn)生的各類術(shù)語體系和數(shù)據(jù)模型,使得數(shù)據(jù)通過語義關(guān)聯(lián),便于數(shù)據(jù)的開啟、鏈接和重用,能夠有效提高數(shù)據(jù)的透明度,規(guī)范數(shù)據(jù)發(fā)布行為,提升政府?dāng)?shù)據(jù)的利用效率[27]。從調(diào)查中可以看到,關(guān)聯(lián)數(shù)據(jù)集集中分布在英國、歐盟、美國等國家,另外,根據(jù)檢索數(shù)據(jù)集網(wǎng)站the datahub,還可以發(fā)現(xiàn)

42、捷克共和國、丹麥等國家的開放關(guān)聯(lián)數(shù)據(jù)集也已占據(jù)一定規(guī)模,這些國家通過關(guān)聯(lián)數(shù)據(jù)技術(shù)將已經(jīng)發(fā)布的開放數(shù)據(jù)進行規(guī)范和重用,數(shù)據(jù)集之間建立連接關(guān)系,大大提高了政府開放數(shù)據(jù)的利用程度。 </p><p>  3.2 數(shù)據(jù)集主題涵蓋政府工作各個方面,為構(gòu)建智慧政府和智慧城市提供數(shù)據(jù)支撐 </p><p>  開放關(guān)聯(lián)政府?dāng)?shù)據(jù)集的主題涵蓋了政治、經(jīng)濟、文化、民生在內(nèi)的多個方面,隨著智慧政府建設(shè)的發(fā)展,誕

43、生智慧的過程就是建立信息關(guān)聯(lián)的過程。關(guān)聯(lián)數(shù)據(jù)技術(shù)將相關(guān)數(shù)據(jù)通過W3C標(biāo)準(zhǔn)中的關(guān)聯(lián)數(shù)據(jù)技術(shù)實現(xiàn)語義連接,并發(fā)布到統(tǒng)一的數(shù)據(jù)平臺上供公眾使用。通過數(shù)據(jù)化的高度融合,以數(shù)據(jù)信息的融合為基礎(chǔ)實現(xiàn)數(shù)據(jù)之間的互聯(lián)互通。關(guān)聯(lián)政府開放數(shù)據(jù)能夠為智慧政府和智慧城市的構(gòu)建提供數(shù)據(jù)的組織和管理,促進數(shù)據(jù)資源的融合。 </p><p>  3.3 數(shù)據(jù)集之間關(guān)聯(lián)關(guān)系較為緊密,促進政府開放數(shù)據(jù)的關(guān)聯(lián)發(fā)現(xiàn) </p><p

44、>  政府目錄和數(shù)據(jù)集的數(shù)量繼續(xù)增加,最佳實踐通過數(shù)據(jù)發(fā)布者和使用者的連接數(shù)量來制定。2011年6月啟動的W3C政府關(guān)聯(lián)數(shù)據(jù)工作組具有提供標(biāo)準(zhǔn)和幫助世界各地政府發(fā)布他們的數(shù)據(jù)作為有效和有用的關(guān)聯(lián)數(shù)據(jù)的其他信息的使命,包括指導(dǎo)部門和對遺留數(shù)據(jù)的采集、詞匯選擇、URI構(gòu)建,版本控制、穩(wěn)定性、轉(zhuǎn)換機制[28]。政府類關(guān)聯(lián)數(shù)據(jù)集之間的相互關(guān)聯(lián)較為活躍,有63.7%的數(shù)據(jù)集與外部有鏈接,而對跨領(lǐng)域和地理領(lǐng)域的數(shù)據(jù)集關(guān)聯(lián)程度也較高。在搭建數(shù)據(jù)

45、集平臺時,可以借鑒其他領(lǐng)域數(shù)據(jù)集的關(guān)聯(lián)關(guān)系,提高數(shù)據(jù)集之間信息的互聯(lián)。 </p><p>  3.4 質(zhì)量控制和版權(quán)保護較為嚴格,規(guī)范利益相關(guān)者行為 </p><p>  從LOD2014可以看到,開放關(guān)聯(lián)政府?dāng)?shù)據(jù)集較多采用都柏林核心元數(shù)據(jù)組織信息,在關(guān)聯(lián)數(shù)據(jù)集格式上,也有85.21%的關(guān)聯(lián)開放政府?dāng)?shù)據(jù)集選擇了example/rdf+xml、meta/void和meta/rdf-schem

46、a等RDF標(biāo)準(zhǔn)數(shù)據(jù)發(fā)布格式,使得發(fā)布的關(guān)聯(lián)數(shù)據(jù)更為可靠,對于使用者也能更方便、靈活的重用政府?dāng)?shù)據(jù)。另外,開放關(guān)聯(lián)政府?dāng)?shù)據(jù)集的開放授權(quán)協(xié)議的使用也較為廣泛,這種嚴謹?shù)陌鏅?quán)保護政策能夠從數(shù)據(jù)發(fā)布的源頭規(guī)范人們涉及知識產(chǎn)權(quán)的行為,在滿足互聯(lián)網(wǎng)數(shù)據(jù)共享需求的同時,促進人們積極參與關(guān)聯(lián)數(shù)據(jù)運動,保障關(guān)聯(lián)數(shù)據(jù)運動不斷向前發(fā)展。 </p><p><b>  參考文獻: </b></p>&

47、lt;p>  [1] Tetherless World Constellation.The Data-gov Wiki[EB/OL].[2016-03-20].https://data-gov.tw.rpi.edu//wiki. </p><p>  [2] Shadbolt N,O'Hara K,Berners-Lee T,et al.Linked Open Government Data:Les

48、sons from Data.gov.uk[J].IEEE,Intelligent Systems,2012,27(3):16-24. </p><p>  [3] Clough P,Tang J,Hall M M,et al.Linking archival data to location: a case study at the UK National Archives[J].Aslib Proceedin

49、gs,2011,63(2/3):127-147. </p><p>  [4] Hendler J,Holm J,Musialek C,et al.US Government Linked Open Data:Semantic.data.gov[J].IEEE Intelligent Systems,2012,27(3):25-31. </p><p>  [5] Shadbolt N,O

50、'Hara K.Linked Data in Government[J].IEEE Internet Computing,2013,17(4):72-77. </p><p>  [6] Galiotou E,F(xiàn)ragkou P.Applying Linked Data Technologies to Greek Open Government Data:A Case Study[J].Procedia

51、- Social and Behavioral Sciences,2013(73):479-486.   [7] Janssen M,Jeroen V D H.Big and Open Linked Data(BOLD)in government:A challenge to transparency and privacy?[J]. Government Information Quarterly,2015,32(4):363-36

52、8. </p><p>  [8] Vert,S.Linked Open Government Data for Smart City Applications[C].Patrut,B,etc.SMART 2014 - SOCIAL MEDIA IN ACADEMIA:RESEARCH AND TEACHING.ITALY:MEDIMOND S R L,2015:401-406. </p><

53、p>  [9] Corradi A,F(xiàn)oschini L,Ianniello R.Linked data for Open Government:The case of Bologna[C].Computers and Communication.2014:1-7. </p><p>  [10] Yuan Y,Wu C,Ai H.Application Of Linked Open Government

54、Data:State Of The Art And Challenges[J].Theriogenology, 2005,63(2):283-299. </p><p>  [11] 吳?h,李占羽.基于關(guān)聯(lián)數(shù)據(jù)開放政府?dāng)?shù)據(jù)[J].電腦知識與技術(shù),2010,6(11):8688-8691. </p><p>  [12] 袁遠明,吳產(chǎn)樂,艾浩軍.關(guān)聯(lián)開放政府?dāng)?shù)據(jù)的研究與應(yīng)用進展[J].電信

55、科學(xué),2012,28(9):69-73. </p><p>  [13] 錢國富.基于關(guān)聯(lián)數(shù)據(jù)的政府?dāng)?shù)據(jù)發(fā)布[J].圖書情報工作,2012,56(5):123-127. </p><p>  [14] 吳?h,李占羽,李丹寧.關(guān)聯(lián)數(shù)據(jù)在公安情報研判系統(tǒng)的應(yīng)用[J].貴州科學(xué),2011,29(2):26-31. </p><p>  [15] 丁楠,王鈺,潘有能.基于

56、關(guān)聯(lián)數(shù)據(jù)的政府信息聚合研究[J].情報理論與實踐,2015,38(7):76-79. </p><p>  [16] 涂志芳,吳丹.醫(yī)學(xué)相關(guān)領(lǐng)域開放關(guān)聯(lián)數(shù)據(jù)集調(diào)查研究[J].圖書情報工作,2015,59(18):14-23. </p><p>  [17] State of the LOD Cloud[EB/OL].[2016-03-20].http://linkeddatacatalog

57、.dws.informatik.uni-mannheim.de/state/#toc4. </p><p>  [18] Rodriguez M A. A Graph Analysis of the Linked Data Cloud[EB/OL].[2016-04-30].http://arxiv.org/pdf/0903.0194vl.pdf. </p><p>  [19] 司徒俊峰

58、,曹樹金,謝莉.論基于關(guān)聯(lián)數(shù)據(jù)的知識鏈接構(gòu)建與應(yīng)用[J].圖書情報工作,2013,57(16):123-129. </p><p>  [20] Data Catalog Vocabulary(DCAT)[EB/OL].[2016-03-20].https://www.w3.org/TR/vocab-dcat/. </p><p>  [21] The RDF Data Cube Voca

59、bulary[EB/OL].[2016-03-20].https://www.w3.org/TR/vocab-data-cube/. </p><p>  [22] 賈君枝,寇蕾蕾.關(guān)聯(lián)數(shù)據(jù)云圖中出版類數(shù)據(jù)集特點分析[J].國家圖書館學(xué)刊,2016(1):59-68. </p><p>  [23] 張春景,劉煒,夏翠娟,等.關(guān)聯(lián)數(shù)據(jù)開放應(yīng)用協(xié)議[J].中國圖書館學(xué)報,2012(1):43

60、-48. </p><p>  [24] Open Definition 2.0 - Open Definition - Defining Open in Open Data, Open Content and Open Knowledge[EB/OL].[2016-03-20].http://opendefinition.org/od/2.0/en/. </p><p>  [25] P

61、lace overview | Global Open Data Index by Open Knowledge[EB/OL].[2016-03-20].http://index.okfn.org/place/. </p><p>  [26] World Justice Project.Open Government Index 2015 Report[EB/OL].[2016-03-20].http://wo

62、rldjusticeproject.org/sites/default/files/ogi_2015.pdf. </p><p>  [27] Li Ding,Vassilios Peristeras,Michael Hausenblas.Linked Open Government Data INTRODUCTION[J].Intelligent Systems,IEEE,2012,27(3):11-15. &

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論