金融大數(shù)據(jù)研究進(jìn)展的分析_關(guān)聯(lián)數(shù)據(jù)研究進(jìn)展概述
發(fā)布時間:2020-03-10 來源: 歷史回眸 點擊:
[摘要]首先介紹國內(nèi)外作者對關(guān)聯(lián)數(shù)據(jù)概念及其基本原則的研究現(xiàn)狀,分析關(guān)聯(lián)數(shù)據(jù)的發(fā)布方式和發(fā)布工具以及應(yīng)用研究情況,然后對關(guān)聯(lián)數(shù)據(jù)與語義網(wǎng)二者的關(guān)系進(jìn)行剖析,最后給出關(guān)聯(lián)數(shù)據(jù)研究在用戶接口問題、法律許可問題、評價問題、隱私問題方面面臨的一些挑戰(zhàn),認(rèn)為關(guān)聯(lián)數(shù)據(jù)將會使互聯(lián)網(wǎng)發(fā)生深刻的變革。
[關(guān)鍵詞]數(shù)據(jù)關(guān)聯(lián)數(shù)據(jù)數(shù)據(jù)網(wǎng)絡(luò)語義網(wǎng)
[分類號]G353
2007年5月W3C(World Wide Web Consortium)關(guān)聯(lián)開放數(shù)據(jù)項目正式起動,其目標(biāo)是號召人們將現(xiàn)有的數(shù)據(jù)公布成關(guān)聯(lián)數(shù)據(jù),并將不同數(shù)據(jù)互聯(lián)起來。關(guān)聯(lián)數(shù)據(jù)提出的目的是構(gòu)建一個計算機(jī)能理解的具有結(jié)構(gòu)化和富含語義的數(shù)據(jù)網(wǎng)絡(luò),而不僅僅是人能讀懂的文檔網(wǎng)絡(luò),以便于在此基礎(chǔ)之上構(gòu)建更智能的應(yīng)用。目前,關(guān)聯(lián)數(shù)據(jù)逐漸得到學(xué)術(shù)界、工業(yè)界、政府部門的廣泛關(guān)注。
1 關(guān)聯(lián)數(shù)據(jù)概念、基本原則
1.1 關(guān)聯(lián)數(shù)據(jù)的概念
關(guān)聯(lián)數(shù)據(jù)的概念為WWW(World Wide Web)的發(fā)明者,被譽(yù)為互聯(lián)網(wǎng)之父的Tim Berners-Lee于2006年在《關(guān)聯(lián)數(shù)據(jù)筆記》中首次提出,在該文中他分析了Web的發(fā)展與演變,提出了發(fā)展數(shù)據(jù)網(wǎng)絡(luò)的思想,而數(shù)據(jù)網(wǎng)絡(luò)的核心和關(guān)鍵則是關(guān)聯(lián)數(shù)據(jù)。2009年在TED大會上,他提出關(guān)聯(lián)數(shù)據(jù)就是一箱箱數(shù)據(jù),當(dāng)通過開放標(biāo)準(zhǔn)關(guān)聯(lián)在一起時,從中可以萌發(fā)出很多新事物和新應(yīng)用。有學(xué)者側(cè)重對語義的認(rèn)識,如白海燕認(rèn)為關(guān)聯(lián)數(shù)據(jù)是用來在語義網(wǎng)中使用URI和RDF發(fā)布、分享、連接各類資源,強(qiáng)調(diào)建立已有信息的語義標(biāo)注和實現(xiàn)數(shù)據(jù)之間的關(guān)聯(lián),具有框架簡潔、標(biāo)準(zhǔn)化、自助化、去中心化、低成本的特點,為構(gòu)建人機(jī)理解的數(shù)據(jù)網(wǎng)絡(luò),提供了根本性的保障,為實現(xiàn)語義網(wǎng)遠(yuǎn)景奠定了堅實的基礎(chǔ)。Boutin G也持同樣的觀點,認(rèn)為關(guān)聯(lián)數(shù)據(jù)是提供了關(guān)聯(lián)結(jié)構(gòu)化數(shù)據(jù)的新媒介,可以更好地讓機(jī)器讀取這些數(shù)據(jù)。還有一些學(xué)者則認(rèn)為關(guān)聯(lián)數(shù)據(jù)是一類實踐活動。維基百科的定義:關(guān)聯(lián)數(shù)據(jù)是一種推薦的最佳實踐,用來在語義網(wǎng)中使用URI和RDF發(fā)布、分享、連接各類數(shù)據(jù)、信息和知識。Christian Bizer也認(rèn)為關(guān)聯(lián)數(shù)據(jù)是利用網(wǎng)絡(luò)關(guān)聯(lián)不同類型數(shù)據(jù)的實踐。
1.2 關(guān)聯(lián)數(shù)據(jù)的基本原則
Berners-Lee提出的關(guān)聯(lián)數(shù)據(jù)遵循四個方面的基本原則,獲得了業(yè)界的廣泛認(rèn)同:①使用URI作為任何事物的標(biāo)識名稱;②使用HTTP URI讓任何人都可以訪問這些標(biāo)識名稱;③當(dāng)有人訪問某個標(biāo)識名稱時,提供有用的信息(采用RDF、SPARQL標(biāo)準(zhǔn));④盡可能提供相關(guān)的URI鏈接,以使人們可以發(fā)現(xiàn)更多的信息。IBMCSDL Web2.0開發(fā)人員張靜、馬春娥經(jīng)過分析也提出了構(gòu)建和實現(xiàn)關(guān)聯(lián)數(shù)據(jù)的三原則:①資源。發(fā)布一個領(lǐng)域的數(shù)據(jù)之前,要確定發(fā)布的資源是什么。只要你認(rèn)為是有意義的,有被引用必要的,都可以稱之為資源。②資源標(biāo)識。任何一個資源都是用HTFP URI來標(biāo)識。之所有要用HTYP URI來標(biāo)識,是希望數(shù)據(jù)能夠通過HTTP協(xié)議訪問,真正實現(xiàn)基于Web的訪問與互聯(lián)。③資源描述。資源可以有多種描述,如HTML、XML、RDF以及JPEG。文檔Web的文檔主要通過HTML格式來表示,數(shù)據(jù)Web的數(shù)據(jù)主要通過RDF格式來表示。RDF將一個資源描述成一組三元組(主語、謂語、賓語)。
2 關(guān)聯(lián)數(shù)據(jù)的總體進(jìn)展研究概述
2.1 關(guān)聯(lián)數(shù)據(jù)的發(fā)布研究
2.1.1 關(guān)聯(lián)數(shù)據(jù)的發(fā)布方式研究 關(guān)于如何發(fā)布關(guān)聯(lián)數(shù)據(jù)目前還沒有指南性的文檔,但已有許多不錯的參考資料,例如《如何在網(wǎng)絡(luò)上發(fā)布關(guān)聯(lián)數(shù)據(jù)》教程和白皮書《部署關(guān)聯(lián)數(shù)據(jù)》,該白皮書采用了OpenLinks Virtuoso軟件作為例子。除此之外,還有一些使用URI的推薦方法,比如W3C的工作草案《語義萬維網(wǎng)的“酷”URIs》(Cool URIs.for the Semantic Web)。關(guān)聯(lián)數(shù)據(jù)發(fā)布的關(guān)鍵之處在于積極地使數(shù)據(jù)單元之間的聯(lián)系具有一定的語義(屬性或關(guān)系,即三元組中連接主客體的“謂詞”),它利用URI進(jìn)行對象標(biāo)識,并通過HTTP協(xié)議進(jìn)行揭示和訪問。我國學(xué)者劉煒介紹了關(guān)聯(lián)數(shù)據(jù)URI的發(fā)布細(xì)節(jié):①URI中避免使用空白節(jié)點,避免具體化,盡可能不使用RDF的集和包;②采用內(nèi)容協(xié)商(Negotiation)、URI參引、CoolURI(也就是采用hash和303轉(zhuǎn)向方式指向資源);③鼓勵RDF中鏈接,可以用URI別名;④鼓勵本體/模式重用,遵循術(shù)語定義的最佳實踐;⑤在RDF描述中“必須包含”對該資源描述的內(nèi)容;⑥封裝非RDF的數(shù)據(jù)庫或API,使封閉世界的數(shù)據(jù)開放出來。
2.1.2 關(guān)聯(lián)數(shù)據(jù)的發(fā)布工具研究 實際上大量已存在的數(shù)據(jù)并不滿足關(guān)聯(lián)數(shù)據(jù)的原則,于是關(guān)聯(lián)數(shù)據(jù)的推動者開發(fā)了一系列實用工具,來協(xié)助完成傳統(tǒng)數(shù)據(jù)向關(guān)聯(lián)數(shù)據(jù)轉(zhuǎn)化。一般來說,有以下幾種關(guān)聯(lián)數(shù)據(jù)的發(fā)布工具:
實現(xiàn)關(guān)系型數(shù)據(jù)庫RDF轉(zhuǎn)化的工具。①D2R。D2R是其中一個非常流行的工具,它的作用是將關(guān)系型數(shù)據(jù)庫的數(shù)據(jù)轉(zhuǎn)換為虛擬的RDF數(shù)據(jù)進(jìn)行訪問。D2R主要包括D2R Server,D2RQ Engine以及D2RQ Mapping語言。D2RQ Engine并沒有將關(guān)系型數(shù)據(jù)庫發(fā)布成真實的RDF數(shù)據(jù),而是使用D2RQMapping文件將其映射成虛擬的RDF格式。一般來講,數(shù)據(jù)庫的數(shù)據(jù)規(guī)模都比較大,且內(nèi)容經(jīng)常發(fā)生變化,轉(zhuǎn)換為虛擬的RDF數(shù)據(jù)空間復(fù)雜度會更低,更新內(nèi)容更加容易,因此D2R的應(yīng)用更加廣泛。②Triplify。Triplify是一種小型的Web應(yīng)用插件,能將關(guān)系型數(shù)據(jù)庫發(fā)布成真實的RDF數(shù)據(jù)。基于重新映射HT.TP URI請求,Triplify可以分析查詢所返回的數(shù)據(jù),能將HTML DOM數(shù)據(jù)以RDF格式序列化輸出,從而揭示出關(guān)系數(shù)據(jù)庫中所保存數(shù)據(jù)的語義結(jié)構(gòu)。Triplify有利于中小型的Web應(yīng)用參與到語義網(wǎng)中來,因為不需要為建立和維護(hù)大規(guī)模的語義定義而付出大量的努力,支持開發(fā)人員拓展關(guān)聯(lián)數(shù)據(jù)在Web環(huán)境下的應(yīng)用。
直接生成RDF數(shù)據(jù)的工具。①Virtuoso Universal Server,該工具可以經(jīng)關(guān)聯(lián)數(shù)據(jù)界面或一個SPARQL端點將數(shù)據(jù)轉(zhuǎn)化為RDF數(shù)據(jù),且可直接存儲在Virtuoso;②SparqPlug,它能從網(wǎng)絡(luò)上的傳統(tǒng)HTML文本(不包括PDF數(shù)據(jù))直接抽取關(guān)聯(lián)數(shù)據(jù),能將HTML DOM數(shù)據(jù)以RDF格式序列化輸出,并允許用戶自定義SPARQL查詢。
其他發(fā)布RDF數(shù)據(jù)的工具。①Pubby。Pubby能拓展支持SPARQL訪問的RDF存儲功能,它將URI請求轉(zhuǎn)換成潛在RDF數(shù)據(jù)查詢語言SPARQ,還能提供簡單HTML瀏覽調(diào)用數(shù)據(jù)庫。既提供對關(guān)聯(lián)數(shù)據(jù)的查詢訪問,還能為兩種不同類型數(shù)據(jù)庫間訪問提供303轉(zhuǎn)向方式指向資源。②Talis platform L14j。 Talis是一款通過HTTP訪問,并提供RDF或關(guān)聯(lián)數(shù)據(jù)存儲的軟件服務(wù)平臺。訪問權(quán)限允許的話,每個Talis平臺存儲的內(nèi)容都可以通過一個SPARQL端點和一系列符合關(guān)聯(lián)數(shù)據(jù)原則的REST API訪問。
2.2 關(guān)聯(lián)數(shù)據(jù)的應(yīng)用研究
自2006年以來,關(guān)聯(lián)數(shù)據(jù)得到了廣泛的認(rèn)同和快速的發(fā)展,至2009年7月RDF三元組已超過47億個,涉及到網(wǎng)絡(luò)通用本體、大型傳媒、商業(yè)企業(yè)、政府部門、圖書館、學(xué)術(shù)出版、搜索引擎等眾多領(lǐng)域。隨著大量的關(guān)聯(lián)數(shù)據(jù)在網(wǎng)絡(luò)上發(fā)布,越來越多的組織和個人開始加強(qiáng)對關(guān)聯(lián)數(shù)據(jù)的研究和應(yīng)用。Michael Hausenblas將關(guān)聯(lián)數(shù)據(jù)的應(yīng)用分成四大類:①內(nèi)容再利用,如市場研究工具BBC’s Music Beta;②語義標(biāo)簽,如Faviki、Revyu;③綜合提問應(yīng)答系統(tǒng),如DBpedia mobile、se-mantic CrunchBase Twitter Bot;④事件數(shù)據(jù)管理系統(tǒng),如OpenLink’s Calendar等。國內(nèi)已有學(xué)者開始研究關(guān)聯(lián)數(shù)據(jù)的應(yīng)用,如李亞婷、曹潔對Web環(huán)境下關(guān)聯(lián)數(shù)據(jù)的應(yīng)用進(jìn)行了分析,認(rèn)為關(guān)聯(lián)數(shù)據(jù)的應(yīng)用主要有兩方面:語義標(biāo)簽和Web資源集成。黃永文則對關(guān)聯(lián)數(shù)據(jù)在圖書館中的應(yīng)用進(jìn)行了詳細(xì)的闡述,如提出利用關(guān)聯(lián)數(shù)據(jù)擴(kuò)展資源發(fā)現(xiàn)服務(wù)、在學(xué)術(shù)研究和學(xué)術(shù)交流中發(fā)揮作用以及實現(xiàn)圖書館與教學(xué)系統(tǒng)之間的集成等。關(guān)聯(lián)數(shù)據(jù)的應(yīng)用研究主要集中在多媒體(如BBC)、文獻(xiàn)出版物(如DBCP、SWC)、生命科學(xué)(如Uniport、Pubmed)、地理科學(xué)(如Geohames)等領(lǐng)域,其中地理和生命科學(xué)應(yīng)用領(lǐng)域相對廣泛。應(yīng)用案例分析:如英國廣播公司BBC擁有每天1 000―1 500檔各類節(jié)目,這些節(jié)目基本上都是利用獨立的內(nèi)容管理系統(tǒng),要揭示所有節(jié)目及相關(guān)內(nèi)容的內(nèi)在聯(lián)系,是一件巨大的難題,解決的成本過于高昂。BBC采用MusicBrainz做為受控詞表、基于圖的屬性相似度比較等多種形式,實現(xiàn)了與DBpedia映射性鏈接,把不在同一存儲庫中的同一主題內(nèi)容聯(lián)系起來,從而擴(kuò)大了開放的銜接,增添了來自其他LOD云圖中數(shù)據(jù)。同時允許用戶發(fā)現(xiàn)、關(guān)聯(lián)并利用BBC關(guān)聯(lián)數(shù)據(jù),通過HTTP URI機(jī)制直接獲取,BBC網(wǎng)站和數(shù)據(jù)的可用性大大增強(qiáng),用戶體驗得到巨大提升。
2.3 關(guān)聯(lián)數(shù)據(jù)與語義網(wǎng)的研究
目前Web上存在著豐富的知識和信息,但由于其內(nèi)容組結(jié)構(gòu)松散,數(shù)據(jù)源之間存在異構(gòu)性,人們?nèi)狈τ行Х椒ɡ盟鼈,可見?dāng)前建立在標(biāo)準(zhǔn)化語言上的Web并不具備良好的語義表示能力,給基于Web的知識級信息集成和交換帶來了困難。為了擴(kuò)展萬維網(wǎng)的能力,萬維網(wǎng)聯(lián)盟的Tim Berners-Lee在1998年提出了“語義網(wǎng)”概念,它的核心是:通過給萬維網(wǎng)上的文檔(如HTML)添加能夠被計算機(jī)所理解的語義,從而使整個互聯(lián)網(wǎng)成為一個通用的信息交換媒介。
語義網(wǎng)的前景已有許多學(xué)者從不同角度進(jìn)行了預(yù)測或解釋,盡管存在這種多樣性解釋,建立機(jī)器可讀數(shù)據(jù)的目標(biāo)是不變的。據(jù)Berners Lee 描述:把數(shù)據(jù)以一種機(jī)器可自然理解的格式發(fā)布在網(wǎng)上(如利用科學(xué)家開發(fā)的一系列元數(shù)據(jù)描述語言(如RDF/RDFS)和本體描述語言(OWL等),或者把數(shù)據(jù)轉(zhuǎn)化為這種格式,就初步實現(xiàn)了所謂的語義網(wǎng)絡(luò)――一種能為機(jī)器直接或間接讀取數(shù)據(jù)的網(wǎng)絡(luò)。當(dāng)大量存在本體和元數(shù)據(jù)時,讓人聯(lián)想到“2E聯(lián)網(wǎng)就是一個大數(shù)據(jù)庫”,這些數(shù)據(jù)資源本身就成為了人類知識的巨大資源。這種以數(shù)據(jù)資源為基本組成單位的Web,其資源(數(shù)據(jù))都標(biāo)注有元數(shù)據(jù)描述,從而能夠進(jìn)行語義查詢及數(shù)據(jù)整合,提供了互聯(lián)網(wǎng)上實現(xiàn)語義互操作的技術(shù)平臺,使計算機(jī)能夠為人類完成繁瑣的知識發(fā)現(xiàn)、獲取和處理任務(wù)。所謂知識發(fā)現(xiàn),就是從數(shù)據(jù)集中識別出有效的、新穎的、潛在有用的及最終可理解模式的過程。知識發(fā)現(xiàn)的目的是向使用者屏蔽原始數(shù)據(jù)的繁瑣細(xì)節(jié),從原始數(shù)據(jù)中提煉出有意義的、簡潔的知識,直接向使用者報告。
關(guān)聯(lián)數(shù)據(jù)提供了關(guān)聯(lián)結(jié)構(gòu)化數(shù)據(jù)的新媒介,可以讓機(jī)器更好地讀取這些數(shù)據(jù)。但是,關(guān)聯(lián)數(shù)據(jù)本身不會給信息增加任何語義含義,而是更好地攜帶語義數(shù)據(jù),供用戶訪問。所以,關(guān)聯(lián)數(shù)據(jù)雖然本身并不具備語義特征,但它可以在數(shù)據(jù)層面建立關(guān)聯(lián),為真正的語義網(wǎng)鋪平道路。兩者的關(guān)系如圖1所示:
語義萬維網(wǎng)最好被理解為一種愿景或者目標(biāo),希望機(jī)器代理可以使用經(jīng)過富語義標(biāo)注的數(shù)據(jù)來創(chuàng)建鏈接,找到信息或者自動地在背后替人做事。嚴(yán)格地講,在語境信息的Web訪問和語義萬維網(wǎng)的長期愿景尚無著落的前提下,關(guān)聯(lián)數(shù)據(jù)提供了一種可行的最佳方案。當(dāng)越來越多的個體和組織發(fā)布關(guān)聯(lián)數(shù)據(jù),構(gòu)造數(shù)據(jù)網(wǎng)絡(luò)時,分布式、異構(gòu)數(shù)據(jù)源的數(shù)據(jù)集成和可重復(fù)使用的門檻將逐漸降低。假以時日,以關(guān)聯(lián)數(shù)據(jù)為基礎(chǔ),一些復(fù)雜的提議如智能化利用等語義萬維網(wǎng)愿景有可能實現(xiàn)。
2.4關(guān)聯(lián)數(shù)據(jù)挑戰(zhàn)性問題研究
2.4.1 關(guān)聯(lián)數(shù)據(jù)的用戶接口問題研究 對用戶而言,關(guān)聯(lián)數(shù)據(jù)的最大優(yōu)勢在于提供一個整合廣泛的、分散的、不同類型的數(shù)據(jù)資源接口,而現(xiàn)實中許多Web應(yīng)用通過Web API提供自己的數(shù)據(jù),如eBay,Amazon,Ya.hoo,Google。關(guān)聯(lián)數(shù)據(jù)與Web2.0 API的區(qū)別見表1。
雖然,從表1可以看出關(guān)聯(lián)數(shù)據(jù)的瀏覽或檢索很好地顯示了關(guān)聯(lián)數(shù)據(jù)的應(yīng)用發(fā)展趨勢,但是有時候,用戶得到的整合數(shù)據(jù)并不是自己想要的結(jié)果,這給關(guān)聯(lián)數(shù)據(jù)的應(yīng)用接口帶來不少挑戰(zhàn)――它必須以人為中心,才能有長久的生命力。如超文本瀏覽器可以保證以文件為中心的信息實體的前進(jìn)與后退,那么關(guān)聯(lián)數(shù)據(jù)瀏覽器也應(yīng)該在瀏覽時保證實體的前進(jìn)與后退,那就需要提供一個有效的機(jī)制來添加和移除相應(yīng)的數(shù)據(jù)資源,而對于海量的網(wǎng)頁數(shù)據(jù),用戶接口的實現(xiàn)是一個極具挑戰(zhàn)的問題。
2.4.2 關(guān)聯(lián)數(shù)據(jù)的法律許可問題研究 在數(shù)據(jù)網(wǎng)絡(luò)中,為鼓勵更好的數(shù)據(jù)提供者參與并且保證消費者能夠規(guī)劃地使用數(shù)據(jù),一些發(fā)布與利用關(guān)聯(lián)數(shù)據(jù)的框架協(xié)議是必不可少的。目前,有三種與關(guān)聯(lián)數(shù)據(jù)開放有關(guān)的協(xié)議,即開放數(shù)據(jù)共用、關(guān)聯(lián)協(xié)議和“創(chuàng)作公用”Creative Commons(CC)。開放數(shù)據(jù)共用是一種開放數(shù)據(jù)的知識產(chǎn)權(quán)聲明,用以規(guī)范、約束、明確數(shù)據(jù)擁有者、發(fā)布者、使用者在獲取、傳播、利用、再生產(chǎn)數(shù)據(jù)時的權(quán)利和義務(wù)。關(guān)聯(lián)協(xié)議是Talis公司發(fā)布的一種協(xié)議,目的是直接支持公共領(lǐng)域關(guān)聯(lián)數(shù)據(jù)的發(fā)布和再利用,數(shù)據(jù)提供者和用戶都可以無償使用Talis的數(shù)據(jù)服務(wù)。CC是一種公共領(lǐng)域協(xié)議,可以使作者或者版權(quán)擁有者將他們的作品貢獻(xiàn)到公共領(lǐng)域。研究者如何根據(jù)這些協(xié)議取得法律許可,在現(xiàn)有用戶界面上整合再利用數(shù)據(jù),需要進(jìn)行更深一步研究。
2.4.3 關(guān)聯(lián)數(shù)據(jù)的評價問題研究 應(yīng)用關(guān)聯(lián)數(shù)據(jù)需要考慮的問題是,如何確保數(shù)據(jù)是用戶最需要的或是最合適的,因此需要合理的對關(guān)聯(lián)數(shù)據(jù)進(jìn)行評價,從而 使用戶能快速地從大量數(shù)據(jù)中獲取完整、可靠、有效的信息。但是,當(dāng)前的語義網(wǎng)關(guān)聯(lián)數(shù)據(jù)檢索方法(如標(biāo)準(zhǔn)的W3C本體查詢語言SPARQL)并不提供評價方法,而將常用的信息檢索中的評價方法,如PageRank算法、HITS、VSM等,直接應(yīng)用到語義網(wǎng)中并不合適,因為萬維網(wǎng)網(wǎng)頁之間的鏈接具有相同的含義(即超鏈接),而在語義網(wǎng)中關(guān)聯(lián)數(shù)據(jù)具有異構(gòu)的語義,并且傳統(tǒng)的搜索技術(shù)通常是查找包含查詢關(guān)鍵字的網(wǎng)頁,卻忽略數(shù)據(jù)間細(xì)粒度的語義關(guān)聯(lián)關(guān)系。Bizer和Cyganiak提出了以不同的內(nèi)容、上下文關(guān)系和評級為基礎(chǔ)的啟發(fā)性評價方法,但是該方法還需進(jìn)一步優(yōu)化,以適應(yīng)數(shù)據(jù)網(wǎng)絡(luò)的快速發(fā)展。一些相對成熟的技術(shù)如WIQA Ea]和網(wǎng)頁推理也有助于對關(guān)聯(lián)數(shù)據(jù)的查詢結(jié)果進(jìn)行測評。
2.4.4 關(guān)聯(lián)數(shù)據(jù)利用中的隱私問題研究 關(guān)聯(lián)數(shù)據(jù)的最終目的是把互聯(lián)網(wǎng)當(dāng)成一個全球數(shù)據(jù)庫加以利用,這個愿景的實現(xiàn)將給許多領(lǐng)域帶來好處,同時也會帶來一定的負(fù)面影響。一個可能的問題就是整合不同來源的數(shù)據(jù)可能侵犯了他人的隱私,在關(guān)聯(lián)數(shù)據(jù)領(lǐng)域保護(hù)隱私需要技術(shù)手段和法律方面的綜合考量。Weitzner在這方面展開了研究,在最近的TransparentAccountable Data Mining Initiative(TAMI)項目有關(guān)“信息責(zé)任”中就有所論述。
3 結(jié)語
關(guān)聯(lián)數(shù)據(jù)是值得關(guān)注的新概念,早期研究主要集中在關(guān)聯(lián)數(shù)據(jù)的發(fā)布和瀏覽方面,以解決將不同格式的數(shù)據(jù)發(fā)布成關(guān)聯(lián)數(shù)據(jù)的問題。隨著網(wǎng)絡(luò)上關(guān)聯(lián)數(shù)據(jù)的不斷增多,關(guān)于關(guān)聯(lián)數(shù)據(jù)的應(yīng)用研究將成為其重點研究內(nèi)容?偟恼f來,關(guān)聯(lián)數(shù)據(jù)的研究與實踐在國內(nèi)外已取得了一定的成就,其相關(guān)的理論、軟件和技術(shù)日漸成熟。筆者相信,隨著研究的深入、技術(shù)的發(fā)展、研究主體的擴(kuò)展,關(guān)聯(lián)數(shù)據(jù)就像傳統(tǒng)Web所帶來的巨大變革一樣,關(guān)聯(lián)數(shù)據(jù)也給Web數(shù)據(jù)的獲取與應(yīng)用帶來新的機(jī)遇,它將使互聯(lián)網(wǎng)發(fā)生深刻的變革。
參考文獻(xiàn):
[1]Berners-Lee T.Linked data.[2010―09―26].http://www.省略/Designlssues/LinkedData.htm.1.
[2]白海燕.基于關(guān)聯(lián)數(shù)據(jù)技術(shù)的信息組織深度序化研究.[2010―09―26].http://www.省略/p-93289488.html.
[3]Boutin G.Tying Web 3.0,fhe semantic Web and linked data together.[2010一09―26].http://www.readw6teweb.corn/archives/understanding the new web era web 30 linked data 8.php.
[4]Bizer c.The Web of linked data.[2010―09―26].http://www.wiwiss.fu―berlin.de/en/institute/pwo/bizer/research/publications/Bizer-WebDB-WebOfLinkedData-Talk.pdf.
[5]張靜,馬春娥.如何利用D2R發(fā)布linked data.[2010―09―26].http://www.省略/developerworks/cn/web/1003―zhangiing―d2r/.
[6]Health T,Hausouase M,Bizer c.How t0 publish linked data 0nthe web.[2010―09―26].http://videolectures.neL/iswc08-h(huán)eath_hpldw/.
[7]OpenLink software.Deploying linked data.[2010―09―26].http://virtuoso.省略/white-papers/.
[8]W3C.Cool URIs for the semantic web.[2010一09―26].http://www.省略/TR/cooluris/.
[9]劉煒.關(guān)聯(lián)數(shù)據(jù)及近兩年來的應(yīng)用進(jìn)展.[2010一09―26].http://www.省略/.
[10]Bizer c,Cyganiak R.D2R server publishing relational databaseson the semantic Web.[2010-09-26].http://www4.wiwiss.fu-berlin.de/bizer/d2r―server/resources/d2r―server―slides―www2006.pdf.
[1]]Auer.Triplify:Light―Wei曲t linked data publication from relationaldatabases.[2010一09―26].省略rmatik.unl’-leipzig.de/-auer/publication/triplify.pdf.
[12]Coetzee P,Heath T,Motta E.SparqPlug:Generating linked datafrom legacy Html,Sparql and the DOM.[2010-09-26].http://events.省略/ldow2008/papers/05―coetzee―heath―sparq―plug.pdL
[13]Cyganiak B.Pubby―a linked data frontend for Sparql endpoints.[2010-09-26].http://www4.wiwiss.fu-berlin.de/pubby/.
[14]Talis platform.[2010一09―26].http://www.talis.corn/platform/.
[15]Hausenblas M.Linked data applications.[2010―09―26].http://linkeddata.deri.ie/resources.
[16]李亞婷,曹潔.Web環(huán)境下關(guān)聯(lián)數(shù)據(jù)的應(yīng)用.情報理論與實踐,2010(11):122―125.
[17]黃永文.關(guān)聯(lián)數(shù)據(jù)在圖書館中的應(yīng)用研究綜述.現(xiàn)代圖書情報技術(shù),2010(5):1―7.
[18]田稷.語義Web與網(wǎng)絡(luò)信息和知識的表達(dá).情報雜志,2003(6):43―44.
[19]Berners-Lee T.What the semanti’c Web call represent.[2010―lO―10].http://www.省略/Designlssues/RDFnot.html.[20]Berners-Lee.Weaving the Web:The past,present and futut~0f theWodd Wide Web by its inventor.London:Texere Publishing,2000:191.
[21]黃田青.關(guān)聯(lián)數(shù)據(jù)語義萬維網(wǎng)的新坐標(biāo).[2010一09―26].http://www.省略/.
[22]Christian B,Heath T,Berners-Lee T.Linked data-the story so far.Intemational J0umal 0n Semantic Web&Information Systems.2009,5(3):1―22.
[23]Silk-a link discovery framework for the Web of data.[2010―1O―1O].http://www4.wiwiss.fu-berHn.de/bizer/silk/.
[24]Christian B,Cyganiak R.Quality-driven information filtering usingthe WIQA policy framework.Journal 0f Web Semantics,2009,7(1):1―10.
[25]weitzner D.Beyond secrecy:New privacy protection strategies foropen information spaces.IEEE Internet Computing,2007,ll(5):94―106.
相關(guān)熱詞搜索:研究進(jìn)展 關(guān)聯(lián) 概述 關(guān)聯(lián)數(shù)據(jù)研究進(jìn)展概述 國內(nèi)關(guān)聯(lián)數(shù)據(jù)研究進(jìn)展 關(guān)聯(lián)數(shù)據(jù)研究與應(yīng)用進(jìn)展
熱點文章閱讀