东方亚洲欧a∨人在线观看|欧美亚洲日韩在线播放|日韩欧美精品一区|久久97AV综合

        家庭規(guī)則的建立【論知識(shí)鏈接的建立規(guī)則】

        發(fā)布時(shí)間:2020-03-07 來(lái)源: 短文摘抄 點(diǎn)擊:

          摘要 把信息單元視為文獻(xiàn)單元和知識(shí)元之間的橋梁和紐帶,以文獻(xiàn)單元間的參考文獻(xiàn)鏈接和知識(shí)元名(或與知識(shí)元相關(guān)的文字)到知識(shí)元的知識(shí)元鏈接為研究對(duì)象,重點(diǎn)分析這兩種鏈接的建立過(guò)程、建立規(guī)則以及技術(shù)難點(diǎn)。認(rèn)為從理論上研究知識(shí)鏈接的建立規(guī)則對(duì)知識(shí)鏈接系統(tǒng)和知識(shí)服務(wù)系統(tǒng)的開(kāi)發(fā)大有裨益。
          關(guān)鍵詞 知識(shí)鏈接 參考文獻(xiàn)鏈接 知識(shí)元鏈接 鏈接規(guī)則
          分類(lèi)號(hào) G356
          
          所謂鏈接是指某一個(gè)對(duì)象A鏈接到另一個(gè)對(duì)象B。對(duì)象A和B之間的鏈接意味著它們之間存在著某種關(guān)系或關(guān)聯(lián)。為便于表述,本文把提供鏈接的對(duì)象稱(chēng)為鏈接源,將被鏈接的對(duì)象稱(chēng)為鏈接對(duì)象。鏈接的建立需要鏈接系統(tǒng)的支持。所謂鏈接系統(tǒng),就是一種根據(jù)某種規(guī)則自動(dòng)地在鏈接源和鏈接對(duì)象之間建立正確鏈接的程序或應(yīng)用軟件。鏈接的建立有助于用戶(hù)理解鏈接源或者引導(dǎo)用戶(hù)閱讀與鏈接源相關(guān)的內(nèi)容。本文所要討論的就是鏈接系統(tǒng)在建立鏈接時(shí)所依賴(lài)或依據(jù)的關(guān)聯(lián)規(guī)則。從理論上講,研究鏈接的建立規(guī)則和相關(guān)標(biāo)準(zhǔn)可以促進(jìn)知識(shí)鏈接系統(tǒng)和知識(shí)服務(wù)系統(tǒng)的深入研究,為開(kāi)發(fā)知識(shí)服務(wù)系統(tǒng)、制定開(kāi)放的支持知識(shí)鏈接的電子文獻(xiàn)(文檔)標(biāo)準(zhǔn)及其閱讀軟件提供建設(shè)性思路。
          
          1知識(shí)單元的演變與知識(shí)鏈接
          
          知識(shí)單元的發(fā)展經(jīng)歷了從文獻(xiàn)知識(shí)單元(以下簡(jiǎn)稱(chēng)為文獻(xiàn)單元)到信息知識(shí)單元(以下簡(jiǎn)稱(chēng)為信息單元)繼而到知識(shí)單元(知識(shí)的內(nèi)容單元,以下簡(jiǎn)稱(chēng)為知識(shí)元)的演變過(guò)程。文獻(xiàn)單元指以知識(shí)的載體――文獻(xiàn)作為知識(shí)管理的基本處理單元;信息單元是指以文獻(xiàn)知識(shí)的某些屬性特征(包括文獻(xiàn)的外形特征信息和內(nèi)容特征信息)作為知識(shí)管理的基本單元;知識(shí)元是指在知識(shí)管理中用來(lái)處理知識(shí)的最小的、不可分隔的、獨(dú)立的基本單元,是指文獻(xiàn)中相對(duì)獨(dú)立的、表征知識(shí)點(diǎn)的一個(gè)元素,它可以是一段文字、一幅圖表、一個(gè)公式、一章或一節(jié)、一段動(dòng)畫(huà)、一個(gè)程序等,也往往直接指知識(shí)產(chǎn)品(圖書(shū)、論文、專(zhuān)利等)中的概念、論點(diǎn)(觀點(diǎn))、論據(jù)(數(shù)據(jù)、資料)、論證(方法、模型)、結(jié)論等知識(shí)核心和知識(shí)創(chuàng)新點(diǎn)。知識(shí)單元之間并不是獨(dú)立的,而是存在各種復(fù)雜的關(guān)系,基于這些關(guān)系可以在不同的知識(shí)單元之間建立鏈接。
          
          1,1文獻(xiàn)單元
          文獻(xiàn)單元之問(wèn)的關(guān)系主要是指文獻(xiàn)單元之間的引用和被引用的關(guān)系。用戶(hù)點(diǎn)擊文獻(xiàn)后參考文獻(xiàn)鏈接就可以獲取該參考文獻(xiàn)對(duì)應(yīng)的全文、文摘等。這種鏈接是最常見(jiàn)的也是使用最多的知識(shí)鏈接,更多的時(shí)候被稱(chēng)為參考文獻(xiàn)鏈接。鏈接源是來(lái)源文獻(xiàn),鏈接對(duì)象是該參考文獻(xiàn)對(duì)應(yīng)的全文或文摘或相關(guān)服務(wù)。參考文獻(xiàn)鏈接既可以讓用戶(hù)快速而直接地獲取文獻(xiàn),同時(shí)也可以讓用戶(hù)去了解某個(gè)研究主題的來(lái)龍去脈,深受文獻(xiàn)信息服務(wù)系統(tǒng)和用戶(hù)的青睞。
          
          1,2信息單元
          信息單元之間一般不會(huì)出現(xiàn)類(lèi)似于來(lái)源文獻(xiàn)與參考文獻(xiàn)那樣的關(guān)系,即用一個(gè)信息單元去解釋或參考另外一個(gè)信息單元。描述文獻(xiàn)的信息單元,如關(guān)鍵詞、主題詞等,很可能就是一個(gè)知識(shí)元的名稱(chēng)或者與某知識(shí)元有著密切關(guān)系。基于這種關(guān)系,建立從信息單元到到知識(shí)元的單向鏈接可以引導(dǎo)用戶(hù)去閱讀知識(shí)元,對(duì)用戶(hù)理解信息單元,從而更好理解文獻(xiàn)單元是很有用處的。這樣,信息單元就充當(dāng)著文獻(xiàn)單元和知識(shí)單元之間的橋梁和紐帶。
          
          1,3知識(shí)元
          知識(shí)元之間也有可能出現(xiàn)類(lèi)似于來(lái)源文獻(xiàn)與參考文獻(xiàn)那樣的關(guān)系,即一個(gè)知識(shí)元需要引用另外一個(gè)或多個(gè)知識(shí)元。單純地在知識(shí)元之間建立鏈接可以形成一個(gè)封閉的超文本系統(tǒng),用戶(hù)可以通過(guò)該系統(tǒng)實(shí)現(xiàn)非線(xiàn)性閱讀。在開(kāi)放的互聯(lián)網(wǎng)環(huán)境下,如果能夠在全文文獻(xiàn)中建立知識(shí)元名(或與某知識(shí)元相關(guān)的文字)到知識(shí)元的開(kāi)放性鏈接,就可以把全文文獻(xiàn)與知識(shí)元數(shù)據(jù)庫(kù)連接起來(lái),從而有效地?cái)U(kuò)大用戶(hù)的知識(shí)面或知識(shí)結(jié)構(gòu),幫助用戶(hù)更好地理解文獻(xiàn)單元。
          信息單元到知識(shí)元的鏈接與全文文獻(xiàn)中的知識(shí)元名(或與知識(shí)元相關(guān)的文字)到知識(shí)元的鏈接,鏈接對(duì)象都是知識(shí)元,但鏈接源不同,設(shè)置鏈接的位置也不同。但設(shè)置鏈接的位置(以下稱(chēng)為鏈接錨,即Anchor)都可以視為字符串(可以是信息單元、知識(shí)元名或與知識(shí)元相關(guān)的文字)到知識(shí)元的鏈接。本文把這兩種鏈接統(tǒng)稱(chēng)為知識(shí)元鏈接。一些文獻(xiàn)中提到的知識(shí)鏈接更多地是指參考文獻(xiàn)鏈接。參考文獻(xiàn)鏈接和知識(shí)元鏈接都是知識(shí)鏈接的一種。無(wú)論是參考文獻(xiàn)鏈接還是本文所指的知識(shí)元鏈接,鏈接系統(tǒng)都必須解決一個(gè)最根本的問(wèn)題:在鏈接源和鏈接對(duì)象之間建立鏈接的規(guī)則或標(biāo)準(zhǔn)是什么?以下分別闡述參考文獻(xiàn)鏈接和知識(shí)元鏈接的建立規(guī)則。
          
          2參考文獻(xiàn)鏈接的建立規(guī)則
          
          參考文獻(xiàn)鏈接泛指文摘索引與所標(biāo)引文獻(xiàn)、文后參考文獻(xiàn)與被引用文獻(xiàn)間的鏈接,目前更多的是學(xué)術(shù)論文之間的鏈接或者學(xué)術(shù)論文到圖書(shū)的鏈接。在數(shù)字學(xué)習(xí)環(huán)境中,用戶(hù)可以通過(guò)參考文獻(xiàn)鏈接直接從文摘索引、文后參考文獻(xiàn)鏈接到相應(yīng)的電子版全文。如果沒(méi)有相應(yīng)的電子版本,鏈接系統(tǒng)可以引導(dǎo)用戶(hù)鏈接到圖書(shū)館書(shū)目目錄服務(wù)、文獻(xiàn)傳遞機(jī)構(gòu)的目錄數(shù)據(jù)或可以提供該文獻(xiàn)的相關(guān)服務(wù)系統(tǒng)。無(wú)論是文摘索引還是文后參考文獻(xiàn),都有相應(yīng)的元數(shù)據(jù),即前面提到的信息單元。借用這些元數(shù)據(jù)信息,鏈接系統(tǒng)可以唯一確定一個(gè)目標(biāo)文獻(xiàn)單元。例如第一作者、刊名、出版年、出版期、起始頁(yè)的組合就可以唯一確定某篇期刊論文,第一作者、書(shū)名、出版社、出版年就可以唯一確定一本圖書(shū)。這樣,鏈接系統(tǒng)在建立鏈接時(shí)需要判斷一個(gè)文摘索引記錄或一條參考文獻(xiàn)(通過(guò)元數(shù)據(jù)來(lái)表示的)與另外一本篇圖書(shū)或一篇期刊論文是不是相同文獻(xiàn)。這個(gè)判斷標(biāo)準(zhǔn)就是參考文獻(xiàn)鏈接的建立規(guī)則。
          以期刊論文為例,從理論上講,通過(guò)參考文獻(xiàn)的元數(shù)據(jù)和全文文獻(xiàn)的元數(shù)據(jù)的比對(duì)判斷它們是不是同一篇文獻(xiàn)的標(biāo)準(zhǔn)很多。例如“第一作者+刊名+年份+期數(shù)+起始頁(yè)碼”就可以判斷是否同一篇文獻(xiàn),并且不會(huì)出現(xiàn)錯(cuò)誤鏈接,即“誤配”。但這個(gè)標(biāo)準(zhǔn)太嚴(yán)格了,盡管不會(huì)出現(xiàn)“誤配”,鏈接系統(tǒng)會(huì)出現(xiàn)“失配”現(xiàn)象:參考文獻(xiàn)和全文文獻(xiàn)指的是相同文獻(xiàn),原本是可以建立鏈接的,但鏈接系統(tǒng)卻判斷它們不是相同文獻(xiàn)。出現(xiàn)‘失配’現(xiàn)象的原因有很多,如論文作者在著錄參考文獻(xiàn)時(shí)或者是文獻(xiàn)數(shù)據(jù)庫(kù)加工過(guò)程中,參考文獻(xiàn)的題目、起始頁(yè)碼經(jīng)常出現(xiàn)小錯(cuò)誤。如果換一種較寬松的標(biāo)準(zhǔn),例如“第一作者+刊名+年份+期數(shù)”,不包含頁(yè)碼,鏈接系統(tǒng)會(huì)把原本不相同的文獻(xiàn)判斷為相同文獻(xiàn)從而建立參考文獻(xiàn)鏈接。盡管不會(huì)出現(xiàn)“失配”,卻可能出現(xiàn)“誤配”。例如,第一作者可能在同一本期刊(相同年份、相同期數(shù))上發(fā)表兩篇論文,而這兩篇論文被誤判為同一篇文獻(xiàn)。原則上講,編輯部一般不會(huì)安排作者以第一作者的身份在同一期雜志上發(fā)表兩篇文章,但實(shí)際上這樣的情況并不少。
          對(duì)于鏈接系統(tǒng)而言,選擇恰當(dāng)?shù)逆溄咏⒁?guī)則是非常關(guān)鍵的。數(shù)據(jù)質(zhì)量的高低直接影響鏈接規(guī)則。如果數(shù)據(jù)質(zhì)量高,條件可以嚴(yán)格些。在信息爆炸的時(shí)代,原則上允許出現(xiàn)“失配”,但不應(yīng)該出現(xiàn)“誤配”,以免浪費(fèi)用戶(hù)的時(shí)間。中國(guó)知網(wǎng)(CNKI)鏈接系統(tǒng)在處 理外文文獻(xiàn)時(shí),是把刊名、題名、第一作者、卷數(shù)和期數(shù)的組合作為判斷條件的。盡管文獻(xiàn)題名也會(huì)出現(xiàn)一些錯(cuò)誤(因?yàn)椴皇且?guī)范字段),但如果在字符串匹配時(shí)引入容錯(cuò)機(jī)制,如英文單詞的拼寫(xiě)錯(cuò)誤,就能在保證鏈接正確性的前提下,極大地減少出現(xiàn)“失配”的概率。
          參考文獻(xiàn)鏈接建立主要依賴(lài)于元數(shù)據(jù)匹配。無(wú)論是基于DOI的CrossRef還是基于OpenURL的SFX,都有這樣的處理過(guò)程。CrossRef的工作原理是:提取參考文獻(xiàn)的元數(shù)據(jù),然后在CrossRef中心元數(shù)據(jù)庫(kù)(存有數(shù)字文獻(xiàn)的DOI標(biāo)識(shí)和元數(shù)據(jù))進(jìn)行查找匹配;如果匹配成功(找到),就在參考文獻(xiàn)鏈接的URL地址中置人DOI唯一標(biāo)識(shí)符,以引導(dǎo)用戶(hù)看該參考文獻(xiàn)對(duì)應(yīng)的電子版全文。SFX是從包含有參考文獻(xiàn)元數(shù)據(jù)的OpenURL提取元數(shù)據(jù),然后把元數(shù)據(jù)發(fā)送到SFX服務(wù)組件(Service Component),根據(jù)用戶(hù)所在圖書(shū)館實(shí)際情況由SFX服務(wù)組件生成恰當(dāng)鏈接(Appropriate link),生成恰當(dāng)鏈接的過(guò)程中同樣有元數(shù)據(jù)匹配。至于這些系統(tǒng)具體的匹配算法,由于商業(yè)原因,還無(wú)法得知。
          
          3知識(shí)元鏈接的建立規(guī)則
          
          知識(shí)元鏈接包括兩類(lèi):一類(lèi)是從信息單元到知識(shí)元的鏈接;另一類(lèi)是知識(shí)元名(或與知識(shí)元相關(guān)的文字)到知識(shí)元的鏈接。
          
          3,1信息單元到知識(shí)元的鏈接
          不同類(lèi)型的信息單元所能夠鏈接的對(duì)象是不一樣的。以期刊論文為例,有必要建立鏈接的信息單元有著者、主題詞、關(guān)鍵詞等,而出版年份、出版期數(shù)、摘要等是沒(méi)有必要建立鏈接的。這里所說(shuō)的鏈接不是把信息單元作為檢索詞的鏈接,而是鏈接到知識(shí)元的鏈接,如著者簡(jiǎn)介、主題詞、關(guān)鍵詞解釋及相關(guān)知識(shí)等。
          
          3,2知識(shí)元名到知識(shí)元的鏈接
          與第一類(lèi)不同的是確定鏈接錨的方法不同。第一類(lèi)的鏈接錨是確定的,即已經(jīng)存在的信息單元,而第二類(lèi)則是鏈接系統(tǒng)在全文文獻(xiàn)中自行尋找合適的文字來(lái)設(shè)置鏈接錨。如何在全文文獻(xiàn)中尋找那些待建立鏈接的知識(shí)元名(或與之相關(guān)的文字)呢?方法不外乎以下兩種:①對(duì)全文文獻(xiàn)進(jìn)行切分詞,去除停用詞(stopwords),把剩下的詞都作為待建立鏈接的鏈接錨;②依次取出知識(shí)元數(shù)據(jù)庫(kù)中的知識(shí)元名(或相關(guān)的名字),在全文文獻(xiàn)中查找,找到的文字視為待建立鏈接的鏈接錨。這兩種方法各有優(yōu)缺點(diǎn),可以根據(jù)具體情況酌情采用。同一個(gè)詞在不同的專(zhuān)業(yè)領(lǐng)域其含義是不一樣的,如ALA既可以指美國(guó)圖書(shū)館協(xié)會(huì)(American Librar-y Association),還可以指美國(guó)后勤協(xié)會(huì)(American Lo-gisties Association);不同的詞可能表達(dá)相同的含義,如“Integrated Library System”與“Library Management Sys-tern”、“電子政務(wù)”和“電子政府”等。如果只是簡(jiǎn)單地字符串匹配,鏈接對(duì)象與鏈接錨之間可能出現(xiàn)大量的“失配”或“誤配”現(xiàn)象,嚴(yán)重影響用戶(hù)的使用積極性。以鳳凰網(wǎng)財(cái)經(jīng)頻道為例,如果新聞網(wǎng)頁(yè)中出現(xiàn)“物價(jià)”一詞,其鏈接引導(dǎo)用戶(hù)去看“居民消費(fèi)價(jià)格總指數(shù)”,那么該鏈接系統(tǒng)就不是簡(jiǎn)單地字符串匹配了,而是有一個(gè)專(zhuān)業(yè)本體庫(kù)(Ontology)或?qū)I(yè)敘詞表支撐著的知識(shí)檢索系統(tǒng),在“物價(jià)”和“居民消費(fèi)價(jià)格總指數(shù)”之間建立了鏈接。為了避免“失配”或“誤配”,鳳凰網(wǎng)沒(méi)有在綜合性新聞?lì)l道上設(shè)置知識(shí)元鏈接。
          一旦確立待建立鏈接的鏈接錨,剩下的問(wèn)題就是找到正確的鏈接對(duì)象,也就是在知識(shí)元數(shù)據(jù)庫(kù)中尋找與鏈接錨相關(guān)的知識(shí)元。知識(shí)元鏈接的建立規(guī)則就是判斷是否匹配的算法或規(guī)則。為實(shí)現(xiàn)這個(gè)算法或規(guī)則,鏈接系統(tǒng)除維護(hù)不同領(lǐng)域的知識(shí)元庫(kù)外,還得維護(hù)相應(yīng)領(lǐng)域的本體庫(kù)。給出一個(gè)待建立鏈接的詞,鏈接系統(tǒng)可以通過(guò)本體以及推理來(lái)確定屬于哪個(gè)專(zhuān)業(yè)領(lǐng)域的,從而建立正確的鏈接。從理論上講,如果知道某全文文獻(xiàn)所屬的專(zhuān)業(yè)領(lǐng)域,鏈接系統(tǒng)就不用再去判斷該全文文獻(xiàn)的專(zhuān)業(yè)領(lǐng)域,有效地降低技術(shù)復(fù)雜度。所以鳳凰網(wǎng)是分頻道來(lái)設(shè)置知識(shí)元鏈接的,如財(cái)經(jīng)頻道和汽車(chē)頻道,這相當(dāng)于預(yù)先知道了全文文獻(xiàn)的專(zhuān)業(yè)領(lǐng)域。如果不知道全文文獻(xiàn)的專(zhuān)業(yè)領(lǐng)域,鏈接系統(tǒng)就必須依賴(lài)計(jì)算機(jī)系統(tǒng)來(lái)判斷所屬專(zhuān)業(yè)領(lǐng)域,然后在相應(yīng)專(zhuān)業(yè)領(lǐng)域的知識(shí)元數(shù)據(jù)庫(kù)中尋找正確的鏈接對(duì)象,或者是直接在綜合性的知識(shí)元庫(kù)中尋找正確的鏈接對(duì)象。這樣,出現(xiàn)“錯(cuò)配”或“誤配”的概率就大很多。
          
          4參考文獻(xiàn)鏈接和知識(shí)元鏈接的幾個(gè)范例
          
          4,1參考文獻(xiàn)鏈接實(shí)例分析
          很多大型文獻(xiàn)服務(wù)系統(tǒng)都提供參考文獻(xiàn)鏈接,如CNKI、萬(wàn)方數(shù)據(jù)網(wǎng)絡(luò)服務(wù)系統(tǒng)、基于DOI的Cross-Ref、基于OpenURL的SFX等。這里介紹一下CNKI的鏈接系統(tǒng)。CNKI知識(shí)服務(wù)系統(tǒng)在顯示一篇論文的參考文獻(xiàn)時(shí),如果鏈接系統(tǒng)在對(duì)象資源庫(kù)中找到相應(yīng)的參考文獻(xiàn),則在該參考文獻(xiàn)上建立鏈接。CNKI的文獻(xiàn)資源有兩種:自己擁有的資源(一般是中文)和通過(guò)網(wǎng)絡(luò)來(lái)獲取的資源(一般是外文)。不同來(lái)源的文獻(xiàn)資源,鏈接系統(tǒng)建立鏈接的規(guī)則和實(shí)現(xiàn)技術(shù)是不一樣的。
          例如,有一篇中文參考文獻(xiàn)“劉鋼,從信息的哲學(xué)問(wèn)題到信息哲學(xué),自然辯證法研究,2003(1),”,鏈接系統(tǒng)在論文題名上建立了參考文獻(xiàn)鏈接,對(duì)應(yīng)URL是“http://epub.省略/grid200S/detailret.aspx?filename=ZRBZ200301010&dbname C3FD2003&filetitle=%e4%bb%8……5%ad%a6”。其中,filename相當(dāng)于一個(gè)全文文獻(xiàn)的唯一標(biāo)識(shí)符,由表示期刊名的四個(gè)英文字符,四個(gè)數(shù)字組成的出版年、二個(gè)數(shù)字組成的期數(shù)以及二個(gè)數(shù)字組成的順序號(hào)構(gòu)成。其余兩個(gè)是數(shù)據(jù)庫(kù)名(dbname)和論文題名(flIetitle)。因?yàn)閒ilename已經(jīng)是一個(gè)唯一標(biāo)識(shí)符,所以論文題名并沒(méi)有起到什么作用。這個(gè)filename就是鏈接系統(tǒng)根據(jù)參考文獻(xiàn)信息自動(dòng)找到對(duì)應(yīng)的文獻(xiàn)的唯一標(biāo)識(shí)符,類(lèi)似于數(shù)字對(duì)象標(biāo)示符(DOI),但具體規(guī)則尚不可知。
          如果參考文獻(xiàn)不屬于CNKI擁有的資源,鏈接系統(tǒng)利用文獻(xiàn)來(lái)源名(sid)、論文題名(title)、第一作者(aufirst)、年卷號(hào)(volume)和期數(shù)(issue)作為建立鏈接的規(guī)則,動(dòng)態(tài)建立相關(guān)鏈接,引導(dǎo)用戶(hù)查看著錄信息以及遵循OpenURL標(biāo)準(zhǔn)的鏈接。因?yàn)镺penURL嵌有規(guī)范的元數(shù)據(jù)信息,可以讓其他文獻(xiàn)服務(wù)系統(tǒng)解析OpenURL鏈接并給出相應(yīng)的處理結(jié)果,如ProQuest、國(guó)家科技文獻(xiàn)中心(NSTL)、Google、百度等,鏈接系統(tǒng)具有很強(qiáng)的開(kāi)放性,如圖1所示:
          例如,有一篇英文參考文獻(xiàn)“Salton G,Lesk M E.Computer evaluation of indexing and text processing,Jour- nal of the ACM,1969,15,15(1):8-36,”,鏈接系統(tǒng)在其論文題名上建立了參考鏈接,對(duì)應(yīng)的URL是“ht-tp://211.151.93.省略ki.net/WebForms/WebDefines,aspx?searchword=%e4%bf%a1%e6%81%af%e6%a3%80%e7%b4%a2”。如圖2所示:
          根據(jù)多次測(cè)試分析,發(fā)現(xiàn)該系統(tǒng)是把“信息檢索”作為檢索用詞,把在概念知識(shí)元庫(kù)中檢索的結(jié)果作為鏈接對(duì)象呈現(xiàn)給用戶(hù),至于是否“誤配”就只能靠用戶(hù)自己來(lái)判斷。
          與CNKI相似,萬(wàn)方數(shù)據(jù)服務(wù)系統(tǒng)也在關(guān)鍵詞(信息單元)上建立“知識(shí)脈絡(luò)”鏈接,提供該關(guān)鍵詞的研究趨勢(shì)圖和相關(guān)信息。如對(duì)某篇文章的關(guān)鍵詞“機(jī)構(gòu)庫(kù)”,萬(wàn)方數(shù)據(jù)服務(wù)系統(tǒng)提供的鏈接對(duì)象如圖3所示:
          4,2,2知識(shí)元名(或與知識(shí)元相關(guān)的文字)到知識(shí)元的元鏈接鳳凰網(wǎng)的財(cái)經(jīng)頻道和汽車(chē)頻道在報(bào)道相關(guān)新聞時(shí),為某些專(zhuān)業(yè)名詞術(shù)語(yǔ)、人物和品牌等建立了知識(shí)鏈接,如“中國(guó)石油”、“國(guó)內(nèi)生產(chǎn)總值”等財(cái)經(jīng)類(lèi)的股票名或術(shù)語(yǔ),“元素”、“吳紹明”等汽車(chē)類(lèi)的相關(guān)名詞或人物等。鏈接系統(tǒng)在分析網(wǎng)頁(yè)全文(相當(dāng)于全文文獻(xiàn))內(nèi)容基礎(chǔ)上為用戶(hù)建立知識(shí)元鏈接,引導(dǎo)用戶(hù)查看相關(guān)信息,如股票的實(shí)時(shí)數(shù)據(jù)、人物專(zhuān)題報(bào)道等。嚴(yán)格上講,鏈接對(duì)象還不是知識(shí)元,但也不妨礙把其歸于知識(shí)元鏈接。為降低系統(tǒng)復(fù)雜度,避免錯(cuò)誤鏈接,鏈接系統(tǒng)根據(jù)頻道類(lèi)型選擇相應(yīng)類(lèi)型的知識(shí)庫(kù)或本體庫(kù),例如汽車(chē)頻道類(lèi)的“元素”鏈接只會(huì)出現(xiàn)在汽車(chē)類(lèi)新聞當(dāng)中,而不會(huì)出現(xiàn)在財(cái)經(jīng)類(lèi)新聞中。
          與CNKI和萬(wàn)方數(shù)據(jù)的鏈接系統(tǒng)不同,鳳凰網(wǎng)的鏈接系統(tǒng)是在分析網(wǎng)頁(yè)(文獻(xiàn))全文的基礎(chǔ)上找出鏈接錨(鏈接文字),而不是直接在已知的信息單元上建立知識(shí)元鏈接。其鏈接對(duì)象可能是網(wǎng)絡(luò)服務(wù)、子網(wǎng)站等,如圖4所示:
          某網(wǎng)頁(yè)上“國(guó)內(nèi)生產(chǎn)總值”的鏈接提供“國(guó)內(nèi)生產(chǎn)總值”的解釋及其相關(guān)內(nèi)容。目前鳳凰網(wǎng)的鏈接系統(tǒng)是在現(xiàn)有的網(wǎng)絡(luò)相關(guān)標(biāo)準(zhǔn)和技術(shù)上實(shí)現(xiàn)的,如果實(shí)現(xiàn)這種分析全文文獻(xiàn)內(nèi)容并在全文文獻(xiàn)中建立開(kāi)放型知識(shí)元鏈接的鏈接系統(tǒng),必須開(kāi)發(fā)出支持開(kāi)放鏈接的電子文獻(xiàn)(文檔)標(biāo)準(zhǔn)及支持這些標(biāo)準(zhǔn)的閱讀軟件。

        相關(guān)熱詞搜索:規(guī)則 建立 鏈接 論知識(shí)鏈接的建立規(guī)則 知識(shí)圖譜建立規(guī)則 知識(shí)鏈接的構(gòu)建方式研究

        版權(quán)所有 蒲公英文摘 smilezhuce.com