东方亚洲欧a∨人在线观看|欧美亚洲日韩在线播放|日韩欧美精品一区|久久97AV综合

        知識鏈接的構(gòu)建方式研究_綠色生活方式概念

        發(fā)布時間:2020-03-07 來源: 散文精選 點擊:

          摘要 在概述知識鏈接中知識的各種關聯(lián)關系的基礎上,詳細分析知識鏈接的類型,并由此探討知識鏈接的4種主要構(gòu)建方式。作者提出利用參考鏈接機制推進科學文獻的知識鏈接,進行科學對象詞典編制,提升作者機構(gòu)等相關對象的鏈接與評價。建立主題圖促進知識元鏈接,對知識要素的抽取標引推動科學數(shù)據(jù)的鏈接。
          關鍵詞 知識鏈接 知識要素 科學對象 鏈接方式
          分類號 G250
          
          知識鏈接是指從一個信息物體鏈接到另一個信息體,一般特指學術(shù)論文之間、概念單元之間和科學對象之間的鏈接關系。其發(fā)展與互聯(lián)網(wǎng)的出現(xiàn)息息相關,很大程度上歸功于互聯(lián)網(wǎng)所提供的相互鏈接功能…。
          通過知識鏈接,利用引文關系、上下位關系,可以不斷擴大檢索范圍,掌握越來越多的相關文獻。通過知識鏈接,可以處理異質(zhì)信息資源,建立一個包括期刊雜志、科學數(shù)據(jù)、作者網(wǎng)頁、專利信息和產(chǎn)品信息等互相鏈接的圖書館信息環(huán)境。隨著技術(shù)的進步、資源的豐富和標準化工作的進展,知識鏈接還可以構(gòu)成一個統(tǒng)一的知識體系結(jié)構(gòu),形成序列化或結(jié)構(gòu)化的知識集合,構(gòu)建知識網(wǎng)絡門戶體系,揭示知識的本質(zhì)聯(lián)系,繼而對可鏈接的知識進行智能檢索、知識導航、交叉揭示、統(tǒng)計分析,達到評價知識及其相關科學對象的目的。
          因此,研究知識關聯(lián)關系、知識鏈接原理,探討知識鏈接的構(gòu)建方式,對于實施知識鏈接的具體實踐具有重要的現(xiàn)實意義。
          
          1知識的關聯(lián)關系
          
          1,1知識的同一關系
          指由知識節(jié)點間具有某種相同屬性,各個知識單元間在中心主題、主題、主題因素、概念中所蘊含的形象、屬性、關系所具有的某種程度的相同或相通(相似)之處。表明具有同一性的知識單元間的等同性、等價性、相似性、延展性,可以消解知識內(nèi)容的離散性、重復性,即將大量離散的具有同一性的知識單元聯(lián)系在一起。
          
          1,2知識的隸屬關系
          指構(gòu)成某知識節(jié)點的某一知識單元或知識單元集合隸屬于某一概念、范疇和類別的邏輯關系。即將具有隸屬關系的知識單元,按照一定的屬種、總分、包含的抽象思維或形象思維的邏輯關系進行關聯(lián),使各個知識單元在屬種、總分、包含關系中擴大或縮小適用功能和范圍。即可以通過一般和個別、總體和部分的內(nèi)在關聯(lián)性來建立知識鏈接。
          
          1,3知識的相關關系
          指在同一、隸屬關系之外知識單元間所具有的相互依存、相互滲透、相互制約、相互作用的關系,一般是指相反、相對、因果、引用、應用、影響等各種關系,但其關系是不嚴格固定的或數(shù)量關系是不完全確定的。
          除此之外,科學對象之間還有繼承關系、沿革關系、合作關系,科學文獻之間存在著引證關系(如互引、引文樹)、同現(xiàn)關系(如同被引、共引、共詞)、上下游間出版?zhèn)鞑リP系等,都可以構(gòu)建知識的關聯(lián)關系。
          
          2知識鏈接的類分
          
          2,1基于科學文獻的知識鏈接
          通過科學文獻(學術(shù)論文、引文、專利、標準等)之間的引證關系,利用開放鏈接標準,確定引文鏈接網(wǎng)絡地址(URL),建立引文鏈接索引庫,鏈接源與相應的目標可以是期刊論文、學位論文、標準、專利、圖書篇目、會議錄、文摘索引款目或甚至是Web站點、E-mail中的鏈接等。通過科學文獻中的各類型引文,在文摘索引與其所標引文獻、文后參考資料與被引用資料之間建立關聯(lián)和鏈接。根據(jù)引文的引用、被引用和共同引用三種類型,可進行引文正向鏈接、引文反向鏈接和共引文獻聚類鏈接等。用戶通過互聯(lián)網(wǎng)查詢這些建立了論文引文鏈接的數(shù)據(jù)庫和知識庫,借助各種引用途徑在整個知識體系中情景敏感地獲得相關知識信息。
          許多情況下使用知識鏈接的用戶都處于一種包括OPAC系統(tǒng)、文摘索引數(shù)據(jù)庫、電子期刊及Web信息資源服務等多種類型信息資源在內(nèi)的復合圖書館環(huán)境之中。不僅實現(xiàn)同一個文獻數(shù)據(jù)庫中的文獻鏈接,還能實現(xiàn)多個文獻數(shù)據(jù)庫的內(nèi)容深度整合,在跨庫多維鏈接的基礎上,實現(xiàn)跨庫引文分析與文獻相似性分析,繼而建立跨庫的知識鏈接。
          
          2,2基于知識元的知識鏈接
          知識元是知識的最小單位,是知識結(jié)構(gòu)的基本組成部分,它普遍存在于豐富多彩的文獻世界中。不同的研究視角對知識元的稱謂不同,定量化的研究角度稱其為知識元或知識元素、知識因子,定性化的研究視角就是概念或事物。那么,在知識體系中知識元則作為結(jié)構(gòu)最小的知識節(jié)點,用語詞來表示就是關鍵詞或關鍵詞組。實現(xiàn)知識元鏈接,首先必須將這些最小的知識單元提煉出來。即把一個概念、一個事實或一個數(shù)據(jù)等實際能說明某個知識的各元素包括知識概念、關鍵詞或關鍵詞串等提煉出來,按照基本知識結(jié)構(gòu)存儲在知識元庫中。
          知識元庫是知識元鏈接的中樞,由具有獨立意義的知識元素構(gòu)成,包括理論與方法、事實、數(shù)值型三類基本知識元。通過對知識信息點的元素化加工與概括提煉,可以了解各學科知識基本內(nèi)容,并發(fā)現(xiàn)知識之間的內(nèi)容關聯(lián)。知識元庫不僅可以直接表述知識的內(nèi)容,也可以通過全文數(shù)據(jù)庫的索引技術(shù),將使用這一知識元的所有文獻自動鏈接為知識體系。
          
          2,3基于科學對象的知識鏈接
          知識領域內(nèi)存在著作者與作者、作者與機構(gòu)、機構(gòu)與機構(gòu)、作者與主題間的學術(shù)關系,重要機構(gòu)、團隊、科研人員學術(shù)關系及其相關關系成為知識鏈接的基礎。
          通過對科學共同體、作者、出版社、基金組織等科學對象間學術(shù)資助、科學引證、科研合作、科學出版等關系的分析,對科學文獻中學術(shù)參與者(機構(gòu)和人)之間合著關系、引用關系、人員機構(gòu)延續(xù)關系、人員和刊物關系等進行挖掘,可以實現(xiàn)對知識領域內(nèi)科學對象(包括人和組織)的結(jié)構(gòu)、活動模式和演化過程的揭示,實現(xiàn)對領域內(nèi)典型學術(shù)關系網(wǎng)絡的結(jié)構(gòu)和演化過程的可視化表現(xiàn),發(fā)現(xiàn)機構(gòu)、科研團隊和個人間學術(shù)網(wǎng)絡關系的特點與趨勢。
          建立基于本體的科學對象網(wǎng)絡體系,將這些科學對象進行揭示、集成和存儲,有機組織到相應的知識組織體系之中,建立起科學對象和原始文獻之間的關聯(lián)關系,形成可供計算的科學對象與科技文獻間關聯(lián)數(shù)據(jù)。并在此基礎之上,通過聚類、文獻計量、引文追蹤、鏈接分析、相關性規(guī)則計算等數(shù)據(jù)挖掘方法,識別出存在于科技文獻之中的各種學術(shù)關系網(wǎng)絡,對領域內(nèi)存在的結(jié)構(gòu)關系和知識領域演化發(fā)展過程進行描繪,以反映出當前相關領域的研究中所存在的主要研究團隊和個人的特點、研究進展、研究主題分布情況、研究關鍵點等知識領域信息,從而為知識管理提供基礎數(shù)據(jù)支持。
          
          2,4基于知識要素的知識鏈接
          科技文獻中包含大量的技術(shù)、項目、產(chǎn)品及其參數(shù)、指標、相關的圖形表格等知識要素,這些知識要素往往分散于各種類型、各種載體和各種內(nèi)容的文獻之中,各知識要素問也存在著相互關聯(lián),如項目創(chuàng)新技術(shù)、技術(shù)創(chuàng)造產(chǎn)品,產(chǎn)品又有各種相關的技術(shù)參數(shù)和指標,它們之間還存在著同一關系、上下位關系和相關關系等,存在著技術(shù)交替與延續(xù)、技術(shù)仿制及融合的發(fā)展 過程,而其表述除文本外,多數(shù)是圖形和表格等。對知識要素進行識別和抽取,對圖形表格語義特征與語義模型、語義屬性進行標注及標引,可以建立知識要素的概念化描述以及知識要素間的鏈接關系。能夠展現(xiàn)技術(shù)自身的實況,表現(xiàn)技術(shù)演化發(fā)展的過程,成為技術(shù)圖譜。
          在泛在知識環(huán)境下,隨著互聯(lián)網(wǎng)和數(shù)據(jù)庫產(chǎn)業(yè)的發(fā)展,許多信息服務機構(gòu)不僅在自己的數(shù)據(jù)庫內(nèi)提供鏈接,而且開始建立跨機構(gòu)的知識鏈接,實現(xiàn)開放鏈接系統(tǒng)。其鏈接的方式也呈綜合性,豐富多樣,通過對鏈接解析工具的直接控制和使用,基于以DOI為唯一標識基礎的鏈接推進了開放鏈接系統(tǒng)的產(chǎn)生,使文獻間的鏈接在圖書館環(huán)境下普遍存在。同時也開始進行從文獻到科學數(shù)據(jù)庫的鏈接,將文章中的基因系列與基因數(shù)據(jù)庫中的記錄鏈接,實現(xiàn)文章內(nèi)或文章間的化學結(jié)構(gòu)、知識單元、科學對象以及相關的技術(shù)參數(shù)指標等知識要素的鏈接,將文章中對實驗結(jié)果的描述與科學數(shù)據(jù)、科學參數(shù)結(jié)合等。
          
          3知識鏈接的構(gòu)建方式
          
          3,1參考鏈接機制構(gòu)建
          超文本是一種按知識之間的關系非線性地存儲、組織、管理和瀏覽知識的技術(shù)與方法。超文本鏈接是表現(xiàn)知識之間關系的一種手段,指使用超文本標記語言(HTML)的標記指令,通過統(tǒng)一資源定位符(URL),指向鏈接對象的具體位置,在鏈接源(鏈源)與鏈接目標(鏈宿)間建立聯(lián)系。其包括兩個核心要素:節(jié)點和鏈。節(jié)點是展現(xiàn)知識的基本單元,可以是題錄、不同載體形式的文獻全文,也可以是文獻的責任者、文獻主題、文獻出版機構(gòu)等。鏈用來組織節(jié)點,表達節(jié)點問的關系,它是由一個節(jié)點指向其他節(jié)點,或從其他節(jié)點指向該節(jié)點,以表示不同節(jié)點間知識的關系,鏈需要采用相同的表述工具予以標識。所以,知識鏈接可作為一個過程,也可看作一個系統(tǒng)。
          鏈接是超文本的核心,其基本特征是在嵌入URL標識的節(jié)點之間建立關系。適應數(shù)字環(huán)境下異構(gòu)資源系統(tǒng)的發(fā)展,參考鏈接分為封閉式靜態(tài)鏈接、開放式靜態(tài)鏈接以及開放式動態(tài)鏈接。封閉式靜態(tài)鏈接是指所有嵌入URL的信息鏈接點均在本地存儲和控制,如ISI的Web of Science;開放式靜態(tài)鏈接主要是鏈源和鏈宿互相提供鏈接對象的標識符或URL,如Cross-Ref;開放式動態(tài)鏈接主要是基于OpenURL協(xié)議的開放、擴展和多向性鏈接,OpenURL標準的出現(xiàn)為建立無縫的、上下文敏感鏈接提供基礎,如SFX。它們都是采用超文本鏈接技術(shù),通過唯一標識符的指向,將文獻實體間的引證關系進行定位,從而構(gòu)建參考鏈接機制。
          許多新的技術(shù)標準陸續(xù)出現(xiàn),推進了基于多樣性信息環(huán)境的知識鏈接。RDF建立了表達語意和知識關系的模型,DOI和CrossRef可以用所建立的數(shù)字對象唯一標識體系固化相互之間的引用關系;OpenURL可以用來表達動態(tài)的、基于用戶環(huán)境和身份的鏈接關系;而XLink支持多方向的擴展鏈接,可以在文檔之間建立多向的復雜鏈接關系,實現(xiàn)鏈源到鏈宿之間的相互鏈接。
          
          3,2科學對象詞典編制
          作者及其單位、基金、文獻來源等是知識鏈接的科學對象,基于引文的知識鏈接,需要對其相關文獻外部特征和內(nèi)部特征進行規(guī)范合一,除對文獻題目進行歸一外,還需要對文獻來源(期刊名稱和出版社名稱)、作者及其單位、基金等科學對象進行規(guī)范,是實現(xiàn)知識服務和統(tǒng)計評價功能的關鍵因素。
          對科學對象的鏈接,需要在論文引文數(shù)據(jù)庫建設過程中進行相關科學對象文本的抽取,制定相關規(guī)范及標準,建立面向科學對象詞典的結(jié)構(gòu)體系和標準,將文本內(nèi)容中的科學對象提煉出來,編制成科學對象詞典。例如,機構(gòu)包括正式名稱和別稱,同一機構(gòu)可以有許多不同的名稱,實名和指稱、譯名、指代、縮寫、簡稱等;機構(gòu)間有代用、相關、從屬等關系;需要辨析之間的同義、近義、反義、從屬、隱含、關聯(lián)等關系。
          通過構(gòu)建信息抽取原型系統(tǒng),對知識內(nèi)容點的要素化提煉和規(guī)范,采用KDD和數(shù)據(jù)挖掘(Data Mining)等技術(shù)方法,從海量的、結(jié)構(gòu)化的數(shù)據(jù)集中識別出新穎、有效的要素,包括機構(gòu)、人員等實體的抽取。同時,按照一定的分類體系,采用分類標引法和詞語標引法揭示科學對象的主題內(nèi)容和屬性,標識出科學對象之間的相關關系,并進行族性組織和語義、特性組織,使科學對象之間具有等級關系和學科關系。編制出規(guī)模適當、具有語義關系、分級合理并可靈活配置的科學對象詞典(對象本體)。這樣,可以基于科學對象詞典相關語義場運算技術(shù),把知識特征(形式特征與內(nèi)容特征)與詞典中的標引詞匯進行相符性比較,通過引文與論文之間的作者、機構(gòu)、出版社、基金等的規(guī)范,通過科學對象關聯(lián)特征實現(xiàn)實體之間的關聯(lián),進行多實體關聯(lián)分析及多視角的實體分析,實現(xiàn)科學對象的相互鏈接和揭示,以及科學對象的導航和統(tǒng)計評價,繼而達到發(fā)現(xiàn)知識之間內(nèi)容關聯(lián)的需要。
          
          3,3主題圖與知識元庫建設
          創(chuàng)建知識元庫、構(gòu)建主題圖是實現(xiàn)知識鏈接的基礎。作為一種知識組織體系,主題圖/概念關系圖是一個由眾多的主題、主題間的關聯(lián)關系組成的集合體。主題圖由主題、關聯(lián)來形成知識的結(jié)構(gòu)與關聯(lián)。主題可以表示任何概念化的知識。可根據(jù)應用領域和用戶需求建立相應的主題概念集。關聯(lián)表示相關主題之間互相的關系。將主題關聯(lián)起來,就形成了主題間的語義聯(lián)系。
          文本中的知識元不是孤立的,知識元之間也存在著一定的邏輯關聯(lián)。知識元有其相對應的主題/概念,一個知識元可以對應一個或多個主題/概念;反之,一個主題/概念也可以由多個知識元來表達。知識元最合適的表達方式是主題圖,反映知識元之間的各種隱含的有效關聯(lián)(如等級種屬關系、矛盾關系、并列同一關系、簇類關系等),通過主題、主題間的關系以及知識元與資源關系的表現(xiàn)來組織知識,并將其與相關信息資源進行鏈接。通過對文本中知識元的抽取,建立知識元與主題/概念間的有機聯(lián)系,形成知識元庫,可以通過知識元本身顯現(xiàn)主題與資源實體之間的一種指向,實現(xiàn)對與知識元庫中相關聯(lián)的知識間的知識鏈接,形成一對一或一對多的指向,從而揭示單篇文獻的個體“知識元”與某領域共性“知識結(jié)構(gòu)”的鏈接關系。
          分類法、主題詞表是信息組織的有效工具,在數(shù)字環(huán)境下,分類主題一體化系統(tǒng)作為一種重要的主題圖,可以在知識鏈接中發(fā)揮作用。其主要功能在于表示知識概念間的相互聯(lián)系,利用主題概念間的等同關系、等級關系和相關關系等豐富的聯(lián)系,結(jié)合知識元庫,定位某一知識概念所在的資源位置,將主題、主題間的相互關聯(lián)以及主題與信息資源的聯(lián)系以特定的方式直觀地展現(xiàn)出來,使抽象的知識內(nèi)容組織成一個有坐標概念的知識地圖,并形成結(jié)構(gòu)化的語義網(wǎng)絡,借助鏈接技術(shù),將用戶指引到相關的資源,獲得所需要的知識。
          
          3,4知識要素的抽取標引
          對科技文獻中參數(shù)指標和圖形表格等知識要素的識別與抽取,進行圖形表格語義特征及語義模型、語義屬性的標注和標引,可以建立參數(shù)指標的概念化描述以及與其他知識要素的鏈接關系,實現(xiàn)數(shù)據(jù)聚合。
          知識要素的抽取標引需要建立圖形、表格的識別模型和匹配模型,利用上下文分析方法自動分析和判讀存儲在計算機中的圖形、表格所處的環(huán)境信息,找出其語義特征;利用參數(shù)指標語義模型,通過語義特征分析判斷圖形、表格所具備的參數(shù)指標屬性,并將相關屬性進行標注;利用數(shù)據(jù)清洗方法對圖形、表格進行清洗,從而實現(xiàn)參數(shù)指標的識別與分離。并對科技文獻信息中包含的大量圖形、表格及其與上下文的關系進行分析,通過遞歸算法等推導出參數(shù)指標語義模型,利用機器學習理論和上下文分析理論,識別參數(shù)指標;利用數(shù)據(jù)挖掘理論,清洗、析出科學數(shù)據(jù)。
          利用知識組織中的概念體系,對抽取的參數(shù)指標和圖形表格等知識要素進行概念判斷、識別、歸類、描述和鏈接,利用自動切詞技術(shù),對這些知識要素進行元數(shù)據(jù)描述和知識加工標引,建立知識要素的概念化表達和關聯(lián)。按照參數(shù)指標等知識要素的元數(shù)據(jù)規(guī)范,進行自動標注從而獲取相關屬性,建設知識要素數(shù)據(jù)庫,實現(xiàn)知識要素間的有效鏈接與揭示。
          知識鏈接原理是依據(jù)知識間特有屬性和關聯(lián)關系,知識鏈接方法得益于技術(shù)和標準的發(fā)展。開放鏈接標準的應用,主題圖、知識元庫、科學對象詞典、知識本體等方面的研究為建立學習環(huán)境和信息環(huán)境之間的鏈接關系打下了良好的基礎。知識鏈接更加重視面向用戶需求的范疇分類和主題表達,使之更加個性化和可視化,根據(jù)用戶行為特征組織知識和導航知識、挖掘知識和評價知識;重視知識的多樣化、專業(yè)化、層次化、內(nèi)容過濾、知識抽取、顯性知識和隱性知識的轉(zhuǎn)換;更加重視人與人之間的聯(lián)系、機構(gòu)、社團聯(lián)系等。這種分布異構(gòu)的各數(shù)據(jù)庫,通過知識元數(shù)據(jù)庫、引文索引庫和其他知識要素詞典和科學對象索引耦合起來的整體化數(shù)據(jù)庫集群形成一個集成的知識鏈接體系。任何一個用戶都可以通過文獻之間交錯復雜的知識鏈接,最大限度地獲得相關知識信息,從而實現(xiàn)知識管理和知識服務的目標。

        相關熱詞搜索:構(gòu)建 方式 鏈接 知識鏈接的構(gòu)建方式研究 知識鏈接及其服務研究 論知識鏈接的建立規(guī)則

        版權(quán)所有 蒲公英文摘 smilezhuce.com