數(shù)字圖書(shū)館系統(tǒng) 數(shù)字圖書(shū)館知識(shí)組織系統(tǒng)熱點(diǎn)分析
發(fā)布時(shí)間:2020-03-07 來(lái)源: 幽默笑話 點(diǎn)擊:
[摘要]數(shù)字圖書(shū)館知識(shí)組織系統(tǒng)的構(gòu)建有賴(lài)于本體的開(kāi)發(fā)與完善,從解決數(shù)字圖書(shū)館知識(shí)組織系統(tǒng)語(yǔ)義豐富度視角,對(duì)當(dāng)前學(xué)界對(duì)該領(lǐng)域熱點(diǎn)問(wèn)題的研究狀況進(jìn)行分析,包括:本體構(gòu)建與復(fù)用,本體整合、語(yǔ)義分析與抽取、語(yǔ)義標(biāo)注以及語(yǔ)義互聯(lián)應(yīng)用。
[關(guān)鍵詞]數(shù)字圖書(shū)館 知識(shí)組織系統(tǒng) 領(lǐng)域本體
[分類(lèi)號(hào)]G250.76
1 引言
數(shù)字圖書(shū)館(DL)是信息環(huán)境網(wǎng)絡(luò)化、數(shù)字化、知識(shí)化的產(chǎn)物,是國(guó)家信息基礎(chǔ)設(shè)施的核心。數(shù)字圖書(shū)館把知識(shí)作為工作對(duì)象,并且關(guān)注知識(shí)的應(yīng)用環(huán)境和應(yīng)用群體,因此,知識(shí)組織系統(tǒng)的構(gòu)建在數(shù)字圖書(shū)館建設(shè)中始終發(fā)揮著核心的作用。
從廣義理解,數(shù)字圖書(shū)館知識(shí)組織應(yīng)包括數(shù)字資源的知識(shí)組織系統(tǒng)的構(gòu)建、語(yǔ)義自豐富、語(yǔ)義互聯(lián)、互操作、術(shù)語(yǔ)服務(wù)等。
近年來(lái),在我國(guó)圖書(shū)情報(bào)界,本體研究成為了數(shù)字圖書(shū)館知識(shí)組織系統(tǒng)構(gòu)建的一個(gè)熱點(diǎn)研究領(lǐng)域。目前為解決數(shù)字圖書(shū)館知識(shí)組織系統(tǒng)語(yǔ)義豐富度問(wèn)題,本體構(gòu)建與復(fù)用、本體整合、語(yǔ)義分析與抽取、語(yǔ)義標(biāo)注以及語(yǔ)義互聯(lián)應(yīng)用成為學(xué)界研究的熱點(diǎn)和建設(shè)的重點(diǎn)(見(jiàn)圖1)。
2 研究現(xiàn)狀與熱點(diǎn)
2.1本體建模與復(fù)用研究
本體建模方法的研究對(duì)于本體的應(yīng)用有至關(guān)重要的作用。數(shù)字圖書(shū)館知識(shí)組織系統(tǒng)的構(gòu)建有賴(lài)于本體的開(kāi)發(fā)與完善,本體的開(kāi)發(fā)和完善是一個(gè)反復(fù)疊加的過(guò)程,不會(huì)一蹴而就。目前國(guó)內(nèi)外學(xué)者試圖從本體建模方法和開(kāi)源本體的復(fù)用兩個(gè)方面進(jìn)行突破。
目前本體建模的研究已經(jīng)進(jìn)入實(shí)際應(yīng)用階段。許多研究領(lǐng)域都建立了自己標(biāo)準(zhǔn)的本體,但由于領(lǐng)域本體建設(shè)還沒(méi)有成熟的方法論作為指導(dǎo),目前提出的本體建模方法都是面向特定領(lǐng)域或針對(duì)具體的項(xiàng)目,而且都不是經(jīng)權(quán)威標(biāo)準(zhǔn)化機(jī)構(gòu)認(rèn)證的方法,這就導(dǎo)致各種本體建模方法的出現(xiàn)。如骨架法、企業(yè)建模法、循環(huán)獲取法和IDEF-5方法等。
本體復(fù)用已成為重要的課題,越來(lái)越多的應(yīng)用利用本體表示語(yǔ)義信息,因而如何支持本體復(fù)用變得愈加重要。本體復(fù)用主要有三種:①簡(jiǎn)單地把整個(gè)源本體導(dǎo)入目標(biāo)本體Wppl,且僅用其中部分規(guī)則,而直接忽略其余規(guī)則;②僅“復(fù)制+粘貼”源本體規(guī)則的某子集到目標(biāo)本體Wppl為導(dǎo)人規(guī)則的子集;③把源本體分解成不同的模塊,根據(jù)相關(guān)標(biāo)準(zhǔn),僅導(dǎo)入需要的模塊。相比而言,第3種方法是最有發(fā)展前景的方法,目前的困難在于本體的模塊化還不很成熟,只提供了本體類(lèi)的理論和算法。
W3C標(biāo)準(zhǔn)定義的OWL本體語(yǔ)言由一系列規(guī)則組成,包括類(lèi)規(guī)則、屬性規(guī)則和實(shí)例規(guī)則。在如下導(dǎo)入相似性標(biāo)注的幫助下,OWL本體可以導(dǎo)入其他的OWL本體:
Annotation(ireports)
Annotation(imports)
導(dǎo)入標(biāo)注含有把兩個(gè)源本體導(dǎo)入目標(biāo)本體的規(guī)則。把本體概念加以擴(kuò)充,可以實(shí)現(xiàn)從源本體的類(lèi)、屬性和實(shí)例的語(yǔ)義導(dǎo)入。本體復(fù)用需要評(píng)價(jià)已有本體與目標(biāo)本體之間的關(guān)聯(lián)性。共享和復(fù)用是本體的本質(zhì)要求,也是領(lǐng)域本體建設(shè)中很重要的問(wèn)題。
2.2本體整合
本體整合是本體的語(yǔ)義和解釋范疇的問(wèn)題。本體整合最初由SWAP(Semantic Web and Peer to peer)項(xiàng)目和SEKT(Semantically Enabled Knowledge Technolo―gies)提出,利用本體整合處理本體異質(zhì)(ontology heterogeneity)。Paolo Bouquet等人給出了本體異質(zhì)的詳細(xì)分析,指出在分布式和開(kāi)放式系統(tǒng)中本體異質(zhì)是不可避免的,并根據(jù)本體異質(zhì)產(chǎn)生的原因?qū)⑵鋭澐譃?個(gè)層次:表示層、術(shù)語(yǔ)層、概念層和語(yǔ)義層。Paolo Bouquet等人還認(rèn)為:表示層的異質(zhì)可以通過(guò)翻譯成統(tǒng)一的本體表示語(yǔ)言來(lái)解決;術(shù)語(yǔ)層的異質(zhì)通過(guò)詞匯映射來(lái)解決;概念層異質(zhì)的解決需要通過(guò)對(duì)整個(gè)本體進(jìn)行考慮,查找不一致,進(jìn)行映射或合并;語(yǔ)義層的異質(zhì)可能存在著表示層、術(shù)語(yǔ)層、概念層異質(zhì),還可能存在語(yǔ)義關(guān)系上異質(zhì),目前還沒(méi)有很好的解決方法。
本體映射是本體整合的一個(gè)關(guān)鍵環(huán)節(jié),它通過(guò)一定的方法在已存在的不同本體間建立映射,以便在已存在的和新的領(lǐng)域之間進(jìn)行交流時(shí)有通用的接口和共同的理解。在現(xiàn)實(shí)應(yīng)用中,領(lǐng)域本體規(guī)模都很龐大,利用手工方式,進(jìn)行本體概念比對(duì)完成本體映射時(shí)繁瑣且易錯(cuò),因此是不可行的。目前國(guó)內(nèi)外研究者對(duì)自動(dòng)化本體映射的方法和技術(shù)進(jìn)行了深入研究,其主要特性如表1所示:
從圖1可知:①映射方法上:大多數(shù)的本體映射方法是采用一對(duì)一集成,而一對(duì)多或者多對(duì)多的方法比較少,基本沒(méi)有多對(duì)多的本體集成工具出現(xiàn);②自動(dòng)化程度上:本體映射無(wú)法實(shí)現(xiàn)自動(dòng)化的本體映射,多是半自動(dòng)化的;③計(jì)算方法上:比較單一(除了OntoMap之外);④映射性能上:受到本體構(gòu)建技術(shù)影響比較大。本體映射目前只能夠解決術(shù)語(yǔ)層和概念層的異質(zhì),還無(wú)法涉及到語(yǔ)義層的異質(zhì),如何解決語(yǔ)義層的異質(zhì)是當(dāng)前研究需要重點(diǎn)考慮的問(wèn)題。
2.3語(yǔ)義分析與抽取
數(shù)字圖書(shū)館知識(shí)組織系統(tǒng)的構(gòu)建不僅是多種語(yǔ)義工具的互操作和集成,而且還應(yīng)實(shí)現(xiàn)這些語(yǔ)義工具的機(jī)器可處理和機(jī)器可理解。
國(guó)內(nèi)外學(xué)者對(duì)自然語(yǔ)言理解展開(kāi)了深入研究。國(guó)外的語(yǔ)言學(xué)家、計(jì)算機(jī)學(xué)家、心理學(xué)家和邏輯學(xué)家在語(yǔ)法、句法、詞法、語(yǔ)義分析等方面提出了一系列理論及方法。這些理論和方法大致可歸為三大類(lèi):基于語(yǔ)法的分析法、基于語(yǔ)法與語(yǔ)義相結(jié)合的分析法和基于語(yǔ)義的分析法。國(guó)內(nèi)在理論研究方面尚不深入,但在漢語(yǔ)電子詞典、機(jī)器翻譯、漢語(yǔ)機(jī)讀語(yǔ)料庫(kù)、漢語(yǔ)人機(jī)對(duì)話、漢語(yǔ)情報(bào)檢索等應(yīng)用研究領(lǐng)域也有重大突破。
自然語(yǔ)言理解有賴(lài)于自然語(yǔ)言處理,自然語(yǔ)言處理的基礎(chǔ)是分詞技術(shù)。因?yàn)椋阂环矫,詞是自然語(yǔ)言的基本單元;另一方面,計(jì)算機(jī)以機(jī)器詞典的形式存儲(chǔ)大部分自然語(yǔ)言知識(shí),機(jī)器詞典中收錄了詞條的詞法、句法和語(yǔ)義知識(shí),并在詞類(lèi)知識(shí)基礎(chǔ)上編制句法規(guī)則。因此,自然語(yǔ)言處理系統(tǒng)必須對(duì)“詞”進(jìn)行識(shí)別和處理,才能理解和使用知識(shí)。
另外,由于漢語(yǔ)與其他語(yǔ)種不同,更需要自動(dòng)分詞,國(guó)內(nèi)的許多機(jī)構(gòu)和學(xué)者對(duì)此展開(kāi)了研究。梁南元定義了兩種基本的切分歧義類(lèi)型,而黃昌寧、劉賓、殷建平、文庭孝、尹鋒、丁豐、劉開(kāi)瑛等學(xué)者都進(jìn)行了分詞方法的研究和自動(dòng)分詞系統(tǒng)的研究,可以歸納為基于詞典的分詞方法、基于統(tǒng)計(jì)的分詞方法、基于理解的分詞方法和基于人工智能的分詞方法。這些分詞方法各有其特點(diǎn),分別代表著不同的發(fā)展方向。其中,基于人工智能的分詞方法是目前理論上最為理想的分詞方法,但是該類(lèi)分詞方法的研究還處于初級(jí)階段,并且由于漢語(yǔ)自然語(yǔ)言復(fù)雜靈活,知識(shí)表示困難,所以對(duì)于這類(lèi)分詞技術(shù)還需要進(jìn)行更深入和全面的研究。自動(dòng)分詞系統(tǒng)研究成果主要有清華大學(xué)SEG分詞系統(tǒng)、復(fù)旦分詞系統(tǒng)、北京大學(xué)計(jì)算機(jī)研究分詞系 統(tǒng)和中國(guó)科學(xué)院ICTCLAS系統(tǒng)。另外,國(guó)內(nèi)學(xué)者開(kāi)始重視語(yǔ)義和知識(shí)表示,并有意識(shí)地區(qū)別于英語(yǔ)自然語(yǔ)言理解的研究模式,尋找適合漢語(yǔ)自身的方法。黃曾陽(yáng)的概念層次網(wǎng)絡(luò)(HNC,Hierar―chical Network of Concepts)理論和董振東的知網(wǎng)(How―Net)、東北大學(xué)和北京大學(xué)對(duì)WordNet的漢化等,都在努力探討適用于自然語(yǔ)言處理的新方法。
2.4語(yǔ)義標(biāo)注
語(yǔ)義標(biāo)注(semantic annotation)又稱(chēng)本體標(biāo)注,即利用本體中定義概念、術(shù)語(yǔ)以及語(yǔ)義關(guān)系顯式地揭示和描述數(shù)據(jù)資源的語(yǔ)義。語(yǔ)義標(biāo)注面臨兩大類(lèi)任務(wù):一是如何將當(dāng)前不計(jì)其數(shù)的普通萬(wàn)維網(wǎng)頁(yè)面轉(zhuǎn)換為富含語(yǔ)義信息的語(yǔ)義頁(yè)面,這方面的研究主要集中在語(yǔ)義標(biāo)引工具和語(yǔ)義標(biāo)引平臺(tái)開(kāi)發(fā);二是如何發(fā)布語(yǔ)義頁(yè)面,其核心就是分類(lèi)標(biāo)引,它要求信息發(fā)布者在發(fā)布網(wǎng)絡(luò)信息時(shí)要盡量使用本體中定義的關(guān)系詞匯,同時(shí)還要顯式地表達(dá)出概念所歸屬的語(yǔ)義類(lèi)別,這一任務(wù)也不可能依靠手工的方式完成。因此兩大任務(wù)都轉(zhuǎn)向本體標(biāo)注流程和本體自動(dòng)標(biāo)注工具。研究者對(duì)本體標(biāo)注工具和語(yǔ)義標(biāo)引平臺(tái)進(jìn)行了深入研究,其中,語(yǔ)義標(biāo)引平臺(tái)為IE的實(shí)施、本體和知識(shí)的管理、APIs入口、存儲(chǔ)(RDF倉(cāng)庫(kù))及編輯本體和知識(shí)基礎(chǔ)的用戶(hù)接口提供了支持,F(xiàn)有的語(yǔ)義標(biāo)引平臺(tái)按照標(biāo)引方法的使用類(lèi)型,大體上分為三類(lèi):①基于模式的標(biāo)引;②基于機(jī)器學(xué)習(xí)方面的標(biāo)引;③基于兩種方法融合的標(biāo)引。目前語(yǔ)義標(biāo)引平臺(tái)技術(shù)并不成熟,還不能完全滿足語(yǔ)義互聯(lián)的需要,究其原因主要是:①目前大部分標(biāo)引平臺(tái)是手動(dòng)和半自動(dòng)化的;②學(xué)習(xí)能力不是很強(qiáng),不能通過(guò)自身的不斷學(xué)習(xí)以適應(yīng)不同狀態(tài)下的標(biāo)引和檢索的需要;③可擴(kuò)展性不夠強(qiáng),不能完全無(wú)障礙地與用戶(hù)進(jìn)行交流,以完善自身的知識(shí)庫(kù);④平臺(tái)需要統(tǒng)一各個(gè)用戶(hù)之間的標(biāo)引方式和提供的本體,以提高標(biāo)引精度。
2.5語(yǔ)義互聯(lián)應(yīng)用
2.5.1知識(shí)可視化知識(shí)可視化(knowledge visualiza―tion)是在科學(xué)計(jì)算可視化、數(shù)據(jù)可視化、信息可視化基礎(chǔ)上發(fā)展起來(lái)的新興研究領(lǐng)域,于2004年由Eppler和Burkard率先提出。它是指應(yīng)用視覺(jué)表征手段促進(jìn)群體知識(shí)的傳播與創(chuàng)新,包括所有可以用來(lái)建構(gòu)和傳達(dá)復(fù)雜知識(shí)的圖解手段,F(xiàn)階段,知識(shí)可視化的研究主要為兩個(gè)方向:
研究知識(shí)可視化的表現(xiàn)形式,包括知識(shí)可視化的基礎(chǔ)理論、知識(shí)的可視化表現(xiàn)圖的類(lèi)型、適用范圍和效果。如武漢大學(xué)信息管理專(zhuān)業(yè)學(xué)者對(duì)此做了一系列研究,出版了《信息可視化與知識(shí)檢索》,從信息檢索結(jié)果提供、多媒體信息可視化方面進(jìn)行了綜述性的研究。
可視化的實(shí)現(xiàn),包括知識(shí)可視化的形式化模型和算法以及該理論模型和算法的實(shí)現(xiàn)系統(tǒng)軟件。比如對(duì)于思維導(dǎo)圖(mind map)現(xiàn)階段國(guó)外已經(jīng)有Mind Map Manager、Free Mind Map等應(yīng)用軟件。這個(gè)方向國(guó)內(nèi)研究的主力軍是北京師范大學(xué)知識(shí)工程研究中心,該中心開(kāi)發(fā)了中文概念圖軟件易思一認(rèn)知助手(EasyThinking―Cognitive Assistant)軟件,2007年1月7日已發(fā)布3.0版,將概念圖、思維導(dǎo)圖和一般圖合而為一。
從國(guó)外知識(shí)可視化實(shí)踐進(jìn)展來(lái)看,澳大利亞的紐卡斯?fàn)柎髮W(xué)和皇家墨爾本大學(xué)的Bilal Succar進(jìn)行了信息可視化模型構(gòu)建的研究,在研究中設(shè)計(jì)了可視化知識(shí)模型和研究中所涉及領(lǐng)域的本體。歐洲學(xué)者對(duì)本體的可視化進(jìn)行研究,認(rèn)為信息可視化為本體校準(zhǔn)結(jié)果的評(píng)價(jià)提供了合適的方法。不同層次的細(xì)節(jié)和概論幫助用戶(hù)導(dǎo)航并理解校準(zhǔn),用戶(hù)對(duì)半結(jié)構(gòu)化資源的評(píng)價(jià)涉及到學(xué)習(xí)活動(dòng)。馬來(lái)西亞普渡大學(xué)的學(xué)者設(shè)計(jì)了自動(dòng)語(yǔ)義抽取系統(tǒng)(AME),可視化界面是該系統(tǒng)中的一部分,在設(shè)計(jì)可視化界面時(shí)他們發(fā)現(xiàn)用戶(hù)可以通過(guò)對(duì)概念網(wǎng)絡(luò)結(jié)果的可視化來(lái)將AME系統(tǒng)的利用擴(kuò)展到最大化。用戶(hù)可以搜索一個(gè)概念,并察看這個(gè)概念與其他概念之間的關(guān)系。這些關(guān)系可以通過(guò)“顯示文本”功能被追溯到原始文件中的來(lái)源句子。
2.5.2語(yǔ)義檢索20世紀(jì)80年代國(guó)際信息檢索大會(huì)SIGIR會(huì)議論文中就出現(xiàn)了對(duì)語(yǔ)義檢索的討論,但語(yǔ)義檢索研究始終受到語(yǔ)義信息處理發(fā)展水平的制約。上世紀(jì)末以來(lái),隨著自然語(yǔ)言處理、人工智能的發(fā)展,尤其是語(yǔ)義網(wǎng)技術(shù)的興起與發(fā)展,語(yǔ)義檢索研究得以迅速發(fā)展。盡管到目前為止對(duì)語(yǔ)義檢索在概念上仍沒(méi)有統(tǒng)一的界定,但不同的研究卻有著共同之處,就是基于對(duì)信息資源的語(yǔ)義處理實(shí)現(xiàn)效率更高的檢索。目前語(yǔ)義檢索有兩種,即基于概念的語(yǔ)義檢索和基于本體的語(yǔ)義檢索。前者是根據(jù)概念詞典和關(guān)系數(shù)據(jù)庫(kù)構(gòu)建概念空間實(shí)現(xiàn)語(yǔ)義檢索,具有一定的語(yǔ)義處理能力和自然語(yǔ)言接口,但其概念庫(kù)中不包含概念間關(guān)系的描述,因此無(wú)法處理有關(guān)概念的問(wèn)題;而后者是基于本體構(gòu)建概念空間,將本體融合到傳統(tǒng)信息檢索技術(shù)中,不僅可以繼承概念信息檢索的優(yōu)點(diǎn),還可以克服概念信息檢索不能對(duì)概念關(guān)系進(jìn)行處理的局限。
2.5.3語(yǔ)義互操作數(shù)字圖書(shū)館知識(shí)組織系統(tǒng)互操作主要解決兩個(gè)問(wèn)題:多語(yǔ)言和異構(gòu)。跨語(yǔ)言的互操作問(wèn)題在美國(guó)和歐洲很受重視,美國(guó)數(shù)字圖書(shū)館先導(dǎo)研究計(jì)劃(Digital Library Initiative)中有許多是著眼于解決語(yǔ)義問(wèn)題的,例如伊利諾斯(Illinois)大學(xué)主持的項(xiàng)目中關(guān)于概念空間與分類(lèi)地圖的研究,伯克利(Berkeley)大學(xué)主持的項(xiàng)目中關(guān)于文字歧義消除的研究,卡內(nèi)基?梅隆(Carnegie Mellon)大學(xué)主持的項(xiàng)目中對(duì)于語(yǔ)音識(shí)別的研究以及加州大學(xué)圣塔巴巴拉分校關(guān)于圖像的分割與聚類(lèi)的研究,主要集中于人工智能、統(tǒng)計(jì)規(guī)律識(shí)別技術(shù)等,都屬于語(yǔ)義研究或語(yǔ)義互操作范疇。歐洲相關(guān)的研究項(xiàng)目有MACS、Merimee、Renardus等,甚至嘗試自動(dòng)建立中、英文詞表之間的映射。我國(guó)也有一些關(guān)于雙語(yǔ)數(shù)字圖書(shū)館知識(shí)組織系統(tǒng)互操作的研究,如《漢語(yǔ)主題詞表》與《美國(guó)國(guó)會(huì)圖書(shū)館標(biāo)題表》(LCSH)、本體之間的轉(zhuǎn)換研究、《中國(guó)圖書(shū)館圖書(shū)分類(lèi)法》與杜威十進(jìn)制分類(lèi)法(DDC)類(lèi)目設(shè)置的比較、與DDC對(duì)照系統(tǒng)的研制等。
異構(gòu)數(shù)字圖書(shū)館系統(tǒng)間的互操作的目標(biāo)是實(shí)現(xiàn)不同系統(tǒng)間知識(shí)交換、共享與重用。這方面需要解決的問(wèn)題是:①不同本體之間的互操作。本體雖然為DL的語(yǔ)義互操作提供了解決方案,但其本身也存在著異構(gòu)性,因此不同本體之間的互操作也是DL互操作的一個(gè)重要方面。②跨語(yǔ)言、跨文化的互操作。未來(lái)的DL將是聯(lián)邦數(shù)字圖書(shū)館。建立全球范圍的DL聯(lián)邦,需要解決跨語(yǔ)言、跨文化的互操作問(wèn)題,其中包括比較復(fù)雜的語(yǔ)言翻譯問(wèn)題。③DL的發(fā)現(xiàn)與安全性。實(shí)現(xiàn)全球范圍內(nèi)DL的互操作,需要解決DL的命名和動(dòng)態(tài)發(fā)現(xiàn)。隨著DL逐步走向?qū)嵱没仨毧紤]DL互操作的安全問(wèn)題。
要實(shí)現(xiàn)這一目標(biāo),必須在描述、檢索、對(duì)象交換與檢索協(xié)議等方面取得突破性的進(jìn)展。需要解決的問(wèn)題包括元數(shù)據(jù)的定義和通過(guò)文本或多媒體數(shù)字對(duì)象抽取元數(shù)據(jù),數(shù)字對(duì)象的特征描述計(jì)算,具有不同語(yǔ)義的異構(gòu)資源庫(kù)的整合,信息的聚類(lèi)和自動(dòng)分類(lèi),自動(dòng)排序、分級(jí)算法以及信息質(zhì)量、類(lèi)型或其他屬性的自動(dòng)評(píng)測(cè)等。
3 結(jié)語(yǔ)
隨著本體在數(shù)字圖書(shū)館知識(shí)組織系統(tǒng)中的深入應(yīng)用,如何解決本體建模與復(fù)用、本體整合、本體進(jìn)化和語(yǔ)義互操作問(wèn)題已經(jīng)迫在眉睫。
理論方面,構(gòu)建面向數(shù)字資源組織的領(lǐng)域本體以取代傳統(tǒng)的知識(shí)組織工具,是當(dāng)前圖書(shū)情報(bào)學(xué)界研究的重點(diǎn),看重的是本體所蘊(yùn)含的豐富的語(yǔ)義關(guān)系和強(qiáng)大的推理功能,重視知識(shí)與信息的轉(zhuǎn)化、知識(shí)元的抽取與標(biāo)引、基于知識(shí)元鏈接的知識(shí)網(wǎng)絡(luò)的形成與應(yīng)用、知識(shí)結(jié)構(gòu)的學(xué)科分類(lèi)與完整性以及知識(shí)倉(cāng)庫(kù)和知識(shí)元數(shù)據(jù)庫(kù)的建設(shè)與應(yīng)用。實(shí)踐方面,對(duì)于數(shù)字圖書(shū)館知識(shí)組織工具的本體化改造成為領(lǐng)域的前沿和熱點(diǎn),并已取得了一批重要成果:①使用本體對(duì)傳統(tǒng)知識(shí)組織工具進(jìn)行表示;②使用實(shí)例數(shù)據(jù)豐富現(xiàn)有的知識(shí)組織工具;③在已有知識(shí)組織工具的基礎(chǔ)上豐富其語(yǔ)義關(guān)系和結(jié)構(gòu),進(jìn)而建立本體。
誠(chéng)然,關(guān)于本體構(gòu)建等問(wèn)題仍存在客觀上的困難和問(wèn)題。研究中發(fā)現(xiàn):知識(shí)結(jié)構(gòu)、知識(shí)內(nèi)容的復(fù)雜性和動(dòng)態(tài)性、語(yǔ)義關(guān)系的豐富性、空間秩序的多維性是制約數(shù)字圖書(shū)館知識(shí)組織系統(tǒng)有效結(jié)構(gòu)化和應(yīng)用的瓶頸,尤其是富有語(yǔ)義信息的領(lǐng)域本體的匱乏是數(shù)字圖書(shū)館建設(shè)中的瓶徑,而領(lǐng)域本體構(gòu)建和復(fù)用效率不高、通用性不強(qiáng)限制了數(shù)字圖書(shū)館知識(shí)組織和知識(shí)服務(wù)深度與廣度。我們相信,隨著數(shù)字圖書(shū)館理論研究的深入與實(shí)踐的發(fā)展,對(duì)知識(shí)組織系統(tǒng)的研究也在不斷豐富、發(fā)展和完善之中。
相關(guān)熱詞搜索:熱點(diǎn) 數(shù)字圖書(shū)館 組織 數(shù)字圖書(shū)館知識(shí)組織系統(tǒng)熱點(diǎn)分析 世界知識(shí)產(chǎn)權(quán)數(shù)字圖書(shū)館 wipo知識(shí)產(chǎn)權(quán)數(shù)字圖書(shū)館
熱點(diǎn)文章閱讀