东方亚洲欧a∨人在线观看|欧美亚洲日韩在线播放|日韩欧美精品一区|久久97AV综合

        本體感覺(jué)評(píng)估量表 本體評(píng)估工具的比較分析

        發(fā)布時(shí)間:2020-03-07 來(lái)源: 歷史回眸 點(diǎn)擊:

          [摘要] 對(duì)ODEval、OntoQA、Core、OntoManager四個(gè)本體評(píng)估工具的系統(tǒng)結(jié)構(gòu)體系進(jìn)行分析,從工具所用的評(píng)估方法、工具的評(píng)估機(jī)制、工具的使用者、工具的作用范圍、工具的可操作性及有效性5個(gè)層面進(jìn)行比較分析,明確其各自側(cè)重點(diǎn)和差異,以幫助本體開(kāi)發(fā)者及最終用戶(hù)選擇適合自身需要的在國(guó)際范圍應(yīng)用廣泛、具備發(fā)展前景的本體評(píng)估工具。
          [關(guān)鍵詞] 本體評(píng)估工具 ODEval OntoQA Core OntoManager 工具比較
          [分類(lèi)號(hào)] G354.2
          
          1 引 言
          
          目前,本體通過(guò)提供某個(gè)特定領(lǐng)域的相關(guān)概念及這些概念之間的關(guān)系而廣泛應(yīng)用于知識(shí)工程、信息組織及語(yǔ)義Web等各個(gè)方面。隨著本體體系的發(fā)展,對(duì)本體進(jìn)行評(píng)估成為本體發(fā)展中的關(guān)鍵問(wèn)題。一方面,本體評(píng)估對(duì)于指導(dǎo)本體構(gòu)建過(guò)程并保證所構(gòu)建本體最大程度地滿(mǎn)足應(yīng)用需求起重要作用;另一方面,最終用戶(hù)選擇最符合自身需要的本體時(shí),本體評(píng)估也是必不可少的。此外,本體評(píng)估在本體重用、自動(dòng)或半自動(dòng)的本體學(xué)習(xí)技術(shù)以及本體管理與規(guī)范化建設(shè)中都有著重要作用。
          我國(guó)關(guān)于本體的建設(shè)與研究尚處在不斷完善的過(guò)程中,對(duì)本體的評(píng)估研究才剛剛起步,國(guó)外對(duì)于本體的評(píng)估已受到專(zhuān)家學(xué)者關(guān)注。本文基于目前國(guó)內(nèi)外本體評(píng)估方法類(lèi)型及其研究現(xiàn)狀,選擇并分析了目前應(yīng)用比較廣泛的四種本體評(píng)估工具ODEval、OntoQA、Core、OntoManager,旨在通過(guò)對(duì)這些工具的比較研究幫助本體開(kāi)發(fā)者及最終用戶(hù)選擇適合自身需要的評(píng)估工具,并促進(jìn)本體的規(guī)范化建設(shè)。
          
          2 本體評(píng)估方法
          
          本體評(píng)估的核心是評(píng)估角度的全面化,即以多維視角的評(píng)估內(nèi)容來(lái)綜合衡量本體的質(zhì)量。當(dāng)前研究者從不同角度提出各種類(lèi)型的本體評(píng)估方法,如Onto-Metric、oQual、OntoClean等,綜合各類(lèi)方法,Jannz Brank等人把本體評(píng)估方法分為以下四類(lèi):
          ?基于“黃金標(biāo)準(zhǔn)”的方法,即將所構(gòu)建的本體與一個(gè)現(xiàn)有公認(rèn)的比較成熟的“黃金標(biāo)準(zhǔn)”進(jìn)行比較,羅列出其不足并進(jìn)行改進(jìn)。
          ?基于本體應(yīng)用的方法,即在一個(gè)特定應(yīng)用環(huán)境如語(yǔ)義網(wǎng)、信息檢索中,測(cè)試一組本體以確定適合該應(yīng)用的本體。
          ?基于語(yǔ)料庫(kù)的方法,即使用術(shù)語(yǔ)抽取算法從語(yǔ)料庫(kù)中抽出術(shù)語(yǔ),計(jì)算被本體覆蓋的術(shù)語(yǔ)數(shù)量,或是用一個(gè)向量來(lái)表示本體和語(yǔ)料庫(kù),然后計(jì)算本體向量與語(yǔ)料向量之間的差距。
          ?基于一套預(yù)先定義好的原則和必要條件等進(jìn)行評(píng)估的方法,其多是從構(gòu)建本體的原則來(lái)評(píng)估本體。
          隨著越來(lái)越多本體評(píng)估方法的提出,創(chuàng)建能夠運(yùn)用這些方法從而使評(píng)估工作更易進(jìn)行的本體評(píng)估工具就顯得越來(lái)越重要。筆者選用的四個(gè)本體評(píng)估工具:ODEval、OntoQA、Core、OntoManager的創(chuàng)建都使用了上述一種或幾種方法,它們基于本體的不同側(cè)面來(lái)檢測(cè)本體構(gòu)建規(guī)劃、本體構(gòu)建過(guò)程、本體應(yīng)用以及本體維護(hù)等階段出現(xiàn)的問(wèn)題或錯(cuò)誤,包括本體句法層面的正確與否、本體設(shè)計(jì)結(jié)構(gòu)上的合適與否以及本體相對(duì)于領(lǐng)域知識(shí)表示完整與否等。
          
          3 國(guó)外現(xiàn)有本體評(píng)估工具
          
          3.1 ODEval
          ODEval是Corcho等人于2004年提出的,從知識(shí)表示角度評(píng)估用RDF(s)、DAML+OIL和OWL語(yǔ)言表示的本體的本體評(píng)估工具。
          ODEval使用基于圖理論的運(yùn)算法則來(lái)檢測(cè)本體概念分類(lèi)存在的問(wèn)題。在這個(gè)運(yùn)算法則中,把本體的概念類(lèi)看作一個(gè)定向的曲線(xiàn)圖G(V,A),其中V是一組節(jié)點(diǎn),A是一組定向的弧線(xiàn)。節(jié)點(diǎn)集V和弧線(xiàn)集A所表示的具體元素因表示本體語(yǔ)言和問(wèn)題類(lèi)型的不同而有所差異。如表1所示:
          
          
          3.2 OntoQA
          OntoQA是Samir等人于2005年提出的結(jié)合了用戶(hù)需要對(duì)本體進(jìn)行評(píng)估的工具。OntoQA提供具體的指標(biāo)來(lái)定量評(píng)估本體的質(zhì)量。評(píng)估指標(biāo)分為兩類(lèi):模式(schema)指標(biāo)和實(shí)例(instance)指標(biāo)。模式指標(biāo)組指用來(lái)評(píng)估本體結(jié)構(gòu)設(shè)計(jì)的指標(biāo);實(shí)例指標(biāo)組指評(píng)估本體內(nèi)實(shí)例分布的指標(biāo),包括知識(shí)庫(kù)指標(biāo)和類(lèi)指標(biāo)。知識(shí)庫(kù)指標(biāo)將知識(shí)庫(kù)作為一個(gè)整體來(lái)評(píng)估,類(lèi)指標(biāo)評(píng)估本體結(jié)構(gòu)中定義的類(lèi)在知識(shí)庫(kù)中的運(yùn)用方式。如表2所示:
          
          
          3.3 Core
          Core(Collaborative Ontology Reuse and Evaluationsystem)是Femdndez等人于2006年提出的基于本體排列的應(yīng)用于本體重用和本體評(píng)估的工具。Core根據(jù)已選出的標(biāo)準(zhǔn)準(zhǔn)則來(lái)評(píng)估本體,這個(gè)準(zhǔn)則涉及黃金標(biāo)準(zhǔn)和用戶(hù)需要兩個(gè)方面。在黃金準(zhǔn)則方面,Core通過(guò)詞匯評(píng)估層面和分類(lèi)評(píng)估層面對(duì)本體進(jìn)行評(píng)估。詞匯評(píng)估層面使用一套詞匯評(píng)估方法評(píng)估黃金標(biāo)準(zhǔn)和所選本體的相似性,通過(guò)比較表示它們所描述領(lǐng)域的詞匯條目來(lái)實(shí)現(xiàn);分類(lèi)評(píng)估層面評(píng)估所選本體的“is-a”層級(jí)結(jié)構(gòu)和黃金標(biāo)準(zhǔn)結(jié)構(gòu)的重疊程度。在此基礎(chǔ)上,Core通過(guò)以下三個(gè)模塊組成的體系結(jié)構(gòu)來(lái)完成對(duì)一系列相關(guān)本體的評(píng)估:
          ?黃金標(biāo)準(zhǔn)技術(shù)設(shè)計(jì)模塊:用戶(hù)通過(guò)自然語(yǔ)言處理從其感興趣的相關(guān)文檔中得出根詞匯,并使用WordNet和它提供的同義及反義關(guān)系擴(kuò)展根詞匯,以此構(gòu)建包含新詞匯的詞匯黃金標(biāo)準(zhǔn)。
          ?系統(tǒng)推薦模塊:用戶(hù)選擇一套評(píng)估準(zhǔn)則,然后根據(jù)這套準(zhǔn)則將所要評(píng)估的本體與黃金標(biāo)準(zhǔn)進(jìn)行比較,選出并按相似度排列與黃金標(biāo)準(zhǔn)接近的本體。
          ?協(xié)作性評(píng)估模塊:本體的某些特征(例如可讀性、靈活性等)無(wú)法通過(guò)自動(dòng)化的機(jī)器直接進(jìn)行評(píng)估,因此需要用戶(hù)參與,此模塊綜合用戶(hù)需要及上述評(píng)估結(jié)果得出最終排序。
          
          3.4 OntoManager
          OntoManager是Nenad等人于2002年提出的一個(gè)適于本體工程師、領(lǐng)域?qū)<壹靶袠I(yè)分析家使用的管理系統(tǒng),它可以根據(jù)用戶(hù)需要找出不足以促進(jìn)本體完善,并能促進(jìn)管理人員問(wèn)責(zé)制的發(fā)展。其主要任務(wù)是通過(guò)收集用戶(hù)應(yīng)用本體的交互性數(shù)據(jù)來(lái)了解用戶(hù)需求,以避免通過(guò)調(diào)查問(wèn)卷等繁瑣方式獲取數(shù)據(jù),從而評(píng)估本體滿(mǎn)足用戶(hù)需求情況。
          OntoManage的實(shí)現(xiàn)基于概念體系結(jié)構(gòu)MAPE(Mo―nitor Analyze Plan Execute)模型,其把管理體系機(jī)構(gòu)提煉為四個(gè)功能:①監(jiān)控功能,收集、整理并過(guò)濾用戶(hù)使用本體的交互性數(shù)據(jù);②分析功能,整合所收集到的數(shù)據(jù)并使其可視化,提出本體修改建議;③計(jì)劃功能,規(guī)劃出適用于本體修改的行動(dòng);④執(zhí)行功能,根據(jù)對(duì)本體做出的調(diào)整,更新本體的應(yīng)用。整體來(lái)看,OntoManager由三個(gè)模塊組成:
          ?數(shù)據(jù)整合模塊:整合、收集、預(yù)處理并組織用戶(hù)應(yīng)用本體的行為信息數(shù)據(jù)。
          ?可視化模塊:把上述數(shù)據(jù)以易于理解的可視化形式表示出來(lái),即通過(guò)圖表、表格、條形圖等方式來(lái)實(shí)現(xiàn)。
          ?分析模塊:引導(dǎo)本體進(jìn)行改變以適應(yīng)用戶(hù)需要,從而完成本體進(jìn)化完善以及實(shí)例抓取兩項(xiàng)任務(wù)。   
          4 本體評(píng)估工具的比較分析
          
          不同的本體評(píng)估工具是從不同的視角針對(duì)不同領(lǐng)域的、不同類(lèi)型的、用不同知識(shí)表示形式表示的本體而創(chuàng)建的,且沒(méi)有一個(gè)本體評(píng)估工具能成功解決本體存在的所有問(wèn)題。我們從評(píng)估方法、評(píng)估機(jī)制、使用者、作用范圍、可操作性及有效性等指標(biāo)來(lái)比較上述四種本體評(píng)估工具。指標(biāo)的比較如表3所示:
          
          
          4.1 工具所用評(píng)估萬(wàn)法
          本體評(píng)估工具都是使用一定的評(píng)估方法來(lái)創(chuàng)建的,在選用評(píng)估方法上,本體評(píng)估工具會(huì)針對(duì)評(píng)價(jià)的重點(diǎn)及其評(píng)估視角來(lái)做相應(yīng)選擇。
          ODEval基于邏輯規(guī)則視角,通過(guò)本體表示語(yǔ)言的邏輯規(guī)則來(lái)評(píng)估本體。其使用了基于原則的評(píng)估方法。盡管目前一些本體剖析器和本體平臺(tái)可用于檢測(cè)用RDF(s)、DAML+OIL和OWL語(yǔ)言表示的本體,例如ICS-FORTH Validating RDF parser、OWL Validator等,但它們只能檢測(cè)出簡(jiǎn)單的循環(huán)問(wèn)題,而對(duì)于分割錯(cuò)誤和冗余問(wèn)題大多束手無(wú)策,而該工具可有效地評(píng)估本體內(nèi)容中的不一致和冗余。
          OntoQA、Core都是基于指標(biāo)視角的評(píng)估工具,利用指標(biāo)的綜合性從不同方面評(píng)估本體。OntoQA使用了基于語(yǔ)料庫(kù)和基于原則的綜合評(píng)估方法,通過(guò)具體指標(biāo)幫助用戶(hù)分析所選本體的適用性,Core使用了基于黃金標(biāo)準(zhǔn)和基于應(yīng)用的評(píng)估方法來(lái)對(duì)本體進(jìn)行評(píng)估并排序以供選擇適用性高的本體。
          OntoManager基于本體進(jìn)化視角,通過(guò)總結(jié)本體生命周期的變化來(lái)評(píng)估本體,例如領(lǐng)域知識(shí)的變化導(dǎo)致的本體內(nèi)容結(jié)構(gòu)的變化、本體知識(shí)表示語(yǔ)言的相互轉(zhuǎn)化所導(dǎo)致的格式變化等。其使用了基于用戶(hù)應(yīng)用的評(píng)估方法,分析用戶(hù)使用數(shù)據(jù)來(lái)持續(xù)管理、評(píng)估并完善本體。
          
          4.2 工具的評(píng)估機(jī)制
          ODEval作用于本體模型創(chuàng)建階段,它執(zhí)行RDF(s)、DAML+OIL和OWL本體的句法評(píng)估,它使用基于圖理論的自動(dòng)檢測(cè)程序,通過(guò)對(duì)本體表示語(yǔ)言中詞條的檢測(cè)來(lái)檢測(cè)本體創(chuàng)建過(guò)程中出現(xiàn)的本體概念分類(lèi)的不一致和冗余等問(wèn)題。OntoQA將所設(shè)計(jì)的評(píng)估指標(biāo)存儲(chǔ)于基于Java語(yǔ)言的程序原型中,運(yùn)用SeasameRDF store來(lái)下載本體的模式和知識(shí)庫(kù),形成OntoQA本體評(píng)估工具。Core根據(jù)已選出的標(biāo)準(zhǔn)準(zhǔn)則通過(guò)自動(dòng)相似度檢測(cè)方法對(duì)一組本體進(jìn)行排序,即從其提供的標(biāo)準(zhǔn)準(zhǔn)則中選擇一個(gè)子集,而基于每種標(biāo)準(zhǔn)都可以得出一個(gè)本體排序,然后使用能把這些標(biāo)準(zhǔn)綜合起來(lái)考慮的融合性排序技術(shù)并結(jié)合用戶(hù)需要得出最終的本體排序。OntoManager通過(guò)門(mén)戶(hù)網(wǎng)站或應(yīng)用來(lái)關(guān)注最終用戶(hù)需求,即跟蹤用戶(hù)在日志文檔中應(yīng)用的交互作用,收集有用的能夠用于評(píng)估用戶(hù)主要興趣域的信息,通過(guò)這種信息的變化來(lái)尋找并及時(shí)反映本體領(lǐng)域知識(shí)所發(fā)生的變化,以此來(lái)評(píng)估并不斷地完善本體,此機(jī)制表示為一個(gè)“使用環(huán)”,如圖1所示:
          
          
          4.3 工具的使用者
          本體評(píng)估工具的使用者包括本體開(kāi)發(fā)者和最終用戶(hù)。前者包括本體構(gòu)建者、本體管理人員等領(lǐng)域?qū)<。本體開(kāi)發(fā)者需要評(píng)估工具來(lái)完善本體;用戶(hù)需要評(píng)估工具來(lái)對(duì)一組內(nèi)容相近的本體的質(zhì)量進(jìn)行評(píng)估從而選擇最適合其需要的本體。Sabou等認(rèn)為本體選擇和本體評(píng)估相互補(bǔ)充,起過(guò)濾作用的本體選擇是先于本體質(zhì)量評(píng)估的,且用戶(hù)角度的本體評(píng)估工具有助于本體選擇和本體評(píng)估的實(shí)施。目前隨著本體使用范圍的擴(kuò)大,研究人員也開(kāi)始關(guān)注最終用戶(hù)對(duì)本體的評(píng)估。
          ODEval和OntoManager的使用者是本體開(kāi)發(fā)者。ODEval適用于創(chuàng)建本體階段的使用;OotoManager適用于本體構(gòu)建完成后本體的更新完善階段的使用。On-toQA和Core的使用者既包括本體開(kāi)發(fā)者也包括最終用戶(hù)。OntoQA是從用戶(hù)視角創(chuàng)建的,為了更大程度地滿(mǎn)足用戶(hù)在評(píng)估本體質(zhì)量基礎(chǔ)上選擇本體的需求;Core的實(shí)施在自動(dòng)檢測(cè)方法的基礎(chǔ)上也需要最終用戶(hù)的參與,以用戶(hù)評(píng)價(jià)結(jié)果為重要組成部分。
          
          4.4 工具的作用范圍
          Guarino把本體類(lèi)型分為頂層本體、領(lǐng)域本體、任務(wù)本體和應(yīng)用本體。頂層本體通常表達(dá)的是常識(shí)性概念,如空間、時(shí)間、事件、行為等,與具體應(yīng)用無(wú)關(guān)。頂層本體可能沒(méi)有實(shí)例填充,而其他本體在被構(gòu)造好之后需要人工或自動(dòng)、半自動(dòng)化填充實(shí)例。有的本體評(píng)估工具僅作用于本體的模式而忽略了在被填充本體的知識(shí)庫(kù)中運(yùn)用的知識(shí)。
          ODEval因?yàn)槠涫褂糜诒倔w模型構(gòu)建階段,只作用于本體的模式,而OntoQA、Core、OntoManager既作用于本體模式,也作用于本體的知識(shí)庫(kù),這樣既對(duì)本體概念體系做出了相應(yīng)的合適度評(píng)估,也對(duì)本體中實(shí)例分布情況、豐富程度、實(shí)例反應(yīng)領(lǐng)域知識(shí)情況等做出了更全面的評(píng)估。
          
          4.5 工具的可操作性及有效性
          ODEval是一種自動(dòng)檢測(cè)工具,沒(méi)有最終用戶(hù)使用界面,但它易于被本體開(kāi)發(fā)者所掌握,從而幫助本體開(kāi)發(fā)者設(shè)計(jì)出沒(méi)有知識(shí)概念分類(lèi)異常的本體。
          OntoQA、Core、OntoManager都包含從用戶(hù)角度進(jìn)行評(píng)估的層面,可以確保在開(kāi)發(fā)本體過(guò)程中所產(chǎn)生的建議反映用戶(hù)的需要。OntoQA有易于操作的用戶(hù)界面,且OntoQA正嘗試開(kāi)發(fā)可適用于Web的評(píng)估界面,適用范圍會(huì)更廣。
          Core有易于操作的用戶(hù)界面,適用于本體評(píng)估和本體重用。用戶(hù)可根據(jù)自身需要對(duì)頁(yè)面上的指標(biāo)進(jìn)行設(shè)置從而得出最符合自身需要的本體排序,參考價(jià)值高,可操作性強(qiáng)。
          OntoManager根據(jù)用戶(hù)需求來(lái)支持本體的管理和優(yōu)化,它是一個(gè)易于管理人員使用的管理系統(tǒng),但很難有深入的評(píng)估,不適合最終用戶(hù)使用。

        相關(guān)熱詞搜索:本體 評(píng)估 工具 本體評(píng)估工具的比較分析 本體評(píng)估方法研究綜述 本體評(píng)估方法研究

        版權(quán)所有 蒲公英文摘 smilezhuce.com