領域本體【基于形式概念分析的領域本體構建方法優(yōu)化研究】
發(fā)布時間:2020-03-07 來源: 歷史回眸 點擊:
[摘要]針對基于形式概念分析(FCA)的領域本體構建方法的優(yōu)化問題進行論述,解決優(yōu)化的四個難點,應用并行開發(fā)的工程思想,采用“分而治之、映射集成”的具體手段,提出一種新的基于FCA的領域本體構建方法并建立“增量模型”。該方法將整個領域本體構建過程分解成核心本體和若干個并行開發(fā)的增量本體的構建過程,而后將核心本體和增量本體通過本體映射和本體集成的手段進行按需組合,最終得到用戶所需領域本體。
[關鍵詞]形式概念分析 領域本體構建方法 增量模型
[分類號]G353
領域本體作為一種有效的形式語義模型和知識表示形式,在圖書情報領域的應用越來越廣泛和深入,這在客觀上促進了領域本體構建方法的不斷涌現和更新;谛问礁拍罘治(FCA)的領域本體構建理論在此背景下應運而生。FCA強調用數學手段來表達客觀知識,可以削弱開發(fā)者對領域本體構建過程的主觀影響,并能挖掘出領域中隱含的概念以及概念之間的層次關系。FCA通過用數學符號從內涵和外延兩方面表示所有概念,達到了形式化概念模型的效果,因此基于FCA的領域本體構建方法越來越倍受國內外相關學者關注和青睞。國內外對基于FCA的領域本體構建方法的研究目前仍然處于探索階段,雖然有些方法有著一定的可取之處,但仍存在著諸多不足,還需不斷地深入研究。
1 國內外基于FCA的領域本體構建方法的簡要分析
目前國外提出的具有代表性的基于FCA的領域本體構建方法主要有:Cimiano方法、GuTao方法、Haav方法、Marek Obitko方法。
Cimiano方法提出了從領域文本出發(fā)自動解析“概念一屬性”關系的基本思路,具有借鑒意義。但該方法使用語言解析器解析出的只有動賓關系,從概念格向領域本體轉換時,以概念節(jié)點的內涵對節(jié)點命名,將概念節(jié)點的外延添加為概念節(jié)點的子節(jié)點,存在不合理性。
GuTao方法提出了領域本體構建中循環(huán)反饋的開發(fā)思想,其開發(fā)的fcatab插件可自動從領域概念和關系得到形式背景,但Fcatab只支持單值形式背景,且必須依托protege本體建模工具。
Haav方法在一定程度上實現了本體的邏輯表述,提出了領域本體的擴充機制,考慮了領域本體的推理。但初始本體到一階謂詞邏輯表示集合的轉換過程需要通過FCA和規(guī)則語言映射,這種映射復雜、費力且不易實現。
Marek Obitko方法提出了一整套對形式背景和概念格的編輯修改機制,值得借鑒;但該方法每次構建都從空的對象和屬性開始,因此對對象和屬性的添加是一項及其復雜的過程,工作量大,只適合小領域本體的構建。
上述方法一是缺少工程化、規(guī)范化、標準化、細節(jié)化的指導思想,僅將著眼點放在領域本體的需求分析、設計與實現三個環(huán)節(jié),忽略了領域本體構建的其他階段;二是未明確二者間的結合機理,以致對兩者之間在哪些方面進行結合以及以何種形式結合的問題理解得不夠深入,從而造成形式背景的構建、概念格到領域本體的映射方式、領域本體的概念關系處理等諸多方面的不合理性。
國內研究人員對該課題的研究起步較晚,大多數研究都停留在對國外方法的綜述或引入上。綜述性文獻中有代表性的是文獻[7]和文獻[8]。引入性文獻中有代表性的是文獻[9],另外文獻[10]嘗試糅合了Cimiano方法與Marek 0bitko方法,但這種糅合缺少深層次的研究討論。
2 基于FICA的領域本體構建方法優(yōu)化的核心問題
2.1 基于FCA的領域本體構建方法優(yōu)化的動因
通過對國內外基于FCA的領域本體構建方法的簡要分析,本文總結了當前各種典型方法的局限性,基于FCA的領域本體構建方法要向前發(fā)展,就必須沖破這些局限性的束縛,打破這些阻礙。本文將基于FCA的領域本體構建方法優(yōu)化的動因總結為以下5個方面:①線性開發(fā)過程一并行開發(fā)過程;②一次性全部提交領域本體一分批次提交領域本體;③簡單領域背景一復雜領域背景;④封閉結構一開放結構;⑤弱復用一強復用。
2.2 基于FCA的領域本體構建方法優(yōu)化的思路
本文對基于FCA的領域本體構建方法的優(yōu)化思路是采用并行開發(fā)的工程思想,應用“分而治之,映射集成”的具體思路,將領域本體劃分為核心本體和一系列的增量本體兩部分:核心本體的目的在于構建滿足領域本體的基本需求的本體,其規(guī)模適中;而增量本體的目的在于實現領域本體的增量需求。這樣,領域本體就可以表達為以下的代數形式:
::={Oc,Oi,Rci,Rii}
其中Oall表示領域本體,Oc表示核心本體,Oi表示增量本體,Rci表示核心本體和增量本體之間的映射集成關系,Rii表示增量本體之間的映射集成關系。
用戶就可以根據實際的需求,按需提取核心本體和增量本體,并按照映射集成機制將所需的本體集成起來,得到所需要的領域本體。這種思路,可以保證領域本體開發(fā)的并行過程,能分批次向用戶提交領域本體,可以將復雜領域背景分解為一系列簡單領域背景,打破封閉式的開發(fā)結構。
2.3 基于FCA的領域本體構建方法優(yōu)化的具體內容
基于FCA的領域本體構建方法的優(yōu)化的具體內容主要包括兩個方面:一是在宏觀上對領域本體構建的過程進行優(yōu)化,改變傳統(tǒng)領域本體構建過程的線性開發(fā)模式,采用并行工程的思想,將領域本體構建過程優(yōu)化為“增量模型”模式;另一方面是在微觀層面上對領域本體設計、領域本體實現過程的優(yōu)化,在“增量模型”的指導下重新調整基于FCA的領域本體設計過程和領域本體實現過程。
3 一種新的基于FCA的領域本體構建方法
3.1 新方法的基本原理
本文提出的基于FCA的領域本體構建方法的基本原理是:應用并行開發(fā)的工程思想,采用“分而治之、映射集成”的具體手段,將整個領域本體構建過程分解成核心本體和若干個并行開發(fā)的增量本體的構建過程。換言之,就是領域形式背景根據相關理論分解成若干個兼容子背景,進而分別根據子背景構建概念格,得到概念層次模型和本體原型,進而通過領域本體的擴充和形式化描述,得出相應的核心本體和增量本體,最終將核心本體和增量本體通過本體映射和本體集成的手段進行按需組合,得到知識用戶所需的領域本體。
3.2 新方法的模型構建
基于FCA的領域本體構建方法涉及到方方面面的復雜問題,要把握住該方法的本質,只有通過建模的手段,對基于FCA的領域本體構建方法進行不同側面或不同層次的抽象。本文擬對所提出的新的基于FCA的領域本體構建方法從兩個層面上進行建模:一是對該方法宏觀上的描述,即建立該方法的總體模型(根據其特征稱為增量模型);二是對該方法微觀上的把握,即對如何利用FCA完成領域本體的設計、編碼、映射、集成和測試等微觀操作進行建模,建立該方法的微觀模型。
本文提出的基于FCA的領域本體構建方法的增量模型如圖1所示:
具體來講,各個模塊主要完成的任務或功能如下:①制定計劃模塊:明確領域本體開發(fā)項目的進度安排,調度項目所需要的各類資源,對領域進行初步調查,并充分考慮建立領域本體所受到的種種約束,研究構建該領域本體的必要性和可行性,做出可行性研究報告?尚行匝芯繄蟾嬖u審通過之后,編寫成領域本體開發(fā)計劃書。②領域本體分析模塊:對領域本體進行以下方面的詳細分析:領域范圍、構建的原因、建好后的用途、形式化程度、用戶范圍等。最重要的是對領域本體的需求分析。通過對領域本體進行上述分析,編制領域本體分析說明書。③領域本體概要設計模塊:應用形式概念分析理論,從領域基礎數據出發(fā),通過預處理,將領域本體從概要上劃分成表達領域本體基本需求的核心本體和一系列表達領域本體增量需求的增量本體兩個部分。形成領域初始形式背景并將之劃分成核心背景和一系列增量兼容子背景,編寫領域本體概要設計說明書。④基于FCA的領域本體詳細設計、實現、映射、集成和測試模塊:從核心子背景或各兼容子背景出發(fā),通過概念格轉換,概念層次模型生成的過程,把得出的概念層次模型轉換成相應的本體原型,并對原型進行合理擴充,通過選擇合適的本體描述語言,進行本體的形式化描述,最后在本體映射機制的指導下,將各個增量本體根據需求集成到核心本體當中,經過領域本體測試,排除錯誤。形成領域本體詳細設計說明書、編碼清單和測試報告。⑤領域本體維護模塊:領域本體試航,追尋潛在的錯誤。維護的具體內容包括改正性維護、適應性維護、完善性維護和預防性維護,最終形成維護報告。
對宏觀模型的領域本體設計實現映射集成環(huán)節(jié)進行深入地分析和研究,就可以得出如圖2所示的基于FCA的領域本體構建方法的微觀模型:
其中,各模塊的主要任務是:①形式背景(核心或兼容子背景)處理模塊:從核心子背景或增量兼容子背景出發(fā),判斷各個子背景是否為多值背景,若是,則通過相關轉換技術將多值背景單值化,最終形成單值形式子背景。②概念格處理模塊:將上步形成的單值子背景通過概念格構造算法轉化為概念格,并由hasse圖的形式顯化出來,在可視化的基礎上對概念格是否合理進行判斷,對不合理的概念格按照一定的規(guī)則進行對象編輯或屬性編輯,循環(huán)之,直至出現較為滿意的概念格。③概念層次生成模塊:將概念格轉換為概念層次模型,主要包括底端節(jié)點處理(直接刪除)、節(jié)點關系處理(轉化為概念層次關系)及頂端節(jié)點處理(轉化為根概念)三個方面。模塊的輸出結果是領域本體概念層次模型。④領域本體原型及其擴充模塊:根據領域本體概念層次模型,將每個概念節(jié)點標示為一個領域本體概念,概念層次關系映射為領域本體概念分類關系,從而實現領域本體層次模型向領域本體原型的轉換。而后在領域專家的參與下,對領域本體原型進行屬性擴充、實例擴充、公理擴充,最終形成擴充后的領域本體原型。⑤領域本體形式化描述模塊:選擇合適的本體描述語言(如owl語言),對擴充后的領域本體原型進行形式化描述,最終得到領域核心本體或增量本體。⑥領域本體映射集成模塊:通過本體映射判斷核心本體和增量本體以及增量本體和增量本體之間的關系,可以此為基礎進行本體集成操作,即根據用戶需求將增量本體集成到核心本體中。
本文所提出的增量模型和微觀模型的每一個模塊實質上對應的是基于FCA的領域本體構建方法的一個步驟,因此,本文提出的基于FCA的領域本體構建方法的步驟就可以通過對模型的細化得出,在此不做贅述。
3.3 新方法的優(yōu)點
與當前主流的四種基于FCA的領域本體構建方法相比,本文提出的基于FCA的領域本體構建方法更具有優(yōu)勢。本文通過表1分別從18個方面對優(yōu)化后的新方法與優(yōu)化前的方法進行了定性的對比分析來闡明新方法的優(yōu)勢:
4 結語
基于FCA進行領域本體構建的諸多優(yōu)勢隨著對該方法的不斷深入認識和討論而越來越被國內外學者關注和接受。然而相應的基于FCA的領域本體構建方法理論尚沒有形成統(tǒng)一的觀點。本文借鑒軟件工程中并行開發(fā)思想,采用“分而治之,映射集成”的思路提出了一種新的基于FCA的領域本體構建方法,解決了當前方法所不能解決的一些問題。盡管如此,本文所提出的方法受領域本體映射技術和集成技術的影響仍有局限性,還有待于進一步深入研究,因此,基于FCA的領域本體映射技術和集成技術將成為本文后續(xù)的研究方向。
相關熱詞搜索:本體 構建 形式 基于形式概念分析的領域本體構建方法優(yōu)化研究 計算思維是運用計算機科學的基礎概念進行 目標管理的概念和特點
熱點文章閱讀