东方亚洲欧a∨人在线观看|欧美亚洲日韩在线播放|日韩欧美精品一区|久久97AV综合

        工業(yè)自動化儀表領域本體的構建研究:領域本體構建

        發(fā)布時間:2020-03-07 來源: 美文摘抄 點擊:

          摘要 介紹本體構建的意義,指出創(chuàng)建本體庫是實現(xiàn)智能檢索的關鍵,通過簡單綜述國內外本體構建的現(xiàn)狀,指出我國本體構建的不足,并總結現(xiàn)有的本體構建原則和本體構建方法。在此基礎上,提出工業(yè)自動化儀表領域本體構建的方法,并重點詳述工業(yè)自動化儀表領域本體構建的流程,闡明其先進性和易操作性,最后指出此構建方法和流程可以推廣應用于其他領域。
          關鍵詞 儀表 本體 領域本體 構建方法 OWL
          分類號 TP31
          
          1 引言
          
          大量研究表明,創(chuàng)建本體庫是實現(xiàn)智能檢索的關鍵,具體表現(xiàn)在:
          ?語義理解的基礎。通過創(chuàng)建本體庫,為系統(tǒng)提供了規(guī)范化的領域概念模型,這種形式化的模式給出了概念及概念間關系的明確定義,建立了人機對系統(tǒng)信息的共同認識,為智能檢索提供了語義理解基礎。
          ?概念匹配的檢索機制。由本體所提供的領域知識體系提高了用戶需求理解和資源描述的準確度,將傳統(tǒng)的檢索機制由關鍵字匹配轉變?yōu)楦拍詈蛢热莸钠ヅ,從而提高了信息檢索系統(tǒng)的檢索效率。
          ?知識表示、共享和重用。本體知識體系的表示是“機器可處理”的語義,它以RDF為基礎,以XML為語法,將不同的應用集成在一起,對Web上的數(shù)據(jù)進行抽象表示,允許跨越不同應用程序、企業(yè)和團體進行知識的共享、重用和獲取。
          然而,目前可供借鑒的、完善的本體庫很少,這種現(xiàn)象在我國尤為突出。為此,本文構建了工業(yè)自動化儀表領域本體庫。一方面,它為項目組數(shù)據(jù)共享系統(tǒng)實現(xiàn)智能檢索奠定了基礎;另一方面,它使知識在系統(tǒng)中規(guī)范化地表示出來,有利于相關領域實現(xiàn)知識復用。
          目前,國內外開發(fā)了許多智能化搜索引擎系統(tǒng),如國外的大學的STASIS、ProNet、ImportNET項目、浙江大學吳朝暉教授開發(fā)的中醫(yī)藥本體在線編輯和維護方BFO、COSMO、PRO、SWEET等以及我國清華法以及人工智能研究所基于本體論的產品配置研究,此外,還有中國農業(yè)科學院科技文獻信息中心的AOS(AgricultureOntologyService)等項目。領域本體庫的構建為這些項目的順利實施提供了保障。目前,國外已經建立了許多知名的本體庫,如ontoselect、DMOZ、DAML等,部分知名的本體庫和網(wǎng)址如表1所示:
          然而,在我國,本體研究整體上處于起步和摸索階段,完善的、規(guī)模較大的本體庫并不多,本體構建一般仍采用手工方式,這在一定程度上影響了我國本體庫建沒的規(guī)模和本體庫的實際應用,進而阻礙了我國智能化搜索引擎的研究進程。
          
          2 工業(yè)自動化儀表領域本體的構建方法
          
          Gruber在1995年提出的本體構建5原則影響最大。盡管10多年過去了,但目前構建本體通常仍遵循這5條原則,即:明確性和客觀性、完整性、一致性、最大單向可擴展性、最少約束。常見的本體構建方法有:Enterprise法、TOVE法和七步法等。其中,斯坦福大學的七步法成熟度最高,目前國內外很多領域在構建本體庫時大多采用這種方法。
          然而,無論是本體構建原則還是本體構建方法都應該靈活變通。除了遵循“Gruber 5原則”以外,一個優(yōu)良的本體模型還應該是“有用”的,即在面向特定的應用時,所需的領域本體最終能應用于實踐。另外,隨著相關技術的發(fā)展,本體構建方法也應該在一定程度上加以改進。為此,我們結合國內外現(xiàn)有的技術基礎,對斯坦福大學的七步法進行了修改,形成了“工業(yè)自動化儀表領域本體構建七步法”(以下簡稱“IAIOnto七步法”),如圖1所示:
          
          如圖1所示,構建領域本體庫首先需確定其領域和范疇,接著收集并整理大量基礎資料,然后,確定領域概念的類體系結構和關系、屬性以及實例,通過編程將其批量導入到本體結構中,接著在本體編輯工具中對本體結構進行修改和完善,最后對領域小體庫進行更新和維護,如果發(fā)現(xiàn)新的概念、關系等再重復以上步驟。其中第3、4、5步是通過編程實現(xiàn)的,具體為調用Jena API,并通過編程將相關概念等導入本體結構,最后存儲為owl文件。鑒于Prot6g6是一個免費的、功能強大的、開源的本體構建軟件,所以第6步中,項目組選擇Protege對編程構建的本體結構進行更加直觀的修改和完善。IAIOnto構建方法通過編程實現(xiàn)了大規(guī)模領域本體庫的構建,更新維護更加方便、易操作,且可以推廣應用于其他領域。
          
          3 工業(yè)自動化儀表領域本體構建流程
          
          3.1 確定本體的專業(yè)領域和范疇
          構建IAIOnto是國際科技合作項目“基于知識管理的數(shù)據(jù)共享關鍵技術研究”的重要內容之一,該項目依托于國家科技基礎條件平臺項目“先進制造與自動化科學數(shù)據(jù)共享網(wǎng)”。該項目組擁有大量儀器儀表領域數(shù)據(jù)和多位儀表領域權威專家,因此,將儀器儀表領域作為本體構建的專業(yè)領域;另外,由于“共享網(wǎng)”側重于機械和自動化,并且儀表領域中的工業(yè)自動化儀表資源最為豐富和成熟,因此,首先確定以工業(yè)自動化儀表為范疇構建儀表領域本體,最終歸納一會建立領域本體的模式和方法,在“共享網(wǎng)”的其他專業(yè)領域進行推廣和應用。
          3.2 搜集基礎材料,對材料整理加工
          本體是共享概念模型的形式化規(guī)范說明。其共享性、規(guī)范性等要求其概念必須被大眾所接受,并囊括該領域所有基本概念。因此,需要收集大量該領域的基礎資料,使本體概念的選擇等有據(jù)可依。有鑒于此,項目組從五個方面收集資料,如圖2所示:
          
          ?《儀器儀表主題詞表》:共包括18個領域范疇、4481個主題詞,選取其中最相關的儀表元件、儀表材料、工業(yè)自動化儀表等作為本體類層次結構的主體;
          ?《中國圖書館分類法》:其中工業(yè)技術中的儀器儀表相關概念是本體構建過程中概念參考的重要信息,如聲學儀器、真空測試及儀器、礦山測量儀器與工具等大類及下位類;
          ?產品規(guī)格數(shù)據(jù)庫:共包括1萬多種儀表產品,是本體屬性集、標準實例集和儀表實例集自動提取的主要數(shù)據(jù)來源;
          ?廠商數(shù)據(jù)庫:共包括4000多家儀表領域知名企業(yè),是本體廠商實例集自動提取的主要數(shù)據(jù)來源;
          ?儀表網(wǎng):是本體實例集等數(shù)據(jù)提取的重要來源,其中儀表數(shù)據(jù)的元數(shù)據(jù)信息是屬性的重要參考。
          3.3 確定類體系結構以及類之間的關系
          構建具有一定規(guī)模的本體是一個系統(tǒng)工程,每一個概念、關系或規(guī)則的添加都必須嚴格謹慎,應該基于一定的理論基礎并遵循一定的領域知識。另外,還需要考慮所添加概念、關系、規(guī)則等的有用性以及系統(tǒng)的可行性。
          根據(jù)需要增添儀表廠商、標準規(guī)范等頂層類,最終形成5個頂層類的體系結構。邀請儀器儀表領域專家,參照《儀器儀表主題詞表》和專業(yè)詞典,進行概念的抽提、去重、語義分析和歸并,并參照中圖法中的概念對現(xiàn)有體系結構進行必要調整,調用Jena API將類層次結構導入本體,形成一個龐大的IAIOnto體系結構。結合本體概念之間固有的聯(lián)系、本體的用途等建 立類概念之間的關系,如圖3、圖4所示:
          3.4 添加屬性
          類和關系只是描述了一個領域的體系框架,還不能確切地、真實地描述一個領域,需要繼續(xù)定義領域的內部結構,即添加領域本體概念的屬性。同時,在定義屬性時應該將其放在最概括的類里,通過類與子類之間的繼承關系作用于下級類。
          ?屬性的選擇應該考慮本體的用途、屬性的有用性和信息的獲取難度等因素。如,工業(yè)自動化儀表的屬性:
          生產廠商――>儀表廠商
          相關儀表元件――>儀表元件
          相關儀表材料――>儀表材料
          相關標準――>標準規(guī)范
          用途――>測量對象或使用場合(用途)
          ?添加屬性還應該參照元數(shù)據(jù)信息。以玻璃溫度計為例,如圖5所示:
          由此可以確定玻璃溫度計的屬性包括產品型號、主要用途、生產單位等信息。
          ?對所有的屬性進行整理。對儀表技術規(guī)格和廠商信息等語料資源進行分析判斷,提取出一般儀表均具有的較為通用的屬性,并將常用的屬性進行歸納整理。盡量將擁有一定規(guī)律的“DataTypeProperty”轉化為“ObjectProperty”,并增加了輔助概念頂層類,調用Jena API,將整理后的屬性通過編程導入本體,并建立類的屬性。
          需要注意的是當為實例添加屬性時,屬性的量隨著實例的增加而增加,因此,應該對屬性進行適當?shù)靥幚。盡量將擁有一定規(guī)律的“DataTypeProperty”轉化為“ObjectProperty”,增加輔助概念頂層類。如玻璃溫度計的主要性能指標屬性中有一個測量范圍的屬性值是“-80℃~500℃”。對于這樣的取值范圍,在屬性中是無法直接表示成數(shù)值型的。為此,我們將性能指標“DataTypeProperty”轉換為“ObjeetProperty”,增加了“范圍”和“單位”兩個頂層類,從而解決了這個問題,即,為“范圍”賦予最大值和最小值兩個屬性,這樣儀表就可以添加范圍的屬性,從而實現(xiàn)數(shù)值范圍屬性的表示方法,如圖6所示:
          
          3.5 添加實例
          《產品規(guī)格數(shù)據(jù)庫》、《廠商數(shù)據(jù)庫》以及儀表網(wǎng)中含有大量的數(shù)據(jù),這些數(shù)據(jù)是IAIOnto實例的重要來源。在以往的本體構建過程中,一般都是采用手工方式將實例添加到各個對應的類中。然而,當處理大量實例數(shù)據(jù)時,這種手工添加的方式就暴露了一定的弊端,成為本體構建和維護的瓶頸。
          針對這一點,調用Jena API自動地將儀表、廠商、標準等實例添加到相應的類中,并添加各實例的屬性及實例之間的聯(lián)系。
          3.6 形成owl文件,在prot6g6中驗證和完善
          通過以上幾個步驟完成了IAIOnto構建的程序設計。接下來,我們選用由W3C工作組于2004年正式推薦的OWL本體描述語言,將通過編程編輯好的本體體系結構導出,并存儲為owl文件。
          目前本體構建工具已經非常成熟,出現(xiàn)了一些輔助創(chuàng)建本體的工具和系統(tǒng),如jena、pellet、racer以及GALEN項目開發(fā)的ONIONS系統(tǒng)和DODDLE等。構建本體應該充分利用這些現(xiàn)有工具,最大限度地挖掘其各項功能。項目組通過比較選擇通用性和擴展性很好的prot6g6作為本體編輯工具,將程序存儲的owl文件導人到prot6g6程序中進行修改和完善,類的部分結構樹形圖,如圖7所示。
          
          IAIOnto的TGviz關系圖如圖8所示。
          IAIOnto有很好的可擴展性和權威性,但通過編程自動建立的本體,不可避免地存在一些問題,需要構建人員在prot6g6中進一步修改和完善。同時,邀請儀器儀表領域專家進行咨詢和指導,對本體進行評價。評價內容包括類、屬性以及類之間關系的完整性和準確性等方面的內容。根據(jù)專家提出的指導意見和自檢發(fā)現(xiàn)的問題對本體進行反復修改,直至最后形成完善的IAIOnto原型。
          3.7 本體的更新和維護
          目前,已構建的領域本體共包括1071個類概念,1600多個本體實例(主要為溫度儀表領域的產品、標準和廠商等)以及100多個屬性。隨著項目的不斷深入以及人們對領域認識的提升和新知識的不斷涌現(xiàn),本體的更新和維護將成為非常重要的工作。對本體進行更新和維護可以參照許多本體構建方法,如METH-ONTOLOGY法和TOVE法等。同時,本體的維護恰恰又能體現(xiàn)本體的優(yōu)勢,對數(shù)據(jù)庫維護來說,信息需求的變化往往導致數(shù)據(jù)庫模式的變化,而本體因為其知識表示的靈活性,不需要做底層數(shù)據(jù)結構的改變。然而,值得一提的是,本體的維護是一項長期的、繁重的工作,這項工作需要許多人長期的、不懈的努力。
          
          4 總結與展望
          
          構建IAlonto只是一個開端,構建它的目的是為了利用它強大的信息聚合特性和推理機制,構造出真正的知識庫,解決智能檢索中的許多關鍵問題。目前無法做到完全自動地構建領域本體,仍需要人工干預,相信今后將會有大批高質量的國外以及中國本土的研究成果出現(xiàn)。筆者認為,盡管我們目前所做的工作影響并不是很深遠,但是,前沿的學術研究和實踐成果正是由許許多多看似沒有意義的工作鋪墊出來的。同時,我們也應該看到,我國在描述邏輯、查詢、規(guī)則以及數(shù)據(jù)庫和本體的結合這些問題上的研究和國外的距離還相差很遠,所以,只有在這些方面的研究有所突破,才能在國際上占有一席之地,否則,很難擠進制定標準和引領技術進步的圈子里去。

        相關熱詞搜索:本體 構建 領域 工業(yè)自動化儀表領域本體的構建研究 智能化的主要研究領域 自動化領域

        版權所有 蒲公英文摘 smilezhuce.com