[基于Web2.0的專長識別與共享模型研究]中醫(yī)確有專長中藥識別
發(fā)布時間:2020-03-07 來源: 日記大全 點擊:
[摘要]結(jié)合web2.0的特點,在對專長進(jìn)行深入研究的基礎(chǔ)上,以復(fù)雜性建模思想以及知識管理的基本理論為指導(dǎo),設(shè)計一種新的專長識別與共享實現(xiàn)方法――自適應(yīng)專長識別與共享模型(AEISM),該方法能克服傳統(tǒng)方法中的部分缺陷,并解決新環(huán)境中所遇到的新問題,因此具有一定的實用價值。
[關(guān)鍵詞]專長 專長識別與共享 web2.0 復(fù)雜 知識場
[分類號]G350
1 引言
專長是專家的技能,是一種個人的隱性知識,包括方法、技能、知識、能力、優(yōu)點等。反映專長的任何有形或無形資源,如專家資歷、行為、成果等,均稱為專長證據(jù),它是專長識別與共享的前提。
目前,國內(nèi)外已有利用同行評議、知識庫、E-mail分析、虛擬社區(qū)、組織內(nèi)社會網(wǎng)絡(luò)書簽系統(tǒng)等方法來識別和共享專長。同行評議方法是由權(quán)威人士通過對待評專家的知識、經(jīng)驗和技能進(jìn)行評價來鑒定專家的專長及水平,這種方法較為客觀,但成本很高。知識庫方法將組織以前所做過的事情、員工的思想、經(jīng)驗和知識存儲在信息庫中,計算機(jī)進(jìn)行自動進(jìn)行信息整合并抽取專長。機(jī)器克服了人的主觀性,但只是對文檔片段的分析,不能真正把握文檔的語境,也不能代替人對文檔的理解。Email方法通過對組織成員間郵件交流的分析,來識別組織內(nèi)個體之間的共同興趣。Email方法由于涉及到隱私,實際操作性較差。虛擬社區(qū)將用戶的在線提問和專家的答案保存成為知識庫,用戶通過檢索而獲得答案,如Answer Garden。其側(cè)重于通過存儲和檢索相關(guān)問題與答案而對專長知識予以顯性化和進(jìn)行重用,但不鼓勵用戶與專家的互動,因此專長可能不能被有效地重用和開發(fā)。社會性書簽系統(tǒng)方法通過對組織內(nèi)部用戶對網(wǎng)絡(luò)資源的標(biāo)注行為進(jìn)行分析,而提取用戶的興趣和專長,如Cogenz。但由于某些標(biāo)簽并不一定代表感興趣的內(nèi)容,標(biāo)簽并不僅僅是對內(nèi)容本身的標(biāo)著,還包括了對內(nèi)容相關(guān)的其他標(biāo)著,所以該方法也存在一定的缺陷。在Web2.0環(huán)境下,采用一定的方式,可以構(gòu)建這些方法的綜合運用,將有可能產(chǎn)生更好的專長識別與共享效果,基于此,筆者設(shè)計了自適應(yīng)專長識別與共享模型(AEISM)。
2 AEISM設(shè)計與分析
專長識別與共享是專長管理的主要部分,是利用和創(chuàng)造知識的重要環(huán)節(jié),專長識別與共享在當(dāng)今社會發(fā)揮著越來越重要的作用;赪eb2.0理念和技術(shù),構(gòu)建自適應(yīng)專長識別與共享模型,從理論層面,在一定程度上解決了專長識別與共享中的一些問題。
2.1適應(yīng)性主體
AEISM系統(tǒng)是由大量具有主動性的元素(Active Element)組成的,這些主動性元素是系統(tǒng)的主體(A―gent),主體包括兩類:人與信息。人作為人件參與運算,是一種最具有適應(yīng)性的主體;信息是人的行為的產(chǎn)物,在一定的機(jī)制的控制和約束下,也具有適應(yīng)性。
2.1.1適應(yīng)性從生物學(xué)角度說,適應(yīng)是生物體調(diào)整自己以適合環(huán)境的過程,生物體結(jié)構(gòu)的變化是經(jīng)驗引導(dǎo)的結(jié)果。適應(yīng)性是所有主體所共同具有的特性,在CAS中,主體隨著經(jīng)驗的積累,靠不斷變換其規(guī)則來適應(yīng)。任何特定的適應(yīng)性主體所處環(huán)境的主要部分,都由其他適應(yīng)性主體組成,所以,任何主體在適應(yīng)上所做的努力就是去適應(yīng)別的適應(yīng)性主體。隨著時間的推移,主體在環(huán)境中表現(xiàn)出適應(yīng)與不適應(yīng),適應(yīng)的繼續(xù)生存,不適應(yīng)的將會被淘汰。
在AEISM中,適應(yīng)性表現(xiàn)在人(如專家、社團(tuán))、信息(如專長、知識庫、規(guī)則)這兩類主體是否能得到其他主體的認(rèn)可,能否在系統(tǒng)中得以存在而繼續(xù)演化,這就形成了一套適應(yīng)性規(guī)范一“聲譽(Reputation)”。聲譽指的是人與信息主體是否滿足其他主體的要求和意愿,如專家是否及時更新了其專長信息,是否積極參與社團(tuán)的活動,是否愿意并努力認(rèn)真解答其他主體的提問等,對社團(tuán)而言,其是否組織了有意義的活動,活動頻率怎樣,專家的專長是否能在實踐中發(fā)揮較好的作用等?梢灶A(yù)見,一些不適應(yīng)環(huán)境的主體將會被淘汰,如那些不愿與其他主體交流的專家主體,即使其的確具備很高的專長,但由于其不愿意交流和貢獻(xiàn),經(jīng)過一段時間就會被淘汰出局。同樣,專家所提交的一些專長證據(jù),也會由于無人使用而會被掩蓋和埋沒。
2.1.2主體 主體的引入,使系統(tǒng)的自組織得以發(fā)生,這些主體是杠桿的支點,一旦一個小小的輸入產(chǎn)生,將會產(chǎn)生巨大的、可預(yù)期的直接變化――放大器效應(yīng)。這些杠桿支點一旦連接成一個整體的系統(tǒng)時就會形成一個有機(jī)的整體,產(chǎn)生許多復(fù)雜現(xiàn)象,如專長和專家的不斷涌現(xiàn)和發(fā)生。在AEISM中,主體包括人與信息這兩類主體。信息主體是微主體(Micro Agent),而“人”這一類主體又可以繼續(xù)分為分主體(Component agents)、介主體(Meta-agents)、介介主體(Met-ameta-agents)。
微主體。微主體是一些信息的片段,如由用戶提交的專長證據(jù),或用戶的其他行為所產(chǎn)生的證據(jù),或是專家的某項專長本身等都可以看作是微主體,這些微主體參與了系統(tǒng)的運算。微主體的適應(yīng)性是受控制和約束算法與規(guī)則限制的,這些控制和約束規(guī)則控制著系統(tǒng)的發(fā)展走向,如聚類算法可以將具有相同或相似專長的專家聚集在一起,而社會網(wǎng)絡(luò)分析算法則可以構(gòu)建專長網(wǎng)絡(luò),分眾分類法的機(jī)制也控制著專家、專長及知識庫的分類方法等。這樣,一些符合規(guī)則的專長或?qū)iL證據(jù)就會在系統(tǒng)中繼續(xù)生存,并能得到良好的利用,而一些不適應(yīng)的專長或?qū)iL證據(jù)將會被逐漸埋沒,直至被系統(tǒng)淘汰掉。
分主體。AEISM中最活躍,也最具有能動性的一類主體,是人、組織及以人為基礎(chǔ)所形成的社團(tuán)這一類主體,他們具有豐富的多樣性和極強(qiáng)的適應(yīng)性。主體是一個統(tǒng)一的稱呼和概念,對于具體的每個獨立的個體(如單個的人、單個的組織)而言,他們被稱為分主體。分主體是AEISM中最基本的構(gòu)成要素。主體不僅有層次的劃分(如分主體、介主體、介介主體),主體也體現(xiàn)了不同的角色。分主體具備了至少6個角色,并且這些角色可能在某個分主體上同時具備,角色之間可以發(fā)生相互轉(zhuǎn)換,如圖1所示:
分主體是系統(tǒng)中最核心的內(nèi)容,它具有典型的6種角色:專家、標(biāo)注者、投票者、評審者、編輯者和瀏覽者,這6種角色對應(yīng)著分主體的6種不同行為,這些行為作用于系統(tǒng),使系統(tǒng)不斷演化,產(chǎn)生優(yōu)越的專長識別與共享效果。編輯者的編輯行為是系統(tǒng)數(shù)據(jù)產(chǎn)生的源泉,也是系統(tǒng)進(jìn)化的動力,包括提交其專長證據(jù)、更新其專長信息、參加活動、發(fā)表言論、協(xié)助他人解決問題等。專家是具有一定專長的人,其專長可以是多方面的,專家參與系統(tǒng)中的活動的過程,是一個不斷貢獻(xiàn)其隱性知識和不斷創(chuàng)造社會價值的過程。評審者參與系統(tǒng)中一定程度的控制,評審者對專家資料和身份進(jìn)行初步的驗證,是對用戶及有關(guān)文檔片段的初步把關(guān)。標(biāo)注者是最初的專長識別者,通過對專長證據(jù)資料的考察和分析,對申請成為專家的主體采用任意方向和 數(shù)量的關(guān)鍵詞對其專長進(jìn)行標(biāo)注和修正,完善專長的描述。投票者在與專家的交互過程中,可以發(fā)覺專家專長水平的高低以及專家是否有能力、是否愿意與其他用戶進(jìn)行交互,從而貢獻(xiàn)其知識和技能,如果這些達(dá)不到投票者的要求,專家的聲譽就會降低。瀏覽者強(qiáng)調(diào)的是在系統(tǒng)中只進(jìn)行信息瀏覽和使用的低層次的用戶,其本身并不象其他主體一樣直接參與系統(tǒng)的運算。但其瀏覽行為和間接參與運算,如當(dāng)某一個主體或某類社團(tuán)被有很大的瀏覽量時,系統(tǒng)就有可能據(jù)此而識別出熱門的主題或社團(tuán)。分主體的這6種角色并非固定的,而是在不同條件下相互轉(zhuǎn)化的。而且,同一個主體可以具備多種角色,也即分主體可以在系統(tǒng)中發(fā)生各種不同的行為,產(chǎn)生不同的運算結(jié)果。
介主體。分主體間按照一定的規(guī)則發(fā)生相互作用,并通過聚集的方式形成更高一級的主體,如社團(tuán),這類主體稱為介主體。介主體反映了分主體的聚集特性,如以“信息檢索”為主題的社團(tuán),說明其社團(tuán)成員都具有信息檢索方面的專長,或至少具備這方面的相關(guān)知識。介主體是分主體及微主體通過相互作用所涌現(xiàn)出來的結(jié)果,它主要包含各類社團(tuán)和形成的專長體系。社團(tuán)通常是具有共同屬性的人組成的,他們的相互交流和作用,一方面可以作為反饋的一部分;另一方面也可以促進(jìn)系統(tǒng)的進(jìn)一步演化。
介介主體。介主體之間還可以繼續(xù)發(fā)生相互作用,進(jìn)行再聚集,如以“信息檢索”和“軟件工程”的介主體還可能通過再聚集,形成“計算機(jī)科學(xué)與技術(shù)”這一類新的主體,這類主體被稱為介介主體。這個再聚集的過程經(jīng)過數(shù)次重復(fù)后,就得到了CAS中非常典型的層次組織。介介主體則是介主體的進(jìn)一步作用而聚集形成的更高層次的結(jié)構(gòu),影響著整個系統(tǒng)的進(jìn)化,是一種方向標(biāo),如專家排名。
2.2系統(tǒng)運行機(jī)制模型
AEISM的基本原理為:系統(tǒng)提供一個有機(jī)配置的知識場,由分主體先向系統(tǒng)提交能證明其專長的資料(即專長證據(jù)),系統(tǒng)管理員初步評審用戶的基本信息和所提交的專長證據(jù),然后由其他分主體通過對這些資料的考察和分析,用數(shù)量不限的任意關(guān)鍵詞對其專長進(jìn)行描述;利用一定聚類算法,將所有分主體的標(biāo)注結(jié)果聚集起來,將達(dá)到一定閾值的標(biāo)簽作為用戶的專長標(biāo)記,并按一定的算法計算出專長水平;利用分眾分類法對專家、專長及專長證據(jù)進(jìn)行組織,以標(biāo)簽云顯示給用戶使用。系統(tǒng)通過標(biāo)簽,將具有相同專長和興趣的人管理起來,形成專長專家專長網(wǎng)絡(luò);系統(tǒng)提供多種用戶交互機(jī)制,使專長能充分共享,用戶的行為將會被記錄和分析,繼續(xù)構(gòu)建和擴(kuò)充知識庫,以利重用和新知識的創(chuàng)造;用戶也可以自主構(gòu)建各類社團(tuán),社團(tuán)也由標(biāo)簽來標(biāo)記,舉辦各類社團(tuán)活動;這個過程循環(huán)往復(fù)的進(jìn)行,從一個非平衡狀態(tài)走向平衡狀態(tài),使得優(yōu)秀的專家得以涌現(xiàn),用戶之間的交互和標(biāo)簽之間的關(guān)聯(lián),也會涌現(xiàn)出各類社團(tuán)。通過這種相互作用,系統(tǒng)結(jié)構(gòu)和模式得以繼續(xù)演化和完善,最終產(chǎn)生符合用戶需求的專長識別與共享模式。該過程如圖2所示:
主體的適應(yīng)過程依賴于由其他主體所提供的、不斷變化的情境。在AEISM中,這個情境便是由分主體的個人情境、所有主體的共有情境以及各類主體之間的相互作用所形成的氛圍,這種氛圍便是知識場。因此,一旦用戶進(jìn)入了本系統(tǒng),便自然而然的進(jìn)入到這個知識場中,受場的影響。主體的一切適應(yīng)過程以及系統(tǒng)結(jié)構(gòu)和模式的演化都在這個場中進(jìn)行,同時,這種相互作用也促使場本身不斷的變化。其中最核心的是主體自組織與涌現(xiàn)、系統(tǒng)反饋兩個問題。
2.2.1主體的自組織與涌現(xiàn)機(jī)制
自組織貫穿于AEISM系統(tǒng)運行的始終,不僅以人中心的主體(用戶主體)由于不斷適應(yīng)進(jìn)行著自組織,而且人所的各種行為和所生產(chǎn)的各種數(shù)據(jù),即微主體(信息主體)也在一定規(guī)則的控制下,不斷進(jìn)行著自組織。自組織主要體現(xiàn)在各級主體的自組織上,主體通過自組織聚集而涌現(xiàn)出新的主體(見圖2)。
用戶自組織。自組織的原動力是用戶主體。編輯者編輯個人資料,構(gòu)建專長檔案,并不定期更新。標(biāo)注者根據(jù)編輯者提交的資料和專長信息,對其專長采用任意關(guān)鍵詞進(jìn)行標(biāo)注。評審者對編輯者提交的資料進(jìn)行初步的審核,投票者通過對專長資料的考察和與專家的交互,對專家的專長水平和共享意識進(jìn)行評定等。
用戶自組織的動力機(jī)制來源于協(xié)同中的競爭與協(xié)同機(jī)制。用戶為了在知識場中取勝,其必然要與其他人競爭。例如,專家為了贏得良好的聲譽(因為聲譽會給他們帶來許多的潛在利益,如更高的學(xué)術(shù)聲望、更好的職業(yè)機(jī)會、更多的產(chǎn)品用戶等),他必然會努力將表征其專長及專長水平的信息及時提交和更新,并積極參加社團(tuán)活動,與其他專家和用戶交互,共享和貢獻(xiàn)其專長,惟其如此,他才有可能贏得良好的聲譽,進(jìn)而累積成功。反之,他將會被淘汰。這種競爭結(jié)果導(dǎo)致系統(tǒng)向非平衡狀態(tài)發(fā)展。倘若現(xiàn)實中的專家投入到這個環(huán)境中來,因為其已有的名氣,他能迅速贏得聲譽,在競爭中獲勝,他能找到更多的合作者,有可能帶來更多的項目,這種激勵也會促進(jìn)更多的精英的加入,從而促進(jìn)系統(tǒng)良性循環(huán)發(fā)展。眾多專家的涌入,每個人的專長會有差異,其專長檔案也會有較大不同,這種差異化是系統(tǒng)處于一種相對比較混沌的狀態(tài)。為解決這個問題,用戶之間的協(xié)同發(fā)揮了作用。
眾多標(biāo)注者對專家進(jìn)行標(biāo)注,標(biāo)注的結(jié)果是使具有相同專長或者相近專長的專家聚集起來,同時,也可以將專長聚集起來,從而形成了一個新的有序的結(jié)構(gòu)和模式,即所謂的序參量,序參量的出現(xiàn)標(biāo)志著系統(tǒng)進(jìn)入了一個平衡狀態(tài)。當(dāng)用戶更新自身信息,或者新的用戶加入,或者用戶發(fā)生新的行為時,又會導(dǎo)致這種平衡狀態(tài)被打破,進(jìn)入了新的非平衡狀態(tài)。AEISM不斷的從非平衡狀態(tài)走向平衡狀態(tài),然后平衡狀態(tài)被打破,又通過自適應(yīng)達(dá)到新的平衡狀態(tài),螺旋上升發(fā)展。
信息自組織。雖然信息本身并不能進(jìn)行學(xué)習(xí)和主動適應(yīng),但和人一樣,信息自組織也是由規(guī)則控制的結(jié)果。所以,強(qiáng)調(diào)信息自組織,更多的是強(qiáng)調(diào)其規(guī)則的設(shè)計和實現(xiàn),在本模型中,主要表現(xiàn)為tag和文檔片段的自組織。
標(biāo)注者的標(biāo)注行為產(chǎn)生描述專家及其專長的tag,系統(tǒng)用一定的規(guī)則對其實施控制,表現(xiàn)出適應(yīng)性。最初tag的數(shù)量和內(nèi)涵有很大差別,系統(tǒng)通過一定的算法(如聚類算法)將相同的tag識別出來,計算詞頻,當(dāng)詞頻達(dá)到一定閾值,該tag便可作為專長標(biāo)識。每個專家的專長實質(zhì)上是一個tag的集合。具有相同tag的專家被聚集起來,形成社會網(wǎng)絡(luò),將更有利于其找到相關(guān)專家。當(dāng)其中的某個專長消失時,必然又會有新的tag補上,發(fā)生態(tài)勢的位移,從而體現(xiàn)出多樣性。同時,由于標(biāo)注者本身也是受所在領(lǐng)域限制的,所以其tag行為也必然會受其自身的專長領(lǐng)域和水平的限制,也就是說進(jìn)行tag的用戶的tag行為代表了自身興趣和知識,這個可以促進(jìn)其共同興趣社團(tuán)的形成。
文檔片段自組織則是一種聚集算法和時序算法的控制。同一個專家的文檔會按其專長聚集起來,不同專家的文檔也會按系統(tǒng)的所有專長而聚集起來。并 且,系統(tǒng)實施監(jiān)控機(jī)制,對于一些使用極少或年代久遠(yuǎn)的文檔,將會采取備份措施。系統(tǒng)中通過這些適應(yīng)性主體的不斷的自組織,使新的結(jié)構(gòu)和模式不斷涌現(xiàn),系統(tǒng)不斷演化,如圖3所示:
各種適應(yīng)性主體通過彼此問的相互作用,不斷演進(jìn),最后由聚集而形成新的體系,如用戶通過構(gòu)建各種社區(qū),而涌現(xiàn)出許多活躍的社區(qū),用戶的tag行為將導(dǎo)致專家的專長被識別出來,同時也標(biāo)志了自身的知識和興趣方向,通過用戶間的tag關(guān)聯(lián),也構(gòu)成了用戶之間的社會網(wǎng)絡(luò),用戶所提交的專長文檔將被整合,形成一個相對穩(wěn)定的可獲取的知識庫,供用戶共享。這種方式將涌現(xiàn)出分眾分類法,用來組織系統(tǒng)信息和用戶,如圖4便是對專家專長分眾分類法的圖示描述。
主體自組織是按照一定的內(nèi)部模型進(jìn)行的,其中用戶自組織的內(nèi)部模型上述激勵機(jī)制,每個用戶都要預(yù)見到如果其采取某種行動后將會產(chǎn)生的結(jié)果。信息自組織的內(nèi)部模型則是系統(tǒng)中所設(shè)計的各類算法,信息按照算法進(jìn)行演化。
2.2.2系統(tǒng)反饋本模型是一個開放式的系統(tǒng),系統(tǒng)要演進(jìn)和優(yōu)化,循環(huán)反饋也是其中非常重要的一環(huán),見圖5。對于每個用戶而言,通過其自身在系統(tǒng)中的自適應(yīng)活動,是系統(tǒng)發(fā)生演化。同時,系統(tǒng)的輸出結(jié)果,又會使用戶的再次適應(yīng)活動受到影響。在這些反饋中,最為主要的是負(fù)反饋,其結(jié)果是使系統(tǒng)進(jìn)一步趨于穩(wěn)定。在本系統(tǒng)的每一個部分,幾乎都涉及到了循環(huán)反饋,例如編輯者提交的資料、用戶tag及tag行為、社團(tuán)主題、社團(tuán)活動方式和頻率等。
對于編輯者而言,若其需要成為專家,其必然會提交資料來證明。當(dāng)其資料被得到很好的響應(yīng)時,他便會發(fā)現(xiàn)什么樣的專長、什么樣的資料是當(dāng)前用戶所最需要的,甚至通過在與用戶的交互過程中,他也會發(fā)現(xiàn),什么樣的用戶值得交流,什么樣的用戶可以直接拉入黑名單。這種不斷的反饋過程,使系統(tǒng)資料不斷得到更正,越來越趨向于大眾的喜好。
3 結(jié)語
在web2.0環(huán)境下,用戶充分的個性表達(dá)也預(yù)示著他們具有某種專長,他們同樣可能協(xié)助他人解決問題,從而,專長不再是少數(shù)權(quán)威人士的專利,“草根”也同樣具有專長,同樣可能成為專家,從而奠定了本文研究的基本思想和出發(fā)點。本文利用復(fù)雜性科學(xué)構(gòu)建了自適應(yīng)專長識別與共享模型,從理論層面在一定程度上解決了新環(huán)境下的專長識別與共享問題,具體包括以下幾點:①將每個用戶都視為潛在專家,系統(tǒng)能識別出每個人的專長與專長水平,并能識別出團(tuán)體、組織的專長;②專家專長由用戶的自由標(biāo)簽(tag)來標(biāo)記,符合大眾化的需求,從而使專長標(biāo)記不再局限于專業(yè)領(lǐng)域的分類法,而是采用使能為大多數(shù)人所能理解和接受的方式,增強(qiáng)系統(tǒng)可用性;③專長證據(jù)提交,專長識別,社團(tuán)組織等都由用戶自身進(jìn)行,采用用戶參與架構(gòu)的系統(tǒng)設(shè)計模式,有機(jī)配置知識場,使系統(tǒng)的自組織和演化自動進(jìn)行,大大降低了專長識別與共享的成本;④提供了便利的專家搜尋路徑,充分利用各種交流工具,并自動構(gòu)建專長知識庫,使專長的交流與共享的難度大大降低。
相關(guān)熱詞搜索:專長 識別 模型 基于Web2.0的專長識別與共享模型研究 阿里的博客 人肉搜索的自組織聚合探析
熱點文章閱讀