高校人事管理中決策樹分類法的應(yīng)用
發(fā)布時間:2019-08-16 來源: 日記大全 點(diǎn)擊:
摘 要:高校人才的引進(jìn)對學(xué)校的發(fā)展十分重要,人才識別方式是通過考察引進(jìn)人員的定性指標(biāo)實(shí)現(xiàn)的,很難保證識別結(jié)果的全面性、科學(xué)性和準(zhǔn)確性。數(shù)據(jù)挖掘中的決策樹分類技術(shù)是一種常用的預(yù)測模式,對已有的引進(jìn)人才數(shù)據(jù)庫的判斷。
關(guān)鍵詞:人事管理;數(shù)據(jù)挖掘;分類;決策樹
1.概述
人力資源管理作為高校管理重要組成部分,日益受到各個領(lǐng)域的重視。高校人事管理的重要內(nèi)容是人才預(yù)測與評價,它涉及的因素有人才的總量、人才的學(xué)歷、人才的專業(yè)分布、人才的年齡以及人才的層次等。其主要內(nèi)容有:人才的專業(yè)結(jié)構(gòu)預(yù)測;人才的層次結(jié)構(gòu)預(yù)測;人才的年齡結(jié)構(gòu)預(yù)測;人才的學(xué)歷結(jié)構(gòu)預(yù)測;人才的需求總量預(yù)測等。人力資源管理面對著海量數(shù)據(jù),迫切需要一種技術(shù)來發(fā)現(xiàn)有價值的知識,從而制定人才發(fā)展戰(zhàn)略,并為其提供決策支持。傳統(tǒng)的人才識別方式是通過考察引進(jìn)人員的定性指標(biāo)實(shí)現(xiàn)的,依靠手工操作很難保證識別結(jié)果的全面性、科學(xué)性和準(zhǔn)確性。鑒于許多高校都建立了人才數(shù)據(jù)庫系統(tǒng),應(yīng)用數(shù)據(jù)挖掘技術(shù)對以往人才數(shù)據(jù)進(jìn)行分析,有助于提高人才識別的準(zhǔn)確性,并提高識別效率。
研究數(shù)據(jù)挖掘中的分類技術(shù),在高校人事管理系統(tǒng)數(shù)據(jù)庫或數(shù)據(jù)倉庫中提取隱含的、未知的、異常的或有潛在應(yīng)用價值的信息或模式,可以為制定人事激勵制度,預(yù)測和評估最優(yōu)秀的人才提供科學(xué)依據(jù),針對不同類別的教師建立有針對性的人事激勵制度,為領(lǐng)導(dǎo)和職能部門科學(xué)決策提供依據(jù)。因此,基于決策樹分類在高校人事管理中的應(yīng)用研究有著重要的意義。
2.高校人事管理數(shù)據(jù)庫主要特點(diǎn)與分類技術(shù)
人力資源管理是企業(yè)(事業(yè))單位生存的命脈。高校的人力資源具有明顯的特點(diǎn),它基本上由五個部分構(gòu)成:管理人員、教研人員、服務(wù)人員、附屬部門的工作人員與離退休人員。其中教研人員是主體,管理人員是關(guān)鍵,服務(wù)人員和離退人員是補(bǔ)充。教研人員中一般教學(xué)人員居多,滿足于課程開設(shè)與知識傳授的崗位需要;管理崗位中一般的維特性的管理人員居多,缺乏管理思想與能力,滿足于學(xué)校的正常工作的運(yùn)轉(zhuǎn);服務(wù)人員中文化素質(zhì)不高,大都是教研人員和管理人員的家屬與子女,對于離退休人員,有的認(rèn)為是不用組織利用的富余人員,聽任自由生活。這種結(jié)構(gòu)現(xiàn)狀,既不能滿足高?缡兰o(jì)發(fā)展的需要,又引發(fā)了許多人力資源的問題:高精尖教研人員缺乏,而一般老師過剩;行政領(lǐng)導(dǎo)人才缺乏,而一般管理人員過多;上崗教研人員過少,而非教研人員比例過大;資深教授閑置,而年輕教授負(fù)擔(dān)過重;教學(xué)型教師過剩,而研究型教師不足,一般性教師過多,而藝術(shù)性教師偏少;一般性研究人員較多,而開發(fā)應(yīng)用性研究人員缺乏等。
由于高校人員流動性強(qiáng),人力資源數(shù)據(jù)庫中積累的信息過多,人事部門對現(xiàn)有的數(shù)據(jù)進(jìn)行客觀分析的難度很大。因此基于高校人力資源數(shù)據(jù),應(yīng)用分類技術(shù),無疑是一種可行的舉措,它不僅可以發(fā)現(xiàn)有價值的知識,而且可以為管理者提供決策支持。
3.決策樹分類法在高校人事管理中的應(yīng)用
目前,各個高校都建立了各自的信息管理系統(tǒng),這些系統(tǒng)積累了大量數(shù)據(jù)。由于數(shù)據(jù)來源于不同部門,大部分?jǐn)?shù)據(jù)在放入挖掘庫前,要經(jīng)過整理。在進(jìn)行數(shù)據(jù)挖掘前,把預(yù)處理過的數(shù)據(jù)都放到一個數(shù)據(jù)庫中,建立數(shù)據(jù)挖掘庫的同時就開始數(shù)據(jù)預(yù)處理工作,最后建成一個可以直接用挖掘工具進(jìn)行挖掘的庫,處理過程主要環(huán)節(jié)有:收集數(shù)據(jù)、數(shù)據(jù)預(yù)處理模塊、數(shù)據(jù)準(zhǔn)備、程序運(yùn)行,查看結(jié)果等,如圖3-1所示。
3.1 數(shù)據(jù)準(zhǔn)備
數(shù)據(jù)準(zhǔn)備包括數(shù)據(jù)的選擇、抽取,數(shù)據(jù)的轉(zhuǎn)換,數(shù)據(jù)的預(yù)處理[1-2]。用于數(shù)據(jù)挖掘的源數(shù)據(jù),可以是任何一個數(shù)據(jù)庫。
數(shù)據(jù)的預(yù)處理經(jīng)過了以下步驟;
(1)數(shù)據(jù)的審核、整理與收集。
(2)數(shù)據(jù)清理。
(3)數(shù)據(jù)離散化。
(4)加載數(shù)據(jù)挖掘庫。
3.2 高校人事管理中的決策樹分類算法
數(shù)據(jù)挖掘中的分類算法分類是數(shù)據(jù)挖掘中非常重要的方法。分類的目的是分析輸入的數(shù)據(jù),通過觀察處于數(shù)據(jù)源中的數(shù)據(jù)記錄表現(xiàn)出來的特征,為每一個類找到一種準(zhǔn)確的描述或者模型。由此生成的類描述可以用來對未來的數(shù)據(jù)進(jìn)行分類,即預(yù)測。
決策樹算法是分類技術(shù)的一種常用算法。決策樹是一種表現(xiàn)一系列導(dǎo)致類或值的規(guī)則的方法,是一個類似于流程圖的樹結(jié)構(gòu),最頂層是根節(jié)點(diǎn),下面每個內(nèi)部節(jié)點(diǎn)表示一個屬性上的測試,每個分枝代表一個測試的輸出,每個葉節(jié)點(diǎn)表示類。它可以生成易于理解的規(guī)則。本文采用C4.5算法
決策樹C4.5算法的基本迭代過程:
(1)決策樹從訓(xùn)練樣本的單個節(jié)點(diǎn)開始;
(2)如果訓(xùn)練樣本都在同一個類,那么該節(jié)點(diǎn)成為葉子,并用該類標(biāo)記;
(3)否則,決策樹算法使用信息增益作為度量,選擇一個能最好地將訓(xùn)練樣本分類的字段。
(4)對字段的每個已知的屬性值,創(chuàng)建一個分枝,并據(jù)此劃分樣本;
(5)遞歸形成每個劃分上的樣本決策樹。直至滿足遞歸劃分終止條件結(jié)束。
遞歸劃分終止條件:
(1)當(dāng)給定節(jié)點(diǎn)的所有訓(xùn)練樣本都屬于同一個類時,停止,并用該類來標(biāo)記此葉子;
(2)當(dāng)沒有剩余字段可用來進(jìn)一步劃分訓(xùn)練樣本時,停止,并用訓(xùn)練樣本的多數(shù)的類來標(biāo)記此葉子;
(3)分枝沒有訓(xùn)練樣本時,停止,并用訓(xùn)練樣本的多數(shù)的類來標(biāo)記此葉子。
4 算法的程序?qū)崿F(xiàn)
采用MicrosoftVisualBasic6.0企業(yè)版作為開發(fā)工具。在VisualBasic中,有三種方式可以建立與數(shù)據(jù)源的連接,這里選擇MicrosoftODBC驅(qū)動程序。對高校人力資源進(jìn)行數(shù)據(jù)挖掘的結(jié)果,是通過一棵決策樹來顯示的,在VisualBasic中使用TreeView控件來實(shí)現(xiàn)。節(jié)點(diǎn)位置的設(shè)計為:根節(jié)點(diǎn)的位置表示“e0”,一級節(jié)點(diǎn)表示為“e0_”,二級節(jié)點(diǎn)表示為“e0_ _”,類似地,n級節(jié)點(diǎn)表示為“e0_ _ … _”。例如:節(jié)點(diǎn)“e0213”表示的是第三級節(jié)點(diǎn),具體位置是:一級節(jié)點(diǎn)的第二個分枝、二級節(jié)點(diǎn)的第一個分枝、三級節(jié)點(diǎn)的第三個分枝。程序的結(jié)束可以以是否滿足n=0為條件判斷,當(dāng)回歸到第n級節(jié)點(diǎn),n=0時,表示回歸到了根節(jié)點(diǎn),所有分枝、葉子已經(jīng)產(chǎn)生結(jié)束,數(shù)據(jù)挖掘到此結(jié)束。
5 決策樹分類法數(shù)據(jù)挖掘?qū)嵗?br> 決策樹算法的執(zhí)行結(jié)果是生成一棵決策樹,對決策樹從根到葉子的每條路徑創(chuàng)建一個規(guī)則,以IF-Then形式形成分類規(guī)則,組成規(guī)則集G。沿給定路徑上的每個屬性值形成IF部分的一個合取項(xiàng),葉節(jié)點(diǎn)包含的類預(yù)測,形成Then后面的部分,將規(guī)則存入規(guī)則庫。
例如:要找出高校教師人員變動情況與各種原因之間的關(guān)系并建立模式,以便通過調(diào)整薪資、增加培訓(xùn)機(jī)會!更換工作環(huán)境、提升職位等手段,留住所需人才,并對新引進(jìn)人才作出預(yù)測,可以以離職情況作為目標(biāo)類,其它字段有XL(學(xué)歷),ZY(專業(yè)),ZJ(職稱),ZW(職位),XB(性別),年齡(NL),配偶工作情況(PO),下面是一些規(guī)則:
(1) 如果職位B(處級),年齡C(41~50),則不流失(N類)。
(2) 如果學(xué)歷05(博士),配偶工作情況C(不滿意),年齡B(31~40),則流失(Y類)。
通過決策樹,可以看到,年齡在30~45之間的男性博士生容易感覺當(dāng)前單位待遇不理想或夫妻不在一地而調(diào)動;25~35歲碩士生容易感覺當(dāng)前單位不能充分發(fā)揮作用或想繼續(xù)深造而離職。最后的分析結(jié)果通過人機(jī)交互界面反映給高校領(lǐng)導(dǎo)層和相關(guān)的職能部門,對今后關(guān)于人才的引進(jìn)及管理起到一定的輔助決策作用。
6 結(jié)束語
隨著社會的發(fā)展,教育體制的改革與完善,高校面臨的競爭會越來越激烈,這就要求高校的管理者能根據(jù)人事管理、教學(xué)管理、科研管理、就業(yè)管理、學(xué)校發(fā)展規(guī)劃等實(shí)際情況進(jìn)行科學(xué)決策。本文研究數(shù)據(jù)挖掘技術(shù)在高校人事管理中的應(yīng)用,完成了程序代碼的實(shí)現(xiàn),通過友好的人機(jī)交互界面,為高校人才引進(jìn)和管理提供了科學(xué)的決策依據(jù)。
參考文獻(xiàn)
[1]周學(xué)君,楊敏,面向高校就業(yè)的數(shù)據(jù)倉庫中數(shù)據(jù)析取技術(shù)及實(shí)現(xiàn).三峽大學(xué)學(xué)報,2005,27(3):260~263
[2]范明,孟小峰數(shù)據(jù)挖掘概念與技術(shù)[M].第1版一t京:機(jī)械工業(yè)出版社,2001
[3]姜欣,徐六通.C4.5決策樹展示算法的設(shè)計.計算機(jī)工程與應(yīng)用,2003,4:93~94
熱點(diǎn)文章閱讀