基于學(xué)習(xí)分析的在線(xiàn)學(xué)業(yè)成就影響因素研究
發(fā)布時(shí)間:2019-08-07 來(lái)源: 短文摘抄 點(diǎn)擊:
摘要:如何利用數(shù)據(jù)和模型來(lái)預(yù)測(cè)學(xué)業(yè)成功與失敗是學(xué)習(xí)分析領(lǐng)域的核心問(wèn)題。該文通過(guò)對(duì)現(xiàn)有文獻(xiàn)檢索分析出目前研究中主要影響學(xué)業(yè)成就的要素,結(jié)合對(duì)原始數(shù)據(jù)的深度處理,得到和學(xué)習(xí)相關(guān)的高級(jí)行為指標(biāo),利用機(jī)器學(xué)習(xí)中神經(jīng)網(wǎng)絡(luò)、決策樹(shù)及線(xiàn)性回歸算法分別建模分析。研究發(fā)現(xiàn):學(xué)習(xí)態(tài)度、學(xué)習(xí)及時(shí)水平和投入水平是影響在線(xiàn)學(xué)業(yè)成就的主要因素,耐挫水平為次要因素,而互動(dòng)水平、積極水平和階段成效對(duì)最終的學(xué)業(yè)成就無(wú)關(guān)。該文最后對(duì)研究結(jié)果進(jìn)行了反思后認(rèn)為,課程選取對(duì)研究在線(xiàn)學(xué)業(yè)成就要素有非常大的影響。
關(guān)鍵詞:學(xué)習(xí)分析;在線(xiàn)課程;學(xué)業(yè)成就;機(jī)器學(xué)習(xí)
中圖分類(lèi)號(hào):G434 文獻(xiàn)標(biāo)識(shí)碼:A
一、引言
隨著大數(shù)據(jù)的應(yīng)用普及,很多行業(yè)(如金融、零售)都發(fā)生了巨大的變化。但一直以來(lái),教育領(lǐng)域是在大數(shù)據(jù)中受益最少的領(lǐng)域之一,缺乏“數(shù)據(jù)驅(qū)動(dòng)的思維(Data-driven Mind-set)”是教育領(lǐng)域當(dāng)今面臨的主要障礙。相對(duì)于流程清晰規(guī)范的金融系統(tǒng),教育是一個(gè)超級(jí)復(fù)雜的系統(tǒng),各類(lèi)教育實(shí)踐活動(dòng)產(chǎn)生了比金融行業(yè)要多得多的數(shù)據(jù)。因此,如何利用好教育數(shù)據(jù),并從中發(fā)掘其背后的教育規(guī)律成了研究者最近關(guān)注的重點(diǎn)。自2010年起,學(xué)習(xí)分析(Learning Analytics,簡(jiǎn)稱(chēng)LA)逐漸從分析領(lǐng)域獨(dú)立出來(lái),吸納數(shù)據(jù)挖掘、社會(huì)網(wǎng)絡(luò)分析、統(tǒng)計(jì)分析等多種分析方法,形成了一個(gè)獨(dú)立的新興領(lǐng)域。從此,學(xué)習(xí)分析作為分析技術(shù)在教育領(lǐng)域中的應(yīng)用和發(fā)展,受到越來(lái)越多研究者的關(guān)注和重視。運(yùn)用在教育領(lǐng)域的學(xué)習(xí)分析主要任務(wù)是通過(guò)對(duì)學(xué)習(xí)者產(chǎn)生和收集到的相關(guān)數(shù)據(jù)進(jìn)行分析和闡釋?zhuān)瑏?lái)評(píng)估學(xué)習(xí)者的學(xué)業(yè)成就、預(yù)測(cè)其學(xué)習(xí)表現(xiàn)并發(fā)現(xiàn)存在問(wèn)題的過(guò)程。因此如何利用學(xué)習(xí)分析技術(shù)來(lái)預(yù)測(cè)學(xué)業(yè)成功與失敗是該領(lǐng)域核心問(wèn)題。
二、文獻(xiàn)綜述
最近幾年,圍繞學(xué)業(yè)分析與學(xué)業(yè)成就這一話(huà)題,國(guó)內(nèi)外學(xué)者的研究主要聚焦在學(xué)業(yè)成就模型和指標(biāo)的研究上。Usamah通過(guò)對(duì)14個(gè)典型的學(xué)習(xí)分析系統(tǒng)和應(yīng)用進(jìn)行研究后指出,學(xué)習(xí)分析中數(shù)據(jù)輸入應(yīng)該包含盡可能多的數(shù)據(jù),而不應(yīng)綁定在兩種或三種類(lèi)型的數(shù)據(jù)中,并最終梳理出包含學(xué)習(xí)者往期學(xué)業(yè)表現(xiàn)、課程參與情況、學(xué)習(xí)者背景、社交表現(xiàn)等多個(gè)預(yù)測(cè)學(xué)業(yè)表現(xiàn)的重要指標(biāo)。Bukralia使用學(xué)業(yè)能力、經(jīng)濟(jì)水平、學(xué)業(yè)目標(biāo)、技術(shù)準(zhǔn)備、人口統(tǒng)計(jì)、課程動(dòng)機(jī)與參與以及課程特征作為預(yù)測(cè)學(xué)業(yè)風(fēng)險(xiǎn)或成就的指標(biāo)。G.Siemens等對(duì)學(xué)習(xí)者基本情況、學(xué)習(xí)目標(biāo)、動(dòng)機(jī)水平、認(rèn)知風(fēng)格、學(xué)習(xí)需要的數(shù)據(jù)進(jìn)行收集,并對(duì)在線(xiàn)學(xué)習(xí)影響因素進(jìn)行分析,其成果為促進(jìn)學(xué)生學(xué)業(yè)成功提供了有力支撐。武法提和牟智佳基于學(xué)習(xí)者行為分析提出了以教學(xué)目標(biāo)分類(lèi)理論、個(gè)性化學(xué)習(xí)理論和社會(huì)認(rèn)知理論為指導(dǎo)的,以“目標(biāo)-過(guò)程-結(jié)果”為思想的學(xué)習(xí)結(jié)果分類(lèi)預(yù)測(cè)框架,并以edX平臺(tái)上一門(mén)MOOC課程的學(xué)習(xí)行為數(shù)據(jù)為研究對(duì)象進(jìn)行探索,通過(guò)將視頻學(xué)習(xí)次數(shù)、文本學(xué)習(xí)次數(shù)、評(píng)價(jià)參與時(shí)長(zhǎng)、評(píng)價(jià)參與次數(shù)和論壇主題發(fā)起數(shù)作為行為指標(biāo)組合,發(fā)現(xiàn)學(xué)習(xí)次數(shù)的預(yù)測(cè)效果要好于學(xué)習(xí)時(shí)長(zhǎng),并與學(xué)習(xí)時(shí)長(zhǎng)和學(xué)習(xí)次數(shù)結(jié)合后的預(yù)測(cè)效果接近。李爽等基于學(xué)習(xí)者在線(xiàn)學(xué)習(xí)行為投入歸納出參與、堅(jiān)持、專(zhuān)注、交互、學(xué)術(shù)挑戰(zhàn)、學(xué)習(xí)自我監(jiān)控等六個(gè)在線(xiàn)學(xué)業(yè)成就評(píng)價(jià)指標(biāo)維度。陳子健等通過(guò)計(jì)算所有單個(gè)數(shù)據(jù)屬性和學(xué)業(yè)成績(jī)類(lèi)別之間的相關(guān)系數(shù)及計(jì)算所有屬性的信息增益率兩種方法共同確定學(xué)業(yè)成績(jī)的影響因素。
通過(guò)對(duì)以上分析研究發(fā)現(xiàn),在研究?jī)?nèi)容及數(shù)據(jù)的處理上,目前大部分研究主要以理論探討、框架分析為主,部分以數(shù)據(jù)為基礎(chǔ)的實(shí)證分析主要是使用了在線(xiàn)平臺(tái)基礎(chǔ)的原始數(shù)據(jù),如各類(lèi)行為的時(shí)長(zhǎng)、頻次等,對(duì)同一行為的多條數(shù)據(jù)的處理方法主要是取均值,如用所有練習(xí)的成績(jī)平均值來(lái)代表最終成績(jī)等。鑒于在線(xiàn)學(xué)習(xí)不同用戶(hù)的學(xué)習(xí)習(xí)慣不同、分配時(shí)間的方式不同、每個(gè)練習(xí)難度也不同,同一個(gè)學(xué)習(xí)者完成相似任務(wù)所需要的時(shí)間及次數(shù)差異都非常大,不同的學(xué)習(xí)者完成不同任務(wù)的次數(shù)和時(shí)間會(huì)相差更大,對(duì)原始數(shù)據(jù)簡(jiǎn)單的均值處理顯然不太合理,因此需要對(duì)原始數(shù)據(jù)進(jìn)行歸一化處理。如Grabe和Sigler通過(guò)研究對(duì)各類(lèi)時(shí)間進(jìn)行了估計(jì),所有超過(guò)2分鐘的學(xué)習(xí)行為時(shí)間將被替換成2分鐘,選擇題答題時(shí)間最高設(shè)定為90秒,使用這種簡(jiǎn)單規(guī)則,的確降低了數(shù)據(jù)的處理難度,在一定程度上對(duì)數(shù)據(jù)進(jìn)行了歸一化處理,但同時(shí)也丟失了包含大量用戶(hù)特征的數(shù)據(jù)。在研究方法上,很多研究都通過(guò)理論分析指出了影響在線(xiàn)學(xué)習(xí)學(xué)業(yè)成就的因素,然后通過(guò)調(diào)查問(wèn)卷或少量在線(xiàn)數(shù)據(jù)來(lái)建模驗(yàn)證,數(shù)據(jù)處理的方式多用回歸分析或結(jié)構(gòu)方程模型,很少使用大數(shù)據(jù)研究所采用的機(jī)器學(xué)習(xí)算法來(lái)進(jìn)行建模并對(duì)模型進(jìn)行深入分析。
三、分析框架
本研究參照上述文獻(xiàn)中關(guān)于學(xué)業(yè)成就框架的研究結(jié)果,對(duì)基本的原始數(shù)據(jù)進(jìn)行歸一化處理后,結(jié)合文獻(xiàn)中研究得出的影響學(xué)業(yè)成就指標(biāo),選取了及時(shí)水平、投入水平、互動(dòng)水平、耐挫水平、積極水平、學(xué)習(xí)態(tài)度、階段成效等七個(gè)維度作為分析在線(xiàn)學(xué)業(yè)成績(jī)的指標(biāo),并選擇了對(duì)相關(guān)底層數(shù)據(jù)進(jìn)行更深入挖掘后所形成的“高級(jí)數(shù)據(jù)”作為以上維度的指標(biāo)項(xiàng),構(gòu)建了學(xué)業(yè)成績(jī)要素分析的框架,如表1所示。使用線(xiàn)下成績(jī)作為學(xué)業(yè)成就的標(biāo)簽數(shù)據(jù),利用機(jī)器學(xué)習(xí)算法構(gòu)建模型,分析哪些指標(biāo)是影響在線(xiàn)學(xué)習(xí)成就的主要指標(biāo)。
(一)第一次學(xué)習(xí)課程時(shí)間
考慮到課程的創(chuàng)建與發(fā)布時(shí)間不一定就是學(xué)習(xí)者可以學(xué)習(xí)的時(shí)間,因此本研究使用課程第一個(gè)學(xué)習(xí)者開(kāi)始學(xué)習(xí)的時(shí)間為起始點(diǎn),其他學(xué)習(xí)者第一次學(xué)習(xí)課程的時(shí)間與起始點(diǎn)之間的間隔,即為該學(xué)習(xí)者的第一次學(xué)習(xí)課程時(shí)間,該時(shí)間為相對(duì)時(shí)間,以天為單位。第一次學(xué)習(xí)課程的時(shí)間反映了學(xué)習(xí)者能否迅速開(kāi)始學(xué)習(xí)活動(dòng)。
。ǘ┢骄陀^(guān)題開(kāi)始答題時(shí)間
客觀(guān)題開(kāi)始答題時(shí)間:采用和第一次學(xué)習(xí)課程時(shí)間相同的研究方法,將從每個(gè)客觀(guān)題作業(yè)第—個(gè)學(xué)習(xí)者開(kāi)始答題的時(shí)間開(kāi)始,到其他學(xué)習(xí)者開(kāi)始作答該客觀(guān)題作業(yè)時(shí)間結(jié)束,定義為該學(xué)習(xí)者該客觀(guān)題的開(kāi)始答題時(shí)間,該時(shí)間為相對(duì)時(shí)間,以天為單位。
平均客觀(guān)題開(kāi)始答題時(shí)間:某學(xué)習(xí)者某一門(mén)課程全部客觀(guān)題作業(yè)的客觀(guān)題開(kāi)始答題時(shí)間的平均值定義為該學(xué)習(xí)者的平均客觀(guān)題開(kāi)始答題時(shí)間。通過(guò)平均客觀(guān)題開(kāi)始答題時(shí)間,可以反映出學(xué)習(xí)者開(kāi)始學(xué)習(xí)課程新資源的主動(dòng)性和及時(shí)性。
相關(guān)熱詞搜索:在線(xiàn) 學(xué)業(yè) 成就 因素 影響
熱點(diǎn)文章閱讀