
大數(shù)據(jù)計(jì)算你和學(xué)霸的距離
在成都最冷的20天里還能堅(jiān)持早起吃早餐;總是在晚上10點(diǎn)到11點(diǎn)之間洗澡;在教學(xué)樓打水近80次……正值開學(xué)季,電子科技大學(xué)教育大數(shù)據(jù)研究所的數(shù)據(jù)顯示,普通的你,和學(xué)霸之間,恐怕就差了這些“微不足道”的行為。
這個(gè)頗有意思的發(fā)現(xiàn),來源于覆蓋了電子科大兩萬余名本科生的大數(shù)據(jù)系統(tǒng)——“學(xué)生畫像”,其將每名學(xué)生幾乎所有的在?;顒?dòng)軌跡與成績(jī)之間建立了關(guān)聯(lián)。利用這些數(shù)據(jù),不僅能預(yù)算出學(xué)生的學(xué)習(xí)狀況,研究者還希望依此引導(dǎo)他們更好地規(guī)劃各自的學(xué)業(yè)和就業(yè)方向。
學(xué)霸的生活軌跡
傳統(tǒng)教育認(rèn)為,學(xué)生有規(guī)律的生活,是學(xué)生提高成績(jī)的重要保證。
“普遍情況下,良好的行為習(xí)慣與學(xué)習(xí)成績(jī)是呈正相關(guān)的,這基本是得到公認(rèn)的?!?1世紀(jì)教育研究院副院長(zhǎng)熊丙奇表示,這些行為習(xí)慣,有的與成績(jī)變動(dòng)直接相關(guān),例如學(xué)生按時(shí)上下課,常去圖書館等;還有一些與成績(jī)的變動(dòng)是間接相關(guān)的,比如養(yǎng)成早起的習(xí)慣,經(jīng)常洗衣服,有規(guī)律的打水等。“雖然不直接作用于學(xué)生的學(xué)習(xí),但是,好的生活習(xí)慣,反映的是學(xué)生積極的狀態(tài),說明學(xué)生自我管理的能力較強(qiáng)。那么,這些學(xué)生用在學(xué)習(xí)上的時(shí)間也相對(duì)有保證,也就勢(shì)必會(huì)對(duì)學(xué)習(xí)成績(jī)產(chǎn)生影響?!?/span>
不過,必須承認(rèn),這個(gè)被普遍接受的結(jié)論很難被定量描述?!叭绻覀兡芏康刈C明已有的依據(jù),并提出科學(xué)的可參照的建議,這項(xiàng)研究就是有價(jià)值的。”電子科技大學(xué)教育大數(shù)據(jù)研究所副所長(zhǎng)連德富這樣解釋這項(xiàng)研究的初衷。
如今,研究團(tuán)隊(duì)已經(jīng)花了一年多的時(shí)間記錄學(xué)生的校內(nèi)行為,包括吃飯、購物、打水、進(jìn)出圖書館、借閱圖書、宿舍門禁、洗澡、使用洗衣機(jī)、乘坐公交等。結(jié)果發(fā)現(xiàn),學(xué)霸有著與一般學(xué)生完全不同的學(xué)習(xí)生活軌跡。
以某專業(yè)排名第3的學(xué)生為例,她幾乎每天固定在8點(diǎn)、12點(diǎn)、14點(diǎn)三個(gè)時(shí)間點(diǎn)出門,留在宿舍的總時(shí)長(zhǎng)低于專業(yè)平均水平。而該專業(yè)成績(jī)排名第61的小石每天進(jìn)出宿舍的時(shí)間很隨機(jī),而且通常每次外出的時(shí)長(zhǎng)不超過2小時(shí),“宅指數(shù)”明顯高于專業(yè)平均水平。
此外,成績(jī)最好的學(xué)生吃早餐次數(shù)在110次,成績(jī)最差的學(xué)生吃早餐次數(shù)僅為60次。9點(diǎn)前出現(xiàn)在食堂吃早餐的同學(xué),成績(jī)相對(duì)更好。成績(jī)較好的學(xué)生集中在晚上10到11點(diǎn)之間洗澡,而成績(jī)較差的學(xué)生,洗澡時(shí)間無明顯規(guī)律。
除作息規(guī)律以外,進(jìn)出圖書館次數(shù)也是重要指標(biāo)。第一學(xué)期,成績(jī)最好的學(xué)生進(jìn)入圖書館的次數(shù)為55次,成績(jī)最差的學(xué)生進(jìn)入圖書館的次數(shù)為35次;到了第四學(xué)期,成績(jī)最好的學(xué)生進(jìn)入圖書館的次數(shù)為61次,成績(jī)最差的學(xué)生進(jìn)入圖書館的次數(shù)為18次。
同樣的情況還存在于教學(xué)樓。學(xué)生去教學(xué)樓飲水機(jī)上打水次數(shù)越多,就說明學(xué)生長(zhǎng)期在教學(xué)樓里活動(dòng)。第三學(xué)期的數(shù)據(jù)顯示,成績(jī)最好的學(xué)生在教學(xué)樓打水近80次,成績(jī)最差的學(xué)生在教學(xué)樓打水不到10次。
尤其讓連德富印象深刻的是,不同成績(jī)的學(xué)生在借閱圖書的種類上也有明顯的區(qū)別。他發(fā)現(xiàn),《蝴蝶公墓》《變態(tài)心理學(xué)》等帶有懸疑色彩的圖書,借閱者的成績(jī)普遍不理想。
過去,要想清楚地知道不同成績(jī)水平的學(xué)生群體與他們的行為特征之間一一的對(duì)應(yīng)關(guān)系是非常困難的,但有了大數(shù)據(jù)的幫助,一切變得簡(jiǎn)單起來。
“學(xué)生畫像”還能做什么
僅僅根據(jù)學(xué)生行為習(xí)慣的數(shù)據(jù)統(tǒng)計(jì),就可以制定出學(xué)霸路線嗎?
要想精確刻畫一個(gè)人需要用無數(shù)的數(shù)據(jù),但連德富認(rèn)為,校園就是一個(gè)擁有豐富數(shù)據(jù)的很小的社會(huì)系統(tǒng),只要這些數(shù)據(jù)能與目標(biāo)聯(lián)系起來,就有一定的指示作用。
事實(shí)上,“學(xué)生畫像”的首要功能,就是算出每名學(xué)生的學(xué)習(xí)、生活狀態(tài),并設(shè)計(jì)出一系列輔助他們更好規(guī)劃各自學(xué)業(yè)的功能模塊。目前已經(jīng)實(shí)現(xiàn)的是掛科預(yù)警。
據(jù)了解,研究團(tuán)隊(duì)設(shè)計(jì)了一個(gè)針對(duì)掛科率的公式,即過去的學(xué)習(xí)基礎(chǔ)+一段時(shí)期內(nèi)的努力程度。學(xué)習(xí)基礎(chǔ)是根據(jù)已考科目成績(jī)、已考與將考科目之間的關(guān)聯(lián)性計(jì)算得出的,而努力程度則主要依據(jù)教學(xué)樓打水頻率、進(jìn)出圖書館的時(shí)間與次數(shù)等。
如果有學(xué)生正處于掛科率高風(fēng)險(xiǎn)的邊緣,系統(tǒng)就會(huì)自動(dòng)向負(fù)責(zé)該名學(xué)生的輔導(dǎo)員發(fā)送預(yù)警信息。而在過去,只有當(dāng)學(xué)生已經(jīng)出現(xiàn)掛科的情況,輔導(dǎo)員才能得知,即便如此,事后也很難分析學(xué)生掛科的具體原因。
“目前,教育大數(shù)據(jù)暫時(shí)的定位還是輔助傳統(tǒng)教育,管理、引導(dǎo)學(xué)生?!边B德富表示。
除了關(guān)注學(xué)生成績(jī),他相信,現(xiàn)在的校園里依然充滿了像當(dāng)初的自己那樣對(duì)未來迷茫的人?!拔覀兌荚悦_^,不知道自己喜歡什么,可以做什么。”
如何利用“學(xué)生畫像”幫助學(xué)生找到適合自己的路,是研究團(tuán)隊(duì)正在努力的方向。目前,數(shù)據(jù)庫不僅有現(xiàn)有學(xué)生的行為軌跡,還有已經(jīng)畢業(yè)的學(xué)長(zhǎng)們的行為軌跡。連德富告訴《中國科學(xué)報(bào)》記者,最終選擇考研、出國或者創(chuàng)業(yè)的學(xué)生,在生活、學(xué)習(xí)方式上是存在一些差異的。
比如,打算出國的學(xué)生在選修課程、借閱圖書時(shí)都會(huì)偏向語言方面的內(nèi)容,而偏好創(chuàng)業(yè)的學(xué)生則與一項(xiàng)很有意思的數(shù)據(jù)產(chǎn)生關(guān)聯(lián)。由于電子科大在成都郊區(qū),學(xué)生進(jìn)市區(qū)需要乘坐一趟班車,有的學(xué)生去市區(qū)的頻率明顯要高于其他同學(xué),這也意味著他們的社交行為可能更為豐富。
“學(xué)生畫像”可以將現(xiàn)有學(xué)生的行為軌跡與已經(jīng)畢業(yè)的學(xué)長(zhǎng)們的行為軌跡進(jìn)行比對(duì),如果在選課、借閱圖書、參加社團(tuán)活動(dòng)等方面的軌跡與某類去向的畢業(yè)學(xué)生比較相似,學(xué)校就可以提供相關(guān)方面的建議、指導(dǎo)。
對(duì)此,21世紀(jì)教育研究院副院長(zhǎng)熊丙奇也表示,傳統(tǒng)的大學(xué)教育對(duì)學(xué)生的管理是比較松散的,因此,通過對(duì)學(xué)生生活、學(xué)習(xí)的數(shù)據(jù)分析,掌握學(xué)生的目標(biāo)動(dòng)向,有助于學(xué)校對(duì)學(xué)生進(jìn)行合理的引導(dǎo),無論是學(xué)習(xí)還是參與社會(huì)活動(dòng),都能夠有的放矢地幫助學(xué)生作進(jìn)一步規(guī)劃。
中科院心理所研究員尹文剛則將關(guān)注點(diǎn)瞄準(zhǔn)了當(dāng)下大學(xué)生的心理健康問題。
“學(xué)生從高壓的中學(xué)時(shí)期,進(jìn)入完全需要自我管理的大學(xué)生活,一時(shí)間無法適應(yīng),容易出現(xiàn)心理問題。一旦受挫,通常選擇回避的態(tài)度,甚至?xí)霈F(xiàn)抑郁的情況,更嚴(yán)重的可能危及生命?!币膭傊毖?,近年來,大學(xué)生頻繁曝出跳樓、傷害同學(xué)事件,都與心理健康密切相關(guān)。
他認(rèn)為,通過教育大數(shù)據(jù),可以及時(shí)掌握學(xué)生的行為習(xí)慣特征,一旦發(fā)生明顯異常,比如長(zhǎng)期獨(dú)處、很少參與公共生活等情況,學(xué)校就可以適當(dāng)關(guān)注學(xué)生的心理健康問題,采取相應(yīng)對(duì)策。
研究團(tuán)隊(duì)正在挖掘“學(xué)生畫像”在關(guān)注學(xué)生心理健康方面的作用。他們可以根據(jù)學(xué)生的行為習(xí)慣來量化“孤獨(dú)”。
性格孤僻、有強(qiáng)烈的孤獨(dú)感,往往被認(rèn)為是抑郁易感人群具有的一些共性特征。他們發(fā)現(xiàn),學(xué)校最孤獨(dú)的一群人出現(xiàn)心理問題的概率比普通人高一個(gè)數(shù)量級(jí)。因此,研究團(tuán)隊(duì)正在設(shè)計(jì)算法,依據(jù)“30天內(nèi),兩個(gè)素不相識(shí)的人,有兩次或兩次以上前后腳打水、打飯、進(jìn)公寓、進(jìn)出圖書館或坐公交車經(jīng)歷的概率,不超過十二萬分之一”的結(jié)論,可算出每名學(xué)生的“在校朋友圈”,以此量化學(xué)生孤獨(dú)的程度。
在尹文剛看來,預(yù)知大學(xué)生的行為習(xí)慣所隱含的心理問題,特別是關(guān)注學(xué)生的變化,對(duì)于開展學(xué)生工作是非常有幫助的。
從這些角度看,大數(shù)據(jù)在教育領(lǐng)域的應(yīng)用是有一定價(jià)值的。
如何保護(hù)學(xué)生隱私
打水刷卡、進(jìn)圖書館刷卡、進(jìn)宿舍房間刷卡……在校園逐步實(shí)施一卡通的時(shí)代,學(xué)生大數(shù)據(jù)已經(jīng)變得易得而且可控。學(xué)校一方面依靠大數(shù)據(jù)加強(qiáng)對(duì)學(xué)生的管理,一方面也要照顧到學(xué)生的隱私,尊重學(xué)生的行為習(xí)慣。因此,如何合理使用大數(shù)據(jù),同時(shí)又保護(hù)學(xué)生隱私,就成為了一個(gè)重要的問題。
“如果讓學(xué)生感覺生活在學(xué)校的監(jiān)控下,那么即使學(xué)校的出發(fā)點(diǎn)是好的,希望能夠?qū)W(xué)生的行為及心理進(jìn)行合理引導(dǎo),這種舉措也無疑會(huì)讓學(xué)生反感?!毙鼙嫣貏e提示學(xué)校在運(yùn)用大數(shù)據(jù)的時(shí)候,要考慮到學(xué)生的隱私及習(xí)慣。
對(duì)此,連德富表示,“學(xué)生畫像”在保護(hù)數(shù)據(jù)隱私方面是非常謹(jǐn)慎的。
“設(shè)計(jì)系統(tǒng)功能時(shí),很重要的一方面是數(shù)據(jù)PK。”連德富介紹說,希望每名學(xué)生除了能在系統(tǒng)上看到自己的“畫像”外,還能看到自己與同專業(yè)同學(xué)比較后的相對(duì)優(yōu)勢(shì)和劣勢(shì)?!暗?,比較的根本目的是找到學(xué)習(xí)的模板,而不是與具體的某個(gè)個(gè)體比高下?!?/span>
因此,在申請(qǐng)PK時(shí),系統(tǒng)是存在強(qiáng)權(quán)限管理的。發(fā)起比對(duì)的學(xué)生必須經(jīng)過對(duì)方的允許,才能看到對(duì)方的畫像。但是連德富透露,由于該功能涉及的數(shù)據(jù)隱私比較敏感,目前并沒有向?qū)W生端開放。
而已有的面向輔導(dǎo)員的端口,所涉及的數(shù)據(jù)經(jīng)過嚴(yán)格的加密處理,系統(tǒng)不保存學(xué)生的真實(shí)姓名及學(xué)號(hào),只有出現(xiàn)重要預(yù)警信息,才會(huì)自動(dòng)給相應(yīng)的輔導(dǎo)員進(jìn)行短信推送。這意味著,任何一個(gè)技術(shù)人員都看不到學(xué)生個(gè)人的信息,而輔導(dǎo)員最多能夠掌握自己負(fù)責(zé)學(xué)生可能出現(xiàn)的重大問題。
連德富堅(jiān)持認(rèn)為,教育大數(shù)據(jù)不會(huì)刻意強(qiáng)調(diào)每個(gè)個(gè)體的情況,而是反映學(xué)生整體的生活、學(xué)習(xí)狀況,以及時(shí)預(yù)測(cè)預(yù)警學(xué)生的異常狀況,從而為學(xué)校的決策提供數(shù)據(jù)支撐。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-18剛?cè)肼殘?chǎng)或是在職場(chǎng)正面臨崗位替代、技能更新、人機(jī)協(xié)作等焦慮的打工人,想要找到一條破解職場(chǎng)焦慮和升職瓶頸的系統(tǒng)化學(xué)習(xí)提升 ...
2025-07-182025被稱為“AI元年”,而AI,與數(shù)據(jù)密不可分。網(wǎng)易公司創(chuàng)始人丁磊在《AI思維:從數(shù)據(jù)中創(chuàng)造價(jià)值的煉金術(shù) ...
2025-07-18CDA 數(shù)據(jù)分析師:數(shù)據(jù)時(shí)代的價(jià)值挖掘者 在大數(shù)據(jù)席卷全球的今天,數(shù)據(jù)已成為企業(yè)核心競(jìng)爭(zhēng)力的重要組成部分。從海量數(shù)據(jù)中提取有 ...
2025-07-18SPSS 賦值后數(shù)據(jù)不顯示?原因排查與解決指南? 在 SPSS( Statistical Package for the Social Sciences)數(shù)據(jù)分析過程中,變量 ...
2025-07-18在 DBeaver 中利用 MySQL 實(shí)現(xiàn)表數(shù)據(jù)同步操作指南? ? 在數(shù)據(jù)庫管理工作中,將一張表的數(shù)據(jù)同步到另一張表是常見需求,這有助于 ...
2025-07-18數(shù)據(jù)分析師的技能圖譜:從數(shù)據(jù)到價(jià)值的橋梁? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,數(shù)據(jù)分析師如同 “數(shù)據(jù)翻譯官”,將冰冷的數(shù)字轉(zhuǎn)化為清晰的 ...
2025-07-17Pandas 寫入指定行數(shù)據(jù):數(shù)據(jù)精細(xì)化管理的核心技能? 在數(shù)據(jù)處理的日常工作中,我們常常需要面對(duì)這樣的場(chǎng)景:在龐大的數(shù)據(jù)集里精 ...
2025-07-17解碼 CDA:數(shù)據(jù)時(shí)代的通行證? 在數(shù)字化浪潮席卷全球的今天,當(dāng)企業(yè)決策者盯著屏幕上跳動(dòng)的數(shù)據(jù)曲線尋找增長(zhǎng)密碼,當(dāng)科研人員在 ...
2025-07-17CDA 精益業(yè)務(wù)數(shù)據(jù)分析:數(shù)據(jù)驅(qū)動(dòng)業(yè)務(wù)增長(zhǎng)的實(shí)戰(zhàn)方法論 在企業(yè)數(shù)字化轉(zhuǎn)型的浪潮中,“數(shù)據(jù)分析” 已從 “加分項(xiàng)” 成為 “必修課 ...
2025-07-16MySQL 中 ADD KEY 與 ADD INDEX 詳解:用法、差異與優(yōu)化實(shí)踐 在 MySQL 數(shù)據(jù)庫表結(jié)構(gòu)設(shè)計(jì)中,索引是提升查詢性能的核心手段。無論 ...
2025-07-16解析 MySQL Update 語句中 “query end” 狀態(tài):含義、成因與優(yōu)化指南? 在 MySQL 數(shù)據(jù)庫的日常運(yùn)維與開發(fā)中,開發(fā)者和 DBA 常會(huì) ...
2025-07-16如何考取數(shù)據(jù)分析師證書:以 CDA 為例? ? 在數(shù)字化浪潮席卷各行各業(yè)的當(dāng)下,數(shù)據(jù)分析師已然成為企業(yè)挖掘數(shù)據(jù)價(jià)值、驅(qū)動(dòng)決策的 ...
2025-07-15CDA 精益業(yè)務(wù)數(shù)據(jù)分析:驅(qū)動(dòng)企業(yè)高效決策的核心引擎? 在數(shù)字經(jīng)濟(jì)時(shí)代,企業(yè)面臨著前所未有的數(shù)據(jù)洪流,如何從海量數(shù)據(jù)中提取有 ...
2025-07-15MySQL 無外鍵關(guān)聯(lián)表的 JOIN 實(shí)戰(zhàn):數(shù)據(jù)整合的靈活之道? 在 MySQL 數(shù)據(jù)庫的日常操作中,我們經(jīng)常會(huì)遇到需要整合多張表數(shù)據(jù)的場(chǎng)景 ...
2025-07-15Python Pandas:數(shù)據(jù)科學(xué)的瑞士軍刀? ? 在數(shù)據(jù)驅(qū)動(dòng)的時(shí)代,面對(duì)海量、復(fù)雜的數(shù)據(jù),如何高效地進(jìn)行處理、分析和挖掘成為關(guān)鍵。 ...
2025-07-15用 SQL 生成逆向回滾 SQL:數(shù)據(jù)操作的 “后悔藥” 指南? 在數(shù)據(jù)庫操作中,誤刪數(shù)據(jù)、錯(cuò)改字段或誤執(zhí)行批量更新等問題時(shí)有發(fā)生。 ...
2025-07-14t檢驗(yàn)與Wilcoxon檢驗(yàn)的選擇:何時(shí)用t.test,何時(shí)用wilcox.test? t 檢驗(yàn)與 Wilcoxon 檢驗(yàn)的選擇:何時(shí)用 t.test,何時(shí)用 wilcox. ...
2025-07-14AI 浪潮下的生存與進(jìn)階: CDA數(shù)據(jù)分析師—開啟新時(shí)代職業(yè)生涯的鑰匙(深度研究報(bào)告、發(fā)展指導(dǎo)白皮書) 發(fā)布機(jī)構(gòu):CDA數(shù)據(jù)科 ...
2025-07-13LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11