
大數(shù)據(jù)+人工智能,真能幫你填對高考志愿
2018年高考成績發(fā)榜在即,許多考生家長面臨難題:志愿怎么填?連日來,市場上涌現(xiàn)出不少“大數(shù)據(jù)分析輔助服務(wù)”,從承諾預(yù)測錄取概率,到保證準確將今年的成績排名換算后與往年比較,確定填報策略,報價從數(shù)千元到上萬元不等,最高甚至達到5萬元。
天價大數(shù)據(jù)咨詢服務(wù)靠譜嗎?隨著海量數(shù)據(jù)分析與人工智能技術(shù)不斷拓展應(yīng)用疆界,考試選拔和錄取又會有怎樣的未來?
技術(shù)上可行,條件有所欠缺
曾有人將大數(shù)據(jù)比作信息富礦,通過有效的提取方式,相較傳統(tǒng)規(guī)模的數(shù)據(jù)研究,可能獲得新的寶藏。比如,谷歌公司憑借對搜索數(shù)據(jù)的分析,成功預(yù)測2013年美國流感爆發(fā);微軟公司通過大數(shù)據(jù)分析處理,對奧斯卡金像獎作出“預(yù)言”,結(jié)果除“最佳導(dǎo)演”外,其余13項大獎全部命中。如今,大數(shù)據(jù)技術(shù)已進入金融、科研等領(lǐng)域。國內(nèi)外均有企業(yè)通過分析社會人群對股票的關(guān)注熱度,做出在證券市場的買賣決定,獲得高額回報。
那么,當這一技術(shù)進入志愿填報分析領(lǐng)域,也能獲得有價值的新信息嗎?上海大學(xué)教授葉志明坦言,技術(shù)上是可行的,但今天大數(shù)據(jù)服務(wù)若真要進入市場,成為考生們填報志愿的參考依據(jù),條件上仍有所欠缺。他認為,每年填報志愿前,有關(guān)考試管理部門及各高校,都會提供相當多的信息,其中涵蓋往年各專業(yè)的錄取分數(shù)線、招錄計劃數(shù)等,在充分“吃”透招錄投檔政策后,運用數(shù)據(jù)分析以及人工智能等方式,或許可以在知分情況下,得出學(xué)生被某高校、某專業(yè)錄取的概率。
“但要注意一點,在新高考大背景下,過去多年數(shù)據(jù)基礎(chǔ)上的分析結(jié)果,是沒有參考價值的?!比~志明說。例如,去年上海高考才開始“文理不分科”,今年延續(xù)這一模式。換句話說,僅有一年的積累,對于以海量數(shù)據(jù)為基礎(chǔ)的大數(shù)據(jù)分析顯然不夠。即便可以作為參考,失誤率可能會非常高。
何況,以往考試錄取也有“大年小年”之說,短期數(shù)據(jù)表達的趨勢難以給出準確預(yù)測。用葉志明的話來說,大數(shù)據(jù)要真正對填報志愿起到指導(dǎo)作用,“起碼要積累三到五年以上”。
忌盲目跟風,多聽內(nèi)心聲音
不可否認的是,當前,這一咨詢服務(wù)確實有市場需求?!昂芏鄶?shù)據(jù)和信息,我們不知道從哪里找,找到了也不會看,花點錢找人幫我們分析,可以接受。”一位選擇咨詢服務(wù)的考生家長說,“聽說他們有不少考試部門的內(nèi)部數(shù)據(jù),這些是不是更有用?”
為此,記者專門咨詢了本市考試院相關(guān)部門,院方明確表示,除可以向社會公開的信息外,不會對外提供任何招錄信息。
信息領(lǐng)域業(yè)內(nèi)人士指出,大數(shù)據(jù)可靠的前提在于數(shù)據(jù)的完整性和準確性,即使解決了這一問題,以數(shù)據(jù)為磚,構(gòu)建準確有效的數(shù)學(xué)模型并非易事。舉例說,若在一個小村莊,兩個人面貌相似,那么判斷其兩者具有血緣關(guān)系的準確性較高。但若在幾千萬人口的大城市,做出這一判斷,可信度大大降低。在大數(shù)據(jù)分析中,由于信息海量且多元異構(gòu),影響結(jié)果的要素繁多,若不能精準驗證,往往會誤解兩個參數(shù)之間具有相關(guān)性,影響整個結(jié)論。又比如,大數(shù)據(jù)涉及幾萬個、幾百萬個乃至數(shù)百億個變量,這意味著如果每個變量都造成一點點誤差,最后的預(yù)測會是很多誤差的疊加。前者是“假相關(guān)”問題,后者是“誤差疊加”問題,兩者都是整個大數(shù)據(jù)研究學(xué)界面對的瓶頸,在高考填報志愿這個有“人心”變量參與的項目中,解決瓶頸問題或許要更長時間。
“個體決定行為,群體決定結(jié)果。”在上海社會調(diào)查研究中心上海財經(jīng)大學(xué)分中心主任徐國祥看來,即使考生個體獲得可以信賴的分析結(jié)果,也不能忘記一件事:從填報到錄取,高考招錄是牽一發(fā)而動全身的事,各自花落誰家,是由所有考生的群體選擇確定的。既然如此,比起盲目跟風、僅從外界給予的信息來確定志愿方向,倒不如在選擇時多聽聽自己“內(nèi)心的聲音”。
依托大數(shù)據(jù),可優(yōu)化招生計劃
目前來看,大數(shù)據(jù)技術(shù)在志愿分析領(lǐng)域似乎屢屢碰壁。那么未來這一前沿技術(shù)有沒有可能真正服務(wù)于志愿填報的現(xiàn)實需求,甚至在技術(shù)進一步完善后,可以點對點精準填報投檔,讓考生自動匹配進入理想的高校和專業(yè)?
上海大學(xué)計算機科學(xué)與技術(shù)系副主任武星打了個比方:“類似我們在12306上買火車票,平時隨便買,到了春節(jié)前票子就緊張,不可能所有人都買到最理想的車票,這其中直接原因就是需求大于供給。同理,在高校招錄過程中,優(yōu)質(zhì)教育資源的相對高地始終存在,也就是說需求始終大于供給,此時技術(shù)不是萬能的?!?br />
“不過,不必把技術(shù)應(yīng)用的視野局限于‘測算錄取概率’?!蔽湫钦J為,可以依托大數(shù)據(jù)分析測算,通過優(yōu)化招生計劃調(diào)整等路徑,提升招錄匹配度。
也有專家指出,不妨把大數(shù)據(jù)服務(wù)用在考生更多知情權(quán)上。例如,上海大學(xué)自去年起向社會開放網(wǎng)上精準數(shù)據(jù)服務(wù)“高中生志愿填報與職業(yè)發(fā)展服務(wù)系統(tǒng)”,把10年積累的上海大學(xué)本科畢業(yè)生的精確數(shù)據(jù)共享,為考生選擇與其學(xué)業(yè)水平和興趣特長相匹配的專業(yè)提供參考。只需登錄服務(wù)系統(tǒng)網(wǎng)站,即可獲得個性化志愿填報指導(dǎo),信息數(shù)據(jù)涵蓋全校各專業(yè)畢業(yè)生的考研、出國、就業(yè)和創(chuàng)業(yè)情況,甚至細致到畢業(yè)生去了哪些行業(yè)、哪些具體的單位,包括第一份工作薪資情況等。
還有觀點認為,在當前平行志愿填報、知分后填報的模式下,若過度追逐估測錄取概率,可能產(chǎn)生“分數(shù)利益最大化”傾向,即只算這個分數(shù)進哪個學(xué)校專業(yè)最合算,忽視了志愿填報除了看分數(shù),更重要的是對自身興趣和規(guī)劃的認知。如何在這件人生大事上用好新技術(shù),值得家長、考生、研究者、機構(gòu)各方細細思量。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10