
大數據最先“算”中奧斯卡 分析和預測成趨勢
第87屆奧斯卡頒獎禮22日在洛杉磯落下帷幕,如果你當時正眼巴巴盯著電視機或計算機屏幕等待評獎結果,那可有點落伍了。要知道,最早命中奧斯卡各重頭獎項的,并非捧起小金人的《鳥人》導演亞歷杭德羅·岡薩雷斯·伊尼亞里圖,也非“影帝”埃迪·雷德梅或者“影后”朱莉安·摩爾,而是幾乎無處不在的大數據。
無論是世界杯、超級碗,還是總統(tǒng)選舉,如今不少美國人都愿意首先看看大數據怎么說。大數據在預測方面的不俗表現,不僅可以讓商家、政客得以精準投錢,也可以引導未來市場和產品走向,在更深遠的范圍內尋找規(guī)律、解決問題。
相比這些大型比賽和活動來說,預測有點“任性”的奧斯卡,難度系數當屬最高級別。為奧斯卡投票的6600名電影藝術和科學學會成員是個匿名團體,對這個團體建立數學模型進行奧斯卡評選結果預測向來不被看好,而測算全球影迷喜好與投票人以及提名影片的關聯度也難度頗高。與業(yè)內權威人士觀點相比,大數據的勝算貌似不大。
曾在美國總統(tǒng)選舉預測中表現出眾的數據分析網站“538網站”就曾發(fā)表題為“為何難以預測奧斯卡得主”的文章,并得出結論認為,如今準確預測奧斯卡的模型也許并不存在。
不過,包括“538網站”在內的數據分析公司和相關專家,并沒有“放棄”奧斯卡。在本屆奧斯卡角逐中,在數據分析方法、數據挖掘、數據建模等方面的相關探索不斷涌現。
早在奧斯卡頒獎幾天前,微軟研究院經濟學家戴維·羅思柴爾德就在他和他的團隊開設的“聰明預測(PredictWise)”網站上公布了大數據預測結果,準確預測了本屆奧斯卡最佳電影、最佳導演、最佳男女主角,以及最佳男女配角這些重頭獎項的獲獎者,準確率為100%,而對全部24個獎項也準確預測出其中21個。
羅思柴爾德使用的分析預測模型基于博彩市場、好萊塢證券交易所的大量數據建立,其預測結果會隨著時間和數據的變化而更新。去年,專門從事數據預測分析的羅思柴爾德也準確分析出奧斯卡24個獎項中的20個。
而與以往相比,類似嘗試更為多樣和豐富,不少數據分析公司和專家均希望借奧斯卡良機探索和驗證自己的新技術或新算法?!?38網站”利用奧斯卡前16個重要獎項的評選結果進行數據分析;“指數(Exponential)”公司試圖利用數據模型找到提名影片在影迷群體和投票人之間的關聯度;數據公司“森扎里(Senzari)”負責運營的“電影圖表(MovieGraph)”服務平臺還研究起提名影片是否包含悲劇、涉及道德等因素,他們認為,在過去10年中,超過一半的獲獎影片打出了悲情牌……
無論那些為奧斯卡設計的數據模型和計算方法是否能得出足夠理想的最終結果,但可以肯定的是,數據分析和預測已經成為趨勢,大數據正嘗試將眾多領域“科學化”,就連藝術也無法置身事外。
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
CDA 數據分析師報考條件詳解與準備指南? ? 在數據驅動決策的時代浪潮下,CDA 數據分析師認證愈發(fā)受到矚目,成為眾多有志投身數 ...
2025-07-18剛入職場或是在職場正面臨崗位替代、技能更新、人機協(xié)作等焦慮的打工人,想要找到一條破解職場焦慮和升職瓶頸的系統(tǒng)化學習提升 ...
2025-07-182025被稱為“AI元年”,而AI,與數據密不可分。網易公司創(chuàng)始人丁磊在《AI思維:從數據中創(chuàng)造價值的煉金術 ...
2025-07-18CDA 數據分析師:數據時代的價值挖掘者 在大數據席卷全球的今天,數據已成為企業(yè)核心競爭力的重要組成部分。從海量數據中提取有 ...
2025-07-18SPSS 賦值后數據不顯示?原因排查與解決指南? 在 SPSS( Statistical Package for the Social Sciences)數據分析過程中,變量 ...
2025-07-18在 DBeaver 中利用 MySQL 實現表數據同步操作指南? ? 在數據庫管理工作中,將一張表的數據同步到另一張表是常見需求,這有助于 ...
2025-07-18數據分析師的技能圖譜:從數據到價值的橋梁? 在數據驅動決策的時代,數據分析師如同 “數據翻譯官”,將冰冷的數字轉化為清晰的 ...
2025-07-17Pandas 寫入指定行數據:數據精細化管理的核心技能? 在數據處理的日常工作中,我們常常需要面對這樣的場景:在龐大的數據集里精 ...
2025-07-17解碼 CDA:數據時代的通行證? 在數字化浪潮席卷全球的今天,當企業(yè)決策者盯著屏幕上跳動的數據曲線尋找增長密碼,當科研人員在 ...
2025-07-17CDA 精益業(yè)務數據分析:數據驅動業(yè)務增長的實戰(zhàn)方法論 在企業(yè)數字化轉型的浪潮中,“數據分析” 已從 “加分項” 成為 “必修課 ...
2025-07-16MySQL 中 ADD KEY 與 ADD INDEX 詳解:用法、差異與優(yōu)化實踐 在 MySQL 數據庫表結構設計中,索引是提升查詢性能的核心手段。無論 ...
2025-07-16解析 MySQL Update 語句中 “query end” 狀態(tài):含義、成因與優(yōu)化指南? 在 MySQL 數據庫的日常運維與開發(fā)中,開發(fā)者和 DBA 常會 ...
2025-07-16如何考取數據分析師證書:以 CDA 為例? ? 在數字化浪潮席卷各行各業(yè)的當下,數據分析師已然成為企業(yè)挖掘數據價值、驅動決策的 ...
2025-07-15CDA 精益業(yè)務數據分析:驅動企業(yè)高效決策的核心引擎? 在數字經濟時代,企業(yè)面臨著前所未有的數據洪流,如何從海量數據中提取有 ...
2025-07-15MySQL 無外鍵關聯表的 JOIN 實戰(zhàn):數據整合的靈活之道? 在 MySQL 數據庫的日常操作中,我們經常會遇到需要整合多張表數據的場景 ...
2025-07-15Python Pandas:數據科學的瑞士軍刀? ? 在數據驅動的時代,面對海量、復雜的數據,如何高效地進行處理、分析和挖掘成為關鍵。 ...
2025-07-15用 SQL 生成逆向回滾 SQL:數據操作的 “后悔藥” 指南? 在數據庫操作中,誤刪數據、錯改字段或誤執(zhí)行批量更新等問題時有發(fā)生。 ...
2025-07-14t檢驗與Wilcoxon檢驗的選擇:何時用t.test,何時用wilcox.test? t 檢驗與 Wilcoxon 檢驗的選擇:何時用 t.test,何時用 wilcox. ...
2025-07-14AI 浪潮下的生存與進階: CDA數據分析師—開啟新時代職業(yè)生涯的鑰匙(深度研究報告、發(fā)展指導白皮書) 發(fā)布機構:CDA數據科 ...
2025-07-13LSTM 模型輸入長度選擇技巧:提升序列建模效能的關鍵? 在循環(huán)神經網絡(RNN)家族中,長短期記憶網絡(LSTM)憑借其解決長序列 ...
2025-07-11