
“大數(shù)據(jù)”熱潮:是什么,為什么,怎么樣?
大數(shù)據(jù)在IT界是一個(gè)長期以來的熱門話題,每天都有各種討論,但你掌握它到了什么樣的程度?在本文中,F(xiàn)ICO首席分析人員和FICO實(shí)驗(yàn)室的負(fù)責(zé)人安德魯?詹寧斯(Andrew Jennings)博士將以問答的形式,幫助我們深入理解這個(gè)主題。
1)在預(yù)測分析的歷史上,重要的里程碑都有哪些?
許多早期的里程碑是從20世紀(jì)30年代和40年代的軍事應(yīng)用。例如,阿蘭?圖靈(Alan Turing)和IJ Good在證據(jù)權(quán)重分配到特定的變量開發(fā)了一些突破性的工作,當(dāng)他們在二戰(zhàn)中參與解碼德國的代碼。20世紀(jì)50年代和60年代看到了建模方法的發(fā)展,如比爾·費(fèi)爾(Bill Fair)和厄爾?艾薩克(Earl Isaac)的信用評(píng)分工作。在20世紀(jì)90年代后期,隨著互聯(lián)網(wǎng)搜索和個(gè)性化的興起,由eBay、亞馬遜和谷歌引領(lǐng)了大數(shù)據(jù)的興起階段。
2)今天預(yù)測分析的一些常見的用途是什么?
預(yù)測分析在旅游行業(yè)廣泛使用,無論是設(shè)置飛行路徑和票價(jià),以及幫助消費(fèi)者找到最好的價(jià)格。在信貸行業(yè),它用于風(fēng)險(xiǎn)評(píng)估和欺詐檢測中心。當(dāng)然,許多行業(yè)的營銷人員使用它,以確定最佳的報(bào)價(jià)。
3)大數(shù)據(jù)無疑是在當(dāng)下的一個(gè)熱門話題,但是否有許多公司已經(jīng)在他們每天的日常運(yùn)作中使用大數(shù)據(jù)的洞見?
是的,一些公司整個(gè)的商業(yè)模式都基于大數(shù)據(jù)分析。Farecast就是一個(gè)例子,這家公司的成立,致力于幫助消費(fèi)者決定何時(shí)購買機(jī)票,以獲得最好的價(jià)格。
4)大數(shù)據(jù)的崛起如何影響分析的使用?
今天越來越多的公司認(rèn)識(shí)到,如果他們不能發(fā)揮數(shù)據(jù)的力量,他們將不會(huì)有競爭力。而在此之前,大多數(shù)的分析被我們稱為商業(yè)情報(bào),聚焦于報(bào)告,今天的企業(yè)了解個(gè)性化需求水平對(duì)于對(duì)抗互聯(lián)網(wǎng)巨頭如亞馬遜的作用,唯一的可能是,如果你能理解你的客戶要好得多,通過這種洞察力指導(dǎo)行動(dòng),提供更個(gè)性化的服務(wù)。這已經(jīng)推動(dòng)了分析需求的巨大增長 - 分析軟件行業(yè)從2000年的110億美元(72億英鎊)增長到2012年的350億美元(230億美英鎊)。
5)文本分析將有什么樣的影響?
文本分析和與其對(duì)應(yīng)的語音分析,將有一個(gè)巨大的影響。為了建立預(yù)測分析模型,信息必須提供數(shù)值的形式。自然語言處理使文本和語音能被轉(zhuǎn)換成數(shù)字化的格式,可以在建模中使用。由于大多數(shù)人類的溝通以語言為基礎(chǔ),我們在模型中將有一個(gè)更大的數(shù)據(jù)集可以使用,使我們能夠真正地破解新問題。例如,對(duì)人們在線搜索使用的術(shù)語進(jìn)行分析,可以確定在特定區(qū)域中爆發(fā)的一種疾病。
6)將分析融入云計(jì)算基礎(chǔ)設(shè)施,對(duì)產(chǎn)業(yè)意味著什么?
云計(jì)算降低了進(jìn)入分析的壁壘。和以往相比,更多公司將能夠訪問分析,而無需在軟件工具和硬件上花費(fèi)大量的金錢。首先,企業(yè)可以在云中使用建模工具。其次,企業(yè)可以訪問為具體業(yè)務(wù)問題預(yù)先開發(fā)的分析服務(wù),或迅速為他們的業(yè)務(wù)定制分析服務(wù)。第三,先進(jìn)的云可以把業(yè)務(wù)與社區(qū)分析專家聯(lián)系。第四,一些云創(chuàng)建一個(gè)“分析市場” - 一個(gè)由第三方開發(fā)的分析應(yīng)用程序商店。
7)一方面,大數(shù)據(jù)被認(rèn)為是解決許多緊迫的經(jīng)濟(jì)和社會(huì)挑戰(zhàn)的解決方案。另一方面,隱私倡導(dǎo)者爭論,一旦數(shù)據(jù)被收集,我們無法控制誰使用它,或是如何使用它。組織要如何克服這種消極的看法,或者有一個(gè)大數(shù)據(jù)的道德準(zhǔn)則?
并沒有大數(shù)據(jù)的道德規(guī)范,但肯定的是,有誰能訪問什么樣的數(shù)據(jù)的管理,不僅在國家的水平,而且在行業(yè)層面的隱私法規(guī)。例如,(數(shù)據(jù)分析師)一個(gè)人的財(cái)務(wù)數(shù)據(jù),如信用局報(bào)告的數(shù)據(jù),有非常嚴(yán)格的規(guī)定。所面臨的挑戰(zhàn)是,新的數(shù)據(jù)源在網(wǎng)上迅速來臨,并有可能在某些情況下有一個(gè)巨大的鴻溝,數(shù)據(jù)變?yōu)榭捎玫?,法?guī)卻仍然滯后未到位。很重要的一點(diǎn)是,每一個(gè)使用數(shù)據(jù)的企業(yè)應(yīng)當(dāng)遵循隱私法規(guī)的精神,并考慮他們的使用是否會(huì)危及個(gè)人隱私。
8)當(dāng)前是否有足夠的分析專家可以滿足爆炸的業(yè)務(wù)需求呢?
沒有,這是一個(gè)問題。在2011年和2012年之間,“數(shù)據(jù)科學(xué)家”的崗位需求有15,000%的躍升。人才的缺口是全球性的,在分析、統(tǒng)計(jì)和運(yùn)籌學(xué)等方面訓(xùn)練有素的人需求旺盛。
不幸的是,全球性的需求意味著,我們所看到的一些人宣稱他們自己是分析專家們,實(shí)際上未經(jīng)這項(xiàng)工作需要的專業(yè)的訓(xùn)練。然而,大多數(shù)分析公司和在企業(yè)中的大多數(shù)分析師團(tuán)隊(duì),由知道求職者是否有必要的技能的分析師領(lǐng)導(dǎo)。理想的分析師需要有數(shù)學(xué)技能,解決問題的心態(tài),和良好的溝通技巧。當(dāng)然,還有一些有實(shí)力的大學(xué)在亞洲,他們的分析課程和畢業(yè)生是世界知名的,包括中國人民大學(xué)、對(duì)外經(jīng)濟(jì)貿(mào)易大、,印度統(tǒng)計(jì)研究所和印度理工學(xué)院,cda數(shù)據(jù)分析師協(xié)會(huì)。哈佛商業(yè)雜志稱為數(shù)據(jù)科學(xué)家為“21世紀(jì)最性感的工作”,所以這是數(shù)據(jù)分析師的一個(gè)很好的時(shí)代!
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
訓(xùn)練與驗(yàn)證損失驟升:機(jī)器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機(jī)器學(xué)習(xí)模型訓(xùn)練過程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對(duì)數(shù)據(jù)的需求已從 “存儲(chǔ)” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計(jì)基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計(jì)基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11