
英特爾公司的創(chuàng)始人之一戈登?摩爾在1965年發(fā)現(xiàn)了一個(gè)驚人的趨勢,即集成電路芯片上所集成的電路的數(shù)目每隔18個(gè)月就翻一番,該發(fā)現(xiàn)被業(yè)界譽(yù)為摩爾定律。后來也有被描述為微處理器的性能每隔18個(gè)月提高一倍,或價(jià)格下降一半;或用同等價(jià)錢能買到的電腦性能(速度和儲(chǔ)存量)每隔18個(gè)月翻一番,等等。
40多年在人類滄海桑田的歷史上僅僅是彈指一揮間,摩爾定律卻見證了電腦的數(shù)據(jù)處理和儲(chǔ)存能力從K(Kilobyte)到M(Megabyte)到G(Gigabyte)到T(Terabyte)的變遷。尤其是互聯(lián)網(wǎng)的出現(xiàn),讓我們急速地跨入了大數(shù)據(jù)(Big Data)時(shí)代。其主要的驅(qū)動(dòng)力有以下幾點(diǎn):
1、隨著社會(huì)經(jīng)濟(jì)的發(fā)展和個(gè)人收入的增加,人們的個(gè)性化需求開始凸顯。而企業(yè)要去高效地滿足這些個(gè)性化的需求則需要大量的數(shù)據(jù)支持。
2、互聯(lián)網(wǎng)的出現(xiàn)和相關(guān)技術(shù)的發(fā)展讓海量數(shù)據(jù)的收集和分析成為可能。互聯(lián)網(wǎng)的特征又導(dǎo)致這些數(shù)據(jù)能夠被高速度和大容量的傳播。
3、互聯(lián)網(wǎng)引入了由用戶產(chǎn)生數(shù)據(jù)的模式。這種模式的特征是多源頭,低成本,更及時(shí)。當(dāng)然,這些數(shù)據(jù)的真實(shí)性和可靠性需要被核證。
4、構(gòu)建在互聯(lián)網(wǎng)基礎(chǔ)上的電子商務(wù)和傳統(tǒng)零售比較的優(yōu)勢之一就是數(shù)據(jù)的可獲得性。電子商務(wù)可以實(shí)時(shí)得到顧客的來訪源頭,在網(wǎng)站內(nèi)的搜索、收藏、購買行為,以及購買的商品間的關(guān)聯(lián)性。這些數(shù)據(jù)可以幫助企業(yè)更精準(zhǔn)的為顧客服務(wù)。
5、人工智能、信息系統(tǒng)和決策科學(xué)的發(fā)展促進(jìn)了多種分析方法及工具的推動(dòng),包括數(shù)據(jù)挖掘,顧客行為模型,決策支持,等等。
數(shù)據(jù)(Data)是原始和零散的,經(jīng)過過濾和組織后成為信息(Information),將相關(guān)聯(lián)的信息整合和有效的呈現(xiàn)則成為知識(shí)(Knowledge),對知識(shí)的深層領(lǐng)悟而升華到理解事物的本質(zhì)并可以舉一反三則為智慧(Wisdom)。所以數(shù)據(jù)是源頭,是決策和價(jià)值創(chuàng)造的基石。
數(shù)據(jù)的應(yīng)用大致分以下幾個(gè)步驟:a.數(shù)據(jù)采集、核實(shí)與過濾;b.在數(shù)據(jù)倉庫內(nèi)的分類和儲(chǔ)存;c.數(shù)據(jù)挖掘以找到數(shù)據(jù)所隱含的規(guī)律和數(shù)據(jù)間的關(guān)聯(lián);d.數(shù)據(jù)模型建立和參數(shù)調(diào)整;e.基于數(shù)據(jù)的應(yīng)用開發(fā)和決策支持。下面用實(shí)例來說明。
1、美國醫(yī)藥網(wǎng)站W(wǎng)ebMD根據(jù)懷孕的女性用戶填寫的受孕信息定期給用戶寄EDM,提醒母親在該時(shí)間點(diǎn)的注意事項(xiàng),需要攝入的營養(yǎng),產(chǎn)前的生理變化和要做好的思想準(zhǔn)備,產(chǎn)后的恢復(fù),寶寶的育養(yǎng)和健康,等等?
2、1號(hào)店利用對大數(shù)據(jù)的分析給顧客發(fā)送個(gè)性化EDM。若顧客曾經(jīng)在1號(hào)店網(wǎng)站上查看過一個(gè)商品而沒有購買,則有幾種可能:a.缺貨,b.價(jià)格不合適,c.不是想要的品牌或不是想要的商品,d.只是看看? 若在顧客查看時(shí)該商品缺貨則到貨時(shí)立即通知顧客;若當(dāng)時(shí)有貨而顧客沒有買就很有可能是因?yàn)閮r(jià)格引起的,則在該商品降價(jià)促銷時(shí)通知顧客;同時(shí),在引入和該商品相類似或相關(guān)聯(lián)的商品時(shí)溫馨告知顧客。另外,通過挖掘顧客的周期性購買習(xí)慣,在臨近顧客的購買周期時(shí)適時(shí)的提醒顧客。
3、淘寶在2012年推出了淘寶時(shí)光機(jī)? 該應(yīng)用通過分析顧客自注冊為用戶以來的行為,用幽默生動(dòng)的語言告知顧客淘寶的成長,和該用戶相類似喜好的其他用戶的統(tǒng)計(jì)行為,對該顧客經(jīng)過分析后對其喜好的了解和對其行為的預(yù)測,等等。用生動(dòng)的文稿和個(gè)性化的數(shù)據(jù)、拉近了和顧客的距離?
4、Google的Adsense對顧客的搜索過程和其對各網(wǎng)站的關(guān)注度進(jìn)行數(shù)據(jù)挖掘? 并在其聯(lián)盟內(nèi)的網(wǎng)站追蹤顧客的去向,在聯(lián)盟網(wǎng)站上推出和顧客潛在興趣相匹配的廣告,精準(zhǔn)化營銷,提高轉(zhuǎn)化率?
5、Amazon近幾年推出了FDFC(Forward Deployed Fulfillment Center)的概念,以加快對顧客配送的速度。Amazon的訂單履行中心分兩個(gè)層級(jí):FC和FDFC,其中FC品種更齊全,而FDFC在物理位置上更靠近目標(biāo)市場,但品種重點(diǎn)容納針對目標(biāo)市場的熱銷商品,顧客的大部分需求可以通過FDFC來滿足,不能滿足的長尾商品則由FC來滿足。這樣顧客急需的商品多數(shù)可以通過FDFC以更快捷和低成本的物流來完成。由于熱銷商品是隨著時(shí)間和季節(jié)而改變的,故將什么商品儲(chǔ)存在FDFC的決策是動(dòng)態(tài)調(diào)整的,而此決策的依據(jù)就是對顧客需求的分析和預(yù)測。
各種應(yīng)用的例子難以窮舉,但趨勢十分清楚:大數(shù)據(jù)的應(yīng)用價(jià)值和潛力不再被人低估。但并不是所有企業(yè)都能在大數(shù)據(jù)這個(gè)金礦里真正挖到金子的。只有那些有遠(yuǎn)見有視野,重視系統(tǒng),舍得投入,吸引了優(yōu)秀的分析和系統(tǒng)人才的企業(yè)才會(huì)有所斬獲。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10