
客戶數據分析:知道的太多也不是好事_數據分析師培訓
數據被稱為21世紀的石油,其中客戶數據又是數據中最為重要的。大數據中與客戶數據有關的,包括社交媒體數據、電子郵件、調查、客戶服務數據等,很多組織都擁有很多數據。但是,很多數據還處在原油階段,沒能得到處理、提取、和加工,客戶數據還不能產生業(yè)務價值。只有組織采取行動,深挖數據,客戶數據才能有所貢獻,而不止是一堆0、1和文本。
因此,產生了客戶數據分析。不斷地,組織投資在數據分析領域,希望能夠從數據中挖掘價值,從而更好地開拓客戶、維護客戶。
例如,網購網站eBay就分析來自客戶數據庫和網站活動數據的銷售記錄,以此支持市場戰(zhàn)略,將主頁進行個性化調整,讓不同的用戶瀏覽到不同的內容。在2014大數據創(chuàng)新大會上,eBay前總裁Vadim Kutsyy表示,分析項目能夠幫助網站提高業(yè)務水平。
另外,eBay通過數據分析,盡量避免給客戶顯示過多廣告和客戶不感興趣的產品。eBay盡量為用戶提供積極的網站體驗,這也是Kutsyy的首要分析任務。他表示:“我總在問自己,我們的客戶是否從我們收集的數據中獲得了價值?”
Kutsyy介紹了一系列eBay正在使用的數據管理平臺和項目語言,比如Hadoop、Teradata數據倉庫和MySQL、Cassandra數據庫。但是他認為,要獲得正確的客戶分析,就不能依賴技術。組織采用的任何工具都是為客戶服務的??蛻絷P心的不是你用了Hadoop還是Teradata,或者你用的Java語言還是Python語言,客戶關心的是自己的體驗。
客戶分析
Netflix也采用了客戶數據分析,用來個性化在線流媒體服務,保證客戶能夠滿足于服務,按月支付月費。Netflix負責流科學算法的總監(jiān)Nirmal Govind表示,收集和分析用戶行為數據包括他們看的電影、觀看時間、和持有的互聯網賬號。他說:“我們有很多數據,顯示客戶的消費內容,他們喜歡什么。所有這些數據都可以用于優(yōu)化客戶體驗?!焙蚭Bay一樣,Netflix使用了很多技術來支撐數據分析項目,其中包括Teradata、Cassandra和開源Apache Hive數據倉庫軟件、Tableau的數據可視化工具。收集和準備數據之后,Govind的團隊采用了一系列的算法,比如根據用戶看什么樣的電影推薦什么樣的內容。2011年,Netflix開始開發(fā)它的原生內容。Los Gatos公司也挖掘客戶喜歡和不喜歡的數據,支撐內容推薦。
數據分析之路也有挑戰(zhàn)。Govind表示找到正確的推薦引擎是很困難的。推薦是基于基本參數進行的,很難準確地判斷出一個人想要看什么內容。為了調試好引擎,他的團隊做了很多A/B測試,基于不同的預測模型給不同的用戶進行推薦,然后追蹤每組用戶花在推薦內容上的時間。
工資和人力資源服務數據分析公司Paychex關注了其他方面的數據分析:使用攪動模型識別可能會采用他們服務的客戶。在去年的預測分析大會上,Paychex風險分析經理Philip O’Brien表示,他和他的團隊利用公司規(guī)模數據、交易歷史、客戶服務交互等數據構建模型,找到可能會購買公司產品的客戶。分析團隊發(fā)現,公司21%的客戶服務費用都花費在無論如何都是使用Paychex產品的客戶上了。O’Brien表示,公司根據攪動模型部署了之前描述的處理客戶數據的方法。但說服業(yè)務經理使用分析結果又成了一大挑戰(zhàn)。
在過去,公司有很多“屁股決定腳”的決策方式,他表示:“如果人們習慣了靠直覺辦事,你一定要向他們展示分析工具具體能帶來什么價值?!?/span>
客戶數據陷阱:知道的太多
這里有一個潛在的危機,即知道的太多。知道什么時候停止是分析客戶數據的重要一步。公司可能掌握了很多數據,但不正確地使用數據很可能會給客戶帶來不適,最終致使他們離開。
SearsHoldings公司的大數據高級經理、企業(yè)數據倉庫管理員、負責運營和部署的Andy McNalis表示,零售商分析客戶瀏覽歷史、購買記錄和地理位置數據來幫助自己設定和修改產品價格。但也有一些數據動不得。比如Sears的門店都有Wi Fi覆蓋,它可以看到客戶在使用Wi Fi查看競爭對手網站的價格。這時,公司可以給客戶推送優(yōu)惠券,但這樣做會讓客戶覺得Sears在監(jiān)視他,反而適得其反。
客戶數據分析還包括其他方面,不只是部署系統和捕捉數據那么簡單。Sears使用Hadoop集群和Teradata數據倉庫支持客戶分析項目,分析團隊用開源R語言等編程語言寫計算方法,再將其運行到基于Hadoop的數據分析和虛擬化工具上。
這時就需要技術熟練的人應用算法生成有用的信息,訪問和分析發(fā)現的內容。McNalis表示:“人們認為你在這邊把數據填進去,那邊就會出來一枚硬幣,但其實不是這樣的?!?/span>
數據分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數的日期轉換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數據處理中,日期格式轉換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數據庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數據分析師:表結構數據 “獲取 - 加工 - 使用” 全流程的賦能者 表結構數據(如數據庫表、Excel 表、CSV 文件)是企業(yè)數字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數據分析師:解鎖表結構數據特征價值的專業(yè)核心 表結構數據(以 “行 - 列” 規(guī)范存儲的結構化數據,如數據庫表、Excel 表、 ...
2025-09-17Excel 導入數據含缺失值?詳解 dropna 函數的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數據時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數據分析與統計學領域,假設檢驗是驗證研究假設、判斷數據差異是否 “ ...
2025-09-16CDA 數據分析師:掌控表格結構數據全功能周期的專業(yè)操盤手 表格結構數據(以 “行 - 列” 存儲的結構化數據,如 Excel 表、數據 ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數據分析師:激活表格結構數據價值的核心操盤手 表格結構數據(如 Excel 表格、數據庫表)是企業(yè)最基礎、最核心的數據形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調用、數據爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數據的科學計數法問題 為幫助 Python 數據從業(yè)者解決pd.read_csv讀取長浮點數據時的科學計數法問題 ...
2025-09-12CDA 數據分析師:業(yè)務數據分析步驟的落地者與價值優(yōu)化者 業(yè)務數據分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數據把關的實戰(zhàn)指南 在業(yè)務系統落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數據驅動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數據分析師與戰(zhàn)略 / 業(yè)務數據分析:概念辨析與協同價值 在數據驅動決策的體系中,“戰(zhàn)略數據分析”“業(yè)務數據分析” 是企業(yè) ...
2025-09-11Excel 數據聚類分析:從操作實踐到業(yè)務價值挖掘 在數據分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數據中挖 ...
2025-09-10統計模型的核心目的:從數據解讀到決策支撐的價值導向 統計模型作為數據分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10