
前段時(shí)間我和數(shù)據(jù)分析愛(ài)好者一起探討,在數(shù)據(jù)分析工作中遇到的很多相似問(wèn)題,經(jīng)過(guò)3個(gè)小時(shí)的激烈討論,我和我的數(shù)據(jù)分析小伙伴們得出的結(jié)論和大家分享下,大家一致認(rèn)為這3個(gè)因素是最只要的。
首先,大環(huán)境不尊重?cái)?shù)據(jù),尤其是老板的態(tài)度。如果數(shù)據(jù)分析師只要隨便給一個(gè)報(bào)告就行,數(shù)字多一點(diǎn)和少一點(diǎn),大家也是一笑而過(guò),并不會(huì)追根到底,那么很難讓數(shù)據(jù)分析師以嚴(yán)謹(jǐn)?shù)膽B(tài)度對(duì)待數(shù)據(jù)。
例如,國(guó)內(nèi)這幾家數(shù)據(jù)分析機(jī)構(gòu),基本都在著急擴(kuò)張行業(yè),爭(zhēng)著占領(lǐng)行業(yè),對(duì)于其推出的數(shù)據(jù)有多精準(zhǔn)卻不那么在意,所以艾瑞的數(shù)據(jù)最近才會(huì)經(jīng)常被人說(shuō)“不靠譜”。
數(shù)據(jù)分析,今天做得不準(zhǔn),明天再改是沒(méi)有用的。比如艾瑞,如果數(shù)據(jù)不穩(wěn)固,搶著做很多行業(yè),這是不靠譜的做法,指不定哪天砸了自己的牌子。
有人和我提過(guò)FACEBOOK數(shù)據(jù)分析師為什么那么牛,因?yàn)樗麄儾挥X(jué)得數(shù)據(jù)分析是一個(gè)苦事,十幾個(gè)人在一個(gè)房子里把數(shù)據(jù)分析當(dāng)做一件很開(kāi)心的事情來(lái)做,數(shù)據(jù)分析對(duì)于他們來(lái)說(shuō)是在追求科學(xué)。
第二,好的數(shù)據(jù)分析師需要一點(diǎn)天分,同時(shí)也需要高人點(diǎn)撥,但是電子商務(wù)這個(gè)圈子,真正懂?dāng)?shù)據(jù)分析的人不會(huì)超過(guò)10個(gè),所以一般人很難取得真經(jīng)。這和信仰一樣,沒(méi)有師傅領(lǐng)進(jìn)門(mén),難度也會(huì)大很多。
我回顧自己從微軟到易趣,再?gòu)亩鼗偷街Ц秾?,在?shù)據(jù)分析上有一次長(zhǎng)足的進(jìn)步,得益于從兩位老師的身上得到了許多啟發(fā)。一位是亞馬遜的首席科學(xué)家韋思 康,曾經(jīng),我告訴韋思康,KPI報(bào)告顯示敦煌網(wǎng)需要4秒鐘,他立馬讓我叫來(lái)做技術(shù)的同事(他要聽(tīng)到一線(xiàn)同學(xué)的反應(yīng)),問(wèn)這個(gè)4秒鐘怎么測(cè)算出來(lái),是美國(guó)人 打開(kāi)用4秒鐘,還是英國(guó)人打開(kāi)用4秒鐘,用的是甚么Browser等等。這個(gè)4秒鐘和商業(yè)價(jià)值(例如交易量)有關(guān)系嗎?我當(dāng)時(shí)很觸動(dòng),連這么一個(gè)很基礎(chǔ)的 數(shù)據(jù),他都是以求證的心態(tài)來(lái)分析的。更令我印象深刻的是,只請(qǐng)他當(dāng)敦煌網(wǎng)顧問(wèn)半天,按照他的工作經(jīng)歷來(lái)說(shuō),隨便忽悠我半天是很容易的事情,但是韋思康非常 嚴(yán)謹(jǐn),先是以一個(gè)普通人的身份花了半個(gè)小時(shí)在敦煌網(wǎng)買(mǎi)東西(堅(jiān)決要真實(shí)付錢(qián)),切身體會(huì)敦煌網(wǎng)的用戶(hù)體驗(yàn),然后也不先看數(shù)據(jù),而是先問(wèn)很多能更了解敦煌網(wǎng) 的生意形態(tài)的問(wèn)題。講真他的問(wèn)題比很多投資分析師來(lái)得專(zhuān)業(yè)。而現(xiàn)在許多數(shù)據(jù)分析師,包括當(dāng)時(shí)我自己,只看數(shù)據(jù)就開(kāi)口說(shuō)問(wèn)題,不深入去體會(huì)公司的商業(yè)形態(tài)。
韋思康告訴我數(shù)據(jù)是一種態(tài)度,讓我明白做數(shù)據(jù)的人就是要全身心投入,好像一種信仰一樣,中間有許多路要走;而且,數(shù)據(jù)與商業(yè)密切相關(guān),不能局限在數(shù)據(jù)的死角里。
另一位是清華大學(xué)的教授謝勁紅,有一個(gè)夏天碰巧去旁聽(tīng)他的課,拿一堆的數(shù)據(jù)給他看,他一邊看一邊給我演繹他的思維,他可以很快在一堆數(shù)據(jù)找到他們之 間的關(guān)系。后來(lái)我?guī)е鴪F(tuán)隊(duì)常常去清華找他聊,他教我如何看網(wǎng)絡(luò)數(shù)據(jù),用聯(lián)動(dòng)的思維來(lái)看網(wǎng)絡(luò)數(shù)據(jù)??梢哉f(shuō)是他啟蒙了我用 “關(guān)系”的思維看數(shù)據(jù)。一聽(tīng)完就回到敦煌跑到敦煌看很多數(shù)據(jù),發(fā)現(xiàn)了新世界。
第三,數(shù)據(jù)分析師感嘆落不了地,只能談數(shù)據(jù),而不懂商業(yè)。如果不懂商業(yè),而單純看數(shù)據(jù),不僅很難有創(chuàng)意的思維,而且是沒(méi)有意義的
而對(duì)于一般的數(shù)據(jù)分析師來(lái)說(shuō),大部分人沒(méi)有系統(tǒng)思維,而且也只能看一部分?jǐn)?shù)據(jù),無(wú)法從大面兒上了解整個(gè)公司的運(yùn)營(yíng)數(shù)據(jù),這樣就令數(shù)據(jù)分析師難以形成全面的思考方式。
以我自己的工作經(jīng)歷來(lái)舉例,為什么我在敦煌的時(shí)候數(shù)據(jù)分析能力會(huì)突飛猛進(jìn),也是因?yàn)槲以谇皟杉夜局荒芸吹揭徊糠謹(jǐn)?shù)據(jù),而到了敦煌之后我愛(ài)看什么就 看什么,受謝教授啟發(fā)之后我更是天馬行空地把營(yíng)銷(xiāo)數(shù)據(jù)、市場(chǎng)數(shù)據(jù)、財(cái)務(wù)數(shù)據(jù)、產(chǎn)品數(shù)據(jù)、賣(mài)家和買(mǎi)家數(shù)據(jù)等等聯(lián)動(dòng)起來(lái)看,這大大改變了我對(duì)數(shù)據(jù)的運(yùn)用方式。
經(jīng)過(guò)這些年的努力工作經(jīng)驗(yàn)的累加和受到知名是數(shù)據(jù)科學(xué)家的點(diǎn)撥,是我的數(shù)據(jù)分析技術(shù)認(rèn)識(shí)更家深刻,也是我技術(shù)上升了幾個(gè)階段。這也改變了我對(duì)大數(shù)據(jù)的初步看法,非常感謝幫助我人。
數(shù)據(jù)分析咨詢(xún)請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢(xún)效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開(kāi)的話(huà)題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開(kāi)始提取前,需先判斷 TIF 文件的類(lèi)型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專(zhuān)業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專(zhuān)業(yè)操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開(kāi)發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶(hù)體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷(xiāo)案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見(jiàn)頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷(xiāo)成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類(lèi)分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類(lèi)分析作為 “無(wú)監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10