
在Springboard,我們的學(xué)生經(jīng)常問(wèn)我們這樣的問(wèn)題“數(shù)據(jù)科學(xué)家是做什么?”或者“數(shù)據(jù)科學(xué)家每天的工作是什么樣子?”這些問(wèn)題很棘手。答案因角色和公司不同而不同。
因此,我們咨詢了Raj Bandyopadhyay, Springboard數(shù)據(jù)科學(xué)教育主管,看看他是否有一個(gè)更好的答案。Raj提供了下圖中的框架,它既可以幫助你了解數(shù)據(jù)科學(xué)家的日常工作,也可以幫你理解數(shù)據(jù)科學(xué)解決問(wèn)題的流程,Raj稱之為“數(shù)據(jù)科學(xué)工作流程”。
在解決問(wèn)題之前,首先要做的是把問(wèn)題界定清楚,去定義它到底是什么。你必須能夠?qū)?shù)據(jù)問(wèn)題轉(zhuǎn)化為可操作的東西。
你經(jīng)常會(huì)從持有問(wèn)題的人那里得到模糊的描述。你必須培養(yǎng)直覺(jué):通過(guò)問(wèn)一些別人不會(huì)問(wèn)的問(wèn)題,把這些模糊描述轉(zhuǎn)換成可操作的問(wèn)題。
假設(shè)您正在為公司的銷售人員解決問(wèn)題,你應(yīng)該了解他們的目標(biāo)是什么以及數(shù)據(jù)問(wèn)題背后真正的本質(zhì)是什么?在你開(kāi)始考慮問(wèn)題之前,你必須與他們合作,明確界定問(wèn)題。正確地提問(wèn)是這一步驟的關(guān)鍵。你應(yīng)該弄清楚銷售過(guò)程是什么樣子,誰(shuí)是客戶。你需要盡可能了解背景知識(shí)以便將數(shù)據(jù)轉(zhuǎn)換為洞察力。為此,你應(yīng)該問(wèn)類似下面的問(wèn)題:
(1)誰(shuí)是顧客?
(2)他們?yōu)槭裁促I(mǎi)我們的產(chǎn)品?
(3)我們?nèi)绾晤A(yù)測(cè),一個(gè)客戶是否會(huì)買(mǎi)我們的產(chǎn)品?
(4)表現(xiàn)好和差客戶細(xì)分群體之間的區(qū)別在哪里?
(5)如果我們不能把產(chǎn)品賣給目標(biāo)客戶,我們的損失有多大?
在回答你的問(wèn)題時(shí)候,銷售人員可能會(huì)發(fā)現(xiàn)他們想知道為什么產(chǎn)品在部分細(xì)分客戶群體中的銷售不及預(yù)期。他們的最終目標(biāo)可能是確定是否繼續(xù)投資于這些群體,或是降低它們的優(yōu)先級(jí)。這樣你進(jìn)一步細(xì)化了問(wèn)題,針對(duì)細(xì)化后的問(wèn)題發(fā)掘答案。在這個(gè)階段的最后,你應(yīng)該有了所有你需要解決問(wèn)題的背景知識(shí)。
一旦定義好了問(wèn)題,你需要通過(guò)數(shù)據(jù)來(lái)尋找解決方案。這一進(jìn)程中要想清楚需要什么樣的數(shù)據(jù)?通過(guò)什么渠道可以獲取這些數(shù)據(jù)?是要內(nèi)部數(shù)據(jù)庫(kù)數(shù)據(jù)還是需要購(gòu)買(mǎi)外部數(shù)據(jù)?
或許你可能會(huì)發(fā)現(xiàn),你要數(shù)據(jù)都存儲(chǔ)在公司的客戶關(guān)系管理CRM系統(tǒng)中,那么就可以將數(shù)據(jù)用CSV文件的形式導(dǎo)出。
現(xiàn)在,你有了原始數(shù)據(jù),但是還需要為后續(xù)的分析做數(shù)據(jù)預(yù)處理。通常情況下,數(shù)據(jù)都是雜亂無(wú)章的,特別是沒(méi)有很好地存儲(chǔ)的情況下。很多東西都可以導(dǎo)致后續(xù)分析的錯(cuò)誤:null值,重復(fù)值和缺失值。對(duì)數(shù)據(jù)的精心核查才能保障從數(shù)據(jù)中得到有價(jià)值的見(jiàn)解。
你要檢查以下常見(jiàn)錯(cuò)誤:
(1)缺失值,例如客戶沒(méi)有初次接觸日期
(2)損壞值,如無(wú)效輸入項(xiàng)
(3)時(shí)區(qū)差異,也許你的數(shù)據(jù)庫(kù)沒(méi)有考慮到用戶處在不同的時(shí)區(qū)
(4)日期范圍錯(cuò)誤,也許你會(huì)有沒(méi)有任何意義日期數(shù)據(jù),比如銷售開(kāi)始前的注冊(cè)數(shù)據(jù)。
你需要對(duì)數(shù)據(jù)文件的行和列進(jìn)行統(tǒng)計(jì),并對(duì)某些值進(jìn)行測(cè)試,看看它們是不是有意義。如果您發(fā)現(xiàn)沒(méi)有意義,你需要?jiǎng)h除數(shù)據(jù),或者使用默認(rèn)值替換它。這里,你需要利用你直覺(jué):如果客戶沒(méi)有初次接觸日期,是否就真沒(méi)有初次接觸日期?或者你可以詢問(wèn)銷售人員,是否是把初次接觸日期的數(shù)據(jù)弄丟了?一旦你完成數(shù)據(jù)清理工作,你就可以開(kāi)始準(zhǔn)備探索性數(shù)據(jù)分析。
當(dāng)你的數(shù)據(jù)是干凈的,你就應(yīng)該開(kāi)始使用它!這里的困難在于如何對(duì)真正有見(jiàn)解的想法進(jìn)行測(cè)試。你必須為數(shù)據(jù)科學(xué)項(xiàng)目設(shè)定最后期限(銷售人員可能正等待的分析),所以你必須對(duì)問(wèn)題進(jìn)行優(yōu)先級(jí)劃分?!澳惚仨毾瓤纯醋钣腥さ哪J剑簬椭忉尀槭裁茨承┛蛻羧后w的銷量減少了。您可能會(huì)注意到,他們?cè)谏缃幻襟w上不是非?;钴S,只有少數(shù)人有Twitter或Facebook帳戶。您可能還注意到,其中大部分人的年齡偏大,你可以開(kāi)始跟蹤這些模式進(jìn)行更深入分析。
這一步你要應(yīng)用統(tǒng)計(jì)學(xué)、數(shù)學(xué)和數(shù)據(jù)科學(xué)工具,圍繞有趣的模型進(jìn)行詳細(xì)分析。
在這種情況下,你可能需要?jiǎng)?chuàng)建預(yù)測(cè)模型比較業(yè)績(jī)不佳組客戶與客戶平均。你可能會(huì)發(fā)現(xiàn),年齡和社交媒體活躍度是影響購(gòu)買(mǎi)產(chǎn)品的顯著因素。
如果你在問(wèn)題界定階段就已經(jīng)了解了很多背景信息,你可能會(huì)意識(shí)到該公司營(yíng)銷活動(dòng)集中在社交媒體上與年輕受眾進(jìn)行互動(dòng)。但是某些客戶卻喜歡電話的交流,而不是社交媒體。你開(kāi)始看到該產(chǎn)品的營(yíng)銷方式對(duì)銷售的影響,也許那部分客戶是不應(yīng)該流失的群體。公司應(yīng)該從過(guò)分依賴社會(huì)化媒體營(yíng)銷策略向更加個(gè)性化的策略轉(zhuǎn)變。
現(xiàn)在,您可以將所有數(shù)據(jù)定量分析得到的定性見(jiàn)解,通過(guò)講故事的方式說(shuō)服相關(guān)人員采取行動(dòng)。
讓銷售人員理解你們的發(fā)現(xiàn)很重要。溝通交流的有效性決定了你的方案是否被采納。
你應(yīng)該撰寫(xiě)一個(gè)有令人信服的故事,將自己的知識(shí)與數(shù)據(jù)恰當(dāng)嵌入其中。你可以從解釋老年人中銷售業(yè)績(jī)不佳背后的原因開(kāi)始;你可以巧妙地將銷售人員給你信息和數(shù)據(jù)中發(fā)現(xiàn)見(jiàn)解結(jié)合起來(lái);然后你轉(zhuǎn)到解決問(wèn)題的具體辦法:可以將部分資源從社會(huì)化媒體轉(zhuǎn)移到私人電話推銷中。
了解以上步驟,對(duì)于系統(tǒng)思考數(shù)據(jù)科學(xué)有極大的幫助。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門(mén)控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書(shū)考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開(kāi)啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03