
由高級(jí)經(jīng)理(數(shù)據(jù)科學(xué))Sharan Kumar Ravindran撰寫
一個(gè)人不需要有天生的天賦就能成為一名成功的數(shù)據(jù)科學(xué)家。然而,要在數(shù)據(jù)科學(xué)中取得成功,需要一些技能。所有這些關(guān)鍵技能都可以通過適當(dāng)?shù)呐嘤?xùn)和練習(xí)獲得。在這篇文章中,我將分享一些重要的技能,為什么它們對(duì)數(shù)據(jù)科學(xué)家來說很重要。此外,如何獲得這些技能。
數(shù)據(jù)科學(xué)家應(yīng)該養(yǎng)成批判性思維的習(xí)慣。它有助于更好地理解這個(gè)問題。除非把問題理解到最細(xì)的層次,否則解決方案不可能是好的。批判性思維有助于分析不同的選擇,并有助于選擇正確的選擇。
在解決數(shù)據(jù)科學(xué)問題時(shí),這并不總是一個(gè)好的或壞的決定。很多選擇都處于好與壞之間的灰色地帶。在一個(gè)數(shù)據(jù)科學(xué)項(xiàng)目中涉及到如此多的決策。例如,選擇正確的屬性集、正確的方法、正確的算法、度量模型性能的正確度量,等等。它需要更多的分析和清晰的思考來選擇正確的選項(xiàng)。
培養(yǎng)批判性思維的一個(gè)簡(jiǎn)單方法就是像孩子一樣好奇。問盡可能多的問題,直到?jīng)]有更多的問題。我們問得越多,理解得越多。我們對(duì)問題理解得越好,結(jié)果就越好。
讓我用一個(gè)例子來演示批判性思維。讓我們考慮以下電信公司的場(chǎng)景。我們要識(shí)別忠誠的高凈值客戶。為了識(shí)別這個(gè)客戶群體,我們必須從一系列問題開始,
這些有助于識(shí)別精英客戶。它有助于組織確保這些客戶體驗(yàn)到最好的服務(wù)。
有一些技巧有助于提高批判性思維能力。其中一種技巧是第一性原理思維。它是一個(gè)有助于更好地理解問題的心智模型。下面是一個(gè)使用第一性原理解決數(shù)據(jù)科學(xué)問題的示例。
如何運(yùn)用第一性原理思維解決數(shù)據(jù)科學(xué)問題?
心智模型是幫助清晰思考和更好決策的驚人工具。因此,采用心智模型有助于提高你的批判性思維能力。這里有一篇文章強(qiáng)調(diào)了在工作中采用心智模型的好處。
5個(gè)心智模型,幫助提升您的數(shù)據(jù)科學(xué)職業(yè)生涯
編碼技能對(duì)數(shù)據(jù)科學(xué)家來說就像眼睛對(duì)藝術(shù)家一樣重要。數(shù)據(jù)科學(xué)家要做的任何事情都需要編碼技能。從多個(gè)來源讀取數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行探索性分析,構(gòu)建模型,并對(duì)其進(jìn)行評(píng)估。
AutoML解決方案會(huì)發(fā)生什么?近年來有許多AutoML產(chǎn)品出現(xiàn)。許多人甚至認(rèn)為很快就不需要任何編碼技能了。讓我們舉一個(gè)例子,
不可否認(rèn),AutoML解決方案將在未來得到廣泛采用。數(shù)據(jù)科學(xué)團(tuán)隊(duì)今天解決的許多標(biāo)準(zhǔn)問題將被自動(dòng)化。這并不意味著數(shù)據(jù)科學(xué)工作的結(jié)束,也不意味著數(shù)據(jù)科學(xué)家編寫代碼的需求的結(jié)束。它將使數(shù)據(jù)科學(xué)團(tuán)隊(duì)能夠?qū)W⒂谛碌膯栴}。
今天被捕獲的數(shù)據(jù)量如此之高。今天,許多組織只使用了可用數(shù)據(jù)的一小部分。有了AutoML,焦點(diǎn)將轉(zhuǎn)移到未被探索的領(lǐng)域。
你是否對(duì)數(shù)據(jù)科學(xué)感興趣,但覺得自己沒有編碼技能?這里有一篇文章將幫助您學(xué)習(xí)為數(shù)據(jù)科學(xué)編寫代碼。
不會(huì)編碼?以下是學(xué)習(xí)為數(shù)據(jù)科學(xué)編寫代碼的最佳方法
數(shù)學(xué)是數(shù)據(jù)科學(xué)家需要理解的另一項(xiàng)重要技能。在學(xué)習(xí)數(shù)據(jù)科學(xué)時(shí),你不知道一些數(shù)學(xué)概念是可以的。如果不了解數(shù)學(xué)概念,就不可能成為一名出色的數(shù)據(jù)科學(xué)家。
讓我舉一個(gè)簡(jiǎn)單的例子,說明數(shù)學(xué)概念在解決問題時(shí)是如何有用的。讓我們選擇客戶流失分析。
這還不是全部,沒有數(shù)學(xué)就沒有機(jī)器學(xué)習(xí)算法。這并不意味著你需要成為一名數(shù)學(xué)家才能成為一名成功的數(shù)據(jù)科學(xué)家。它所需要的只是高中數(shù)學(xué)水平。
如果你有興趣學(xué)習(xí)數(shù)據(jù)科學(xué)的數(shù)學(xué)。這是最適合你的課程。
數(shù)據(jù)科學(xué)數(shù)學(xué)
一個(gè)數(shù)據(jù)科學(xué)家不能孤立地工作。一個(gè)數(shù)據(jù)科學(xué)家應(yīng)該與多人協(xié)作以確保項(xiàng)目的成功。即使在今天,許多數(shù)據(jù)科學(xué)項(xiàng)目也失敗了。大多數(shù)失敗的首要原因是團(tuán)隊(duì)之間缺乏理解和合作。
解釋跨不同團(tuán)隊(duì)協(xié)作和工作的重要性。讓我們考慮一個(gè)場(chǎng)景,其中數(shù)據(jù)科學(xué)團(tuán)隊(duì)正在與客戶增長團(tuán)隊(duì)合作。目的是了解客戶流失的原因。
你決定和幾個(gè)不同的團(tuán)隊(duì)談?wù)劊麄兪沁@樣說的
增長團(tuán)隊(duì)-客戶流失主要是由于競(jìng)爭(zhēng)提供的優(yōu)惠
營銷團(tuán)隊(duì)-產(chǎn)品團(tuán)隊(duì)發(fā)布的新特性可能會(huì)導(dǎo)致一些問題,從而導(dǎo)致客戶流失
產(chǎn)品團(tuán)隊(duì)-營銷團(tuán)隊(duì)只是專注于吸引大量新客戶,而沒有建立客戶的價(jià)值或意圖
客戶支持小組-許多客戶報(bào)告了許多與支付有關(guān)的問題。這可能是客戶流失的原因
如果您沒有與其他團(tuán)隊(duì)交談,您將根據(jù)增長團(tuán)隊(duì)提供的信息開始解決這個(gè)問題。你不能僅僅依靠一個(gè)團(tuán)隊(duì)的投入來解決一個(gè)問題。即使增長團(tuán)隊(duì)是這里的主要發(fā)起人,僅僅依賴他們提供的投入也是不夠的。為了獲得一個(gè)整體的圖像,您需要與不同的利益相關(guān)者交談。當(dāng)你限制與你一起工作的人或團(tuán)隊(duì)時(shí),來自這些人的偏見會(huì)傳遞到你正在構(gòu)建的解決方案中。
此外,在許多情況下,數(shù)據(jù)科學(xué)團(tuán)隊(duì)需要與數(shù)據(jù)工程和其他技術(shù)團(tuán)隊(duì)密切合作。沒有良好的合作努力,就不會(huì)有成功。
如果解決方案沒有很好地傳達(dá)給利益相關(guān)者,所有這些都是無用的。數(shù)據(jù)科學(xué)中涉及的問題和解決方案通常要復(fù)雜得多。在將它們傳達(dá)給業(yè)務(wù)之前,簡(jiǎn)化它們是非常重要的。在交流中使用講故事的方法很有幫助。
讓我舉一個(gè)例子,更簡(jiǎn)單地解釋良好溝通的重要性。讓我們考慮以下場(chǎng)景。數(shù)據(jù)科學(xué)團(tuán)隊(duì)正在研究一個(gè)預(yù)測(cè)模型,以預(yù)測(cè)零售能源客戶的能源使用情況。數(shù)據(jù)科學(xué)團(tuán)隊(duì)需要說服業(yè)務(wù)和基礎(chǔ)設(shè)施團(tuán)隊(duì)擁有和運(yùn)行至少10個(gè)不同的模型以獲得更好的準(zhǔn)確性的重要性。這意味著更高的計(jì)算能力的使用和更多的時(shí)間來訓(xùn)練模型。
選項(xiàng)a-您使用用于將客戶分組到不同組中的聚類技術(shù),因此需要為每個(gè)組建立一個(gè)模型。
這里的問題是,業(yè)務(wù)團(tuán)隊(duì)還沒有被告知為每個(gè)組實(shí)際使用一個(gè)模型的好處。因此,如果成本很高,他們可能不會(huì)被說服。
選項(xiàng)B-從客戶的配置文件和特征開始。您可以顯示客戶的能源使用模式。你向業(yè)務(wù)團(tuán)隊(duì)展示了獨(dú)特的模式,比如一些家庭在周末幾乎使用可以忽略不計(jì)的電力,可能是因?yàn)樗麄兺ǔA向于在不同的地方度過周末。同樣,你展示了獨(dú)特的模式,因此你解釋了一個(gè)模型不能適合所有這些不同的客戶,因此至少需要每個(gè)10個(gè)不同的模型來迎合10個(gè)不同的獨(dú)特類別的客戶。
現(xiàn)在,企業(yè)明白了擁有這么多不同模型的重要性。他們可以很容易地將增量收益與所需的基礎(chǔ)設(shè)施成本進(jìn)行比較,以評(píng)估選項(xiàng)。
數(shù)據(jù)科學(xué)團(tuán)隊(duì)的工作是向利益相關(guān)者清楚地傳達(dá)這個(gè)想法。這不是一項(xiàng)容易的工作,因?yàn)榇蠖鄶?shù)人對(duì)數(shù)據(jù)科學(xué)的知識(shí)有限。只有當(dāng)企業(yè)從中發(fā)現(xiàn)價(jià)值時(shí),數(shù)據(jù)科學(xué)項(xiàng)目才被認(rèn)為是成功的。
改善組織中協(xié)作的一個(gè)好方法是提供一個(gè)在團(tuán)隊(duì)之間有良好信息流動(dòng)的環(huán)境。
Last but not least is leadership skills. Most organizations have a small data science team and they generally work on different sets of problems. It is very common for a data scientist to get pulled into different meetings and for Adhoc questioning. It is the job of the data scientist to decide when to say yes and when to say No. It is very important to set the priorities right.
此外,數(shù)據(jù)科學(xué)家需要有一個(gè)清晰的思考過程,并應(yīng)該有能力預(yù)見結(jié)果。很多時(shí)候,業(yè)務(wù)團(tuán)隊(duì)會(huì)有很大的壓力來加速分析。數(shù)據(jù)科學(xué)家的角色是管理期望并產(chǎn)生高質(zhì)量的結(jié)果。
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03