
由高級經(jīng)理(數(shù)據(jù)科學(xué))Sharan Kumar Ravindran撰寫
一個人不需要有天生的天賦就能成為一名成功的數(shù)據(jù)科學(xué)家。然而,要在數(shù)據(jù)科學(xué)中取得成功,需要一些技能。所有這些關(guān)鍵技能都可以通過適當(dāng)?shù)呐嘤?xùn)和練習(xí)獲得。在這篇文章中,我將分享一些重要的技能,為什么它們對數(shù)據(jù)科學(xué)家來說很重要。此外,如何獲得這些技能。
數(shù)據(jù)科學(xué)家應(yīng)該養(yǎng)成批判性思維的習(xí)慣。它有助于更好地理解這個問題。除非把問題理解到最細(xì)的層次,否則解決方案不可能是好的。批判性思維有助于分析不同的選擇,并有助于選擇正確的選擇。
在解決數(shù)據(jù)科學(xué)問題時,這并不總是一個好的或壞的決定。很多選擇都處于好與壞之間的灰色地帶。在一個數(shù)據(jù)科學(xué)項目中涉及到如此多的決策。例如,選擇正確的屬性集、正確的方法、正確的算法、度量模型性能的正確度量,等等。它需要更多的分析和清晰的思考來選擇正確的選項。
培養(yǎng)批判性思維的一個簡單方法就是像孩子一樣好奇。問盡可能多的問題,直到?jīng)]有更多的問題。我們問得越多,理解得越多。我們對問題理解得越好,結(jié)果就越好。
讓我用一個例子來演示批判性思維。讓我們考慮以下電信公司的場景。我們要識別忠誠的高凈值客戶。為了識別這個客戶群體,我們必須從一系列問題開始,
這些有助于識別精英客戶。它有助于組織確保這些客戶體驗到最好的服務(wù)。
有一些技巧有助于提高批判性思維能力。其中一種技巧是第一性原理思維。它是一個有助于更好地理解問題的心智模型。下面是一個使用第一性原理解決數(shù)據(jù)科學(xué)問題的示例。
如何運用第一性原理思維解決數(shù)據(jù)科學(xué)問題?
心智模型是幫助清晰思考和更好決策的驚人工具。因此,采用心智模型有助于提高你的批判性思維能力。這里有一篇文章強調(diào)了在工作中采用心智模型的好處。
5個心智模型,幫助提升您的數(shù)據(jù)科學(xué)職業(yè)生涯
編碼技能對數(shù)據(jù)科學(xué)家來說就像眼睛對藝術(shù)家一樣重要。數(shù)據(jù)科學(xué)家要做的任何事情都需要編碼技能。從多個來源讀取數(shù)據(jù),對數(shù)據(jù)進行探索性分析,構(gòu)建模型,并對其進行評估。
AutoML解決方案會發(fā)生什么?近年來有許多AutoML產(chǎn)品出現(xiàn)。許多人甚至認(rèn)為很快就不需要任何編碼技能了。讓我們舉一個例子,
不可否認(rèn),AutoML解決方案將在未來得到廣泛采用。數(shù)據(jù)科學(xué)團隊今天解決的許多標(biāo)準(zhǔn)問題將被自動化。這并不意味著數(shù)據(jù)科學(xué)工作的結(jié)束,也不意味著數(shù)據(jù)科學(xué)家編寫代碼的需求的結(jié)束。它將使數(shù)據(jù)科學(xué)團隊能夠?qū)W⒂谛碌膯栴}。
今天被捕獲的數(shù)據(jù)量如此之高。今天,許多組織只使用了可用數(shù)據(jù)的一小部分。有了AutoML,焦點將轉(zhuǎn)移到未被探索的領(lǐng)域。
你是否對數(shù)據(jù)科學(xué)感興趣,但覺得自己沒有編碼技能?這里有一篇文章將幫助您學(xué)習(xí)為數(shù)據(jù)科學(xué)編寫代碼。
不會編碼?以下是學(xué)習(xí)為數(shù)據(jù)科學(xué)編寫代碼的最佳方法
數(shù)學(xué)是數(shù)據(jù)科學(xué)家需要理解的另一項重要技能。在學(xué)習(xí)數(shù)據(jù)科學(xué)時,你不知道一些數(shù)學(xué)概念是可以的。如果不了解數(shù)學(xué)概念,就不可能成為一名出色的數(shù)據(jù)科學(xué)家。
讓我舉一個簡單的例子,說明數(shù)學(xué)概念在解決問題時是如何有用的。讓我們選擇客戶流失分析。
這還不是全部,沒有數(shù)學(xué)就沒有機器學(xué)習(xí)算法。這并不意味著你需要成為一名數(shù)學(xué)家才能成為一名成功的數(shù)據(jù)科學(xué)家。它所需要的只是高中數(shù)學(xué)水平。
如果你有興趣學(xué)習(xí)數(shù)據(jù)科學(xué)的數(shù)學(xué)。這是最適合你的課程。
數(shù)據(jù)科學(xué)數(shù)學(xué)
一個數(shù)據(jù)科學(xué)家不能孤立地工作。一個數(shù)據(jù)科學(xué)家應(yīng)該與多人協(xié)作以確保項目的成功。即使在今天,許多數(shù)據(jù)科學(xué)項目也失敗了。大多數(shù)失敗的首要原因是團隊之間缺乏理解和合作。
解釋跨不同團隊協(xié)作和工作的重要性。讓我們考慮一個場景,其中數(shù)據(jù)科學(xué)團隊正在與客戶增長團隊合作。目的是了解客戶流失的原因。
你決定和幾個不同的團隊談?wù)?,他們是這樣說的
增長團隊-客戶流失主要是由于競爭提供的優(yōu)惠
營銷團隊-產(chǎn)品團隊發(fā)布的新特性可能會導(dǎo)致一些問題,從而導(dǎo)致客戶流失
產(chǎn)品團隊-營銷團隊只是專注于吸引大量新客戶,而沒有建立客戶的價值或意圖
客戶支持小組-許多客戶報告了許多與支付有關(guān)的問題。這可能是客戶流失的原因
如果您沒有與其他團隊交談,您將根據(jù)增長團隊提供的信息開始解決這個問題。你不能僅僅依靠一個團隊的投入來解決一個問題。即使增長團隊是這里的主要發(fā)起人,僅僅依賴他們提供的投入也是不夠的。為了獲得一個整體的圖像,您需要與不同的利益相關(guān)者交談。當(dāng)你限制與你一起工作的人或團隊時,來自這些人的偏見會傳遞到你正在構(gòu)建的解決方案中。
此外,在許多情況下,數(shù)據(jù)科學(xué)團隊需要與數(shù)據(jù)工程和其他技術(shù)團隊密切合作。沒有良好的合作努力,就不會有成功。
如果解決方案沒有很好地傳達給利益相關(guān)者,所有這些都是無用的。數(shù)據(jù)科學(xué)中涉及的問題和解決方案通常要復(fù)雜得多。在將它們傳達給業(yè)務(wù)之前,簡化它們是非常重要的。在交流中使用講故事的方法很有幫助。
讓我舉一個例子,更簡單地解釋良好溝通的重要性。讓我們考慮以下場景。數(shù)據(jù)科學(xué)團隊正在研究一個預(yù)測模型,以預(yù)測零售能源客戶的能源使用情況。數(shù)據(jù)科學(xué)團隊需要說服業(yè)務(wù)和基礎(chǔ)設(shè)施團隊擁有和運行至少10個不同的模型以獲得更好的準(zhǔn)確性的重要性。這意味著更高的計算能力的使用和更多的時間來訓(xùn)練模型。
選項a-您使用用于將客戶分組到不同組中的聚類技術(shù),因此需要為每個組建立一個模型。
這里的問題是,業(yè)務(wù)團隊還沒有被告知為每個組實際使用一個模型的好處。因此,如果成本很高,他們可能不會被說服。
選項B-從客戶的配置文件和特征開始。您可以顯示客戶的能源使用模式。你向業(yè)務(wù)團隊展示了獨特的模式,比如一些家庭在周末幾乎使用可以忽略不計的電力,可能是因為他們通常傾向于在不同的地方度過周末。同樣,你展示了獨特的模式,因此你解釋了一個模型不能適合所有這些不同的客戶,因此至少需要每個10個不同的模型來迎合10個不同的獨特類別的客戶。
現(xiàn)在,企業(yè)明白了擁有這么多不同模型的重要性。他們可以很容易地將增量收益與所需的基礎(chǔ)設(shè)施成本進行比較,以評估選項。
數(shù)據(jù)科學(xué)團隊的工作是向利益相關(guān)者清楚地傳達這個想法。這不是一項容易的工作,因為大多數(shù)人對數(shù)據(jù)科學(xué)的知識有限。只有當(dāng)企業(yè)從中發(fā)現(xiàn)價值時,數(shù)據(jù)科學(xué)項目才被認(rèn)為是成功的。
改善組織中協(xié)作的一個好方法是提供一個在團隊之間有良好信息流動的環(huán)境。
Last but not least is leadership skills. Most organizations have a small data science team and they generally work on different sets of problems. It is very common for a data scientist to get pulled into different meetings and for Adhoc questioning. It is the job of the data scientist to decide when to say yes and when to say No. It is very important to set the priorities right.
此外,數(shù)據(jù)科學(xué)家需要有一個清晰的思考過程,并應(yīng)該有能力預(yù)見結(jié)果。很多時候,業(yè)務(wù)團隊會有很大的壓力來加速分析。數(shù)據(jù)科學(xué)家的角色是管理期望并產(chǎn)生高質(zhì)量的結(jié)果。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計學(xué)領(lǐng)域,假設(shè)檢驗是驗證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學(xué)計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學(xué)計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務(wù)價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導(dǎo)向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10