
數(shù)據(jù)分析師進(jìn)階的思維與態(tài)度
普通數(shù)據(jù)分析師與高級數(shù)據(jù)分析師的差異有一個(gè)非常重要的點(diǎn),那就是數(shù)據(jù)思維。數(shù)據(jù)思維與數(shù)據(jù)敏感度有一些類似,都是類似于情商類的看不見摸不著的東西。簡單來說數(shù)據(jù)思維是一種通過數(shù)據(jù)手段解決問題的思維。
大家還記得中學(xué)時(shí)期或是大學(xué)時(shí)期的數(shù)學(xué)證明題嗎?
已知條件A、B、C、D條件,要求證明E是成立的。
一道證明題往往只是一句話,然而解題過程往往要占據(jù)一整頁篇幅。幾何證明題出現(xiàn)的頻次更是尤其高,還記得我們在進(jìn)行數(shù)學(xué)證明的時(shí)候做的證明流程嗎?幾乎所有的證明題都是要求通過已知條件轉(zhuǎn)換為未知條件,而我們證明的過程恰恰是方向解剖,如果要E成立需要什么條件?假設(shè)需要E、F成立;E、F成立有需要G、H、I成立;G、H、I成立恰好需要A、B、C、D條件,證明完畢。
證明流程如下。
其實(shí)這就是一種以結(jié)果為導(dǎo)向的思維方法,數(shù)學(xué)帶給我們的思維最重要的體現(xiàn)就是在解決問題的方式上。證明題的流程之所以如此清晰嚴(yán)謹(jǐn)多是因?yàn)槌鲱}者已經(jīng)事先梳理了證明邏輯,對于解題者來說正確答案只有一個(gè):證明D成立。
除了證明題,我們還經(jīng)常面對的另一類問題是應(yīng)用題。應(yīng)用題大多是把日常生活場景抽象簡化,在題目中描繪一個(gè)場景,常見的題型可以歸類如下:
小明在???的時(shí)候發(fā)現(xiàn),A事件有a屬性,B事件的值是b,假設(shè)小明的C屬性數(shù)據(jù)是c,問小明在D時(shí)的值d是多少?
這類題目刻畫了一個(gè)事件場景,大多會交代時(shí)間、地點(diǎn)、人物、事件,然后給出一些參數(shù),要求另外一個(gè)參數(shù)的值。同樣,我們想要知道D的值需要兩個(gè)條件E、F,想要知道E、F的值需要條件G、H、I,而G、H、I的值可以通過A、B、C的值a、b、c求得。邏輯關(guān)系梳理完成后需要通過對a、b、c三個(gè)數(shù)值進(jìn)行加減乘除簡單的數(shù)學(xué)計(jì)算或是積分求導(dǎo)等高階數(shù)學(xué)算法,最終求得結(jié)果d。應(yīng)用題和證明題的區(qū)別在于它在證明題的邏輯思維基礎(chǔ)之上增加了數(shù)值運(yùn)算。
隨著應(yīng)用場景的不斷復(fù)雜,我們引入了一元一次方程、二元一次方程組、黎曼積分、極限思想等這些數(shù)學(xué)工具。這些工具發(fā)明的初衷在于解決實(shí)際生活中遇到的問題,只是實(shí)際生活中遇到的問題被抽象成了應(yīng)用數(shù)學(xué)題。數(shù)學(xué)工具的不斷豐富和復(fù)雜,人們不再拘泥于現(xiàn)實(shí)的應(yīng)用場景,開始把數(shù)學(xué)研究單獨(dú)作為一門技能進(jìn)行拓展和延伸。于是產(chǎn)生了另一類數(shù)學(xué)題。
已知公式A,條件是B,當(dāng)n趨向于正無窮,求D。
A是B的全覆蓋,求證:C是D的全覆蓋。
P(A|B)=K,求P(C|A)。
……
此類問題已經(jīng)是進(jìn)階到高等數(shù)學(xué)的范疇了,高等數(shù)學(xué)與普通數(shù)學(xué)的最大區(qū)別就在于其應(yīng)用場景沒那么明確具體,不像加減乘除能夠讓你買菜,高等數(shù)學(xué)更加抽象和理論化。它們對應(yīng)的是極限的思想,全面拆分問題的思想,這時(shí)我們再看看本章開頭的兩個(gè)實(shí)例:
公元前5世紀(jì),芝諾發(fā)表了著名的阿基里斯悖論:他提出讓烏龜在阿基里斯前面1000米處開始,和阿基里斯賽跑,并且假定阿基里斯的速度是烏龜?shù)?0倍。當(dāng)比賽開始后,若阿基里斯跑了1000米,設(shè)所用的時(shí)間為t,此時(shí)烏龜便領(lǐng)先他100米;當(dāng)阿基里斯跑完下一個(gè)100米時(shí),他所用的時(shí)間為t/10,烏龜仍然前于他10米。當(dāng)阿基里斯跑完下一個(gè)10米時(shí),他所用的時(shí)間為t/100,烏龜仍然前于他1米…… 芝諾認(rèn)為,阿基里斯能夠繼續(xù)逼近烏龜,但絕不可能追上它。
一尺之棰,日取其半,萬世不竭。
這是極限思維的實(shí)際案例,大家有沒有發(fā)現(xiàn)問題在哪里呢?留作課后思考題吧!想清楚了自然豁然開朗,想不清楚可以去找能夠幫助你想清楚的方法,尋找答案的過程也算是數(shù)據(jù)分析思維的一部分。
我們看到上文給出的數(shù)學(xué)問題的三個(gè)模塊其實(shí)對應(yīng)著數(shù)學(xué)思想的變化。
數(shù)學(xué)從提供解決問題的方法到變成數(shù)學(xué)工具,再變成數(shù)學(xué)思想。這一演變的過程為我們提供了解決問題的思路,思考問題的方法。數(shù)據(jù)分析的思維可以借鑒數(shù)學(xué)思想的內(nèi)容,從解決實(shí)際問題的角度出發(fā),找到需要解決這個(gè)問題的元素,一層一層地剝離下去,最終聯(lián)系到我們已有的資源。同樣,我們拋開數(shù)據(jù)分析的實(shí)際應(yīng)用場景去探索數(shù)據(jù)分析方法的優(yōu)化空間和可行性,對已有的數(shù)據(jù)進(jìn)行聚類、分類等探索性分析,提升數(shù)據(jù)的使用效率,挖掘數(shù)據(jù)中潛在的價(jià)值,這些就是數(shù)據(jù)分析的思維方式。
數(shù)據(jù)分析的思維是一種解決問題的方式,以結(jié)果為導(dǎo)向的向數(shù)據(jù)源頭的追溯。數(shù)據(jù)分析師要有一種遇到問題解決問題的自信。沒有問題是無法解決的,沒解決的原因只能是投入大于產(chǎn)出,解決該問題帶來的收益小于投入。
技能是容易掌握的,但是思維卻是很難培養(yǎng)的。從我們接觸數(shù)學(xué)這門學(xué)科的那一天開始,數(shù)學(xué)就嘗試向我們傳遞這樣一種思維方式,因此,在面試數(shù)據(jù)分析師時(shí)我往往會問一問面試者的數(shù)學(xué)成績怎樣。數(shù)學(xué)成績能夠部分反映一個(gè)人對數(shù)學(xué)思維的理解與運(yùn)用,即使他自己都可能沒有意識到這一點(diǎn)。這些關(guān)于數(shù)學(xué)解題的思維方式正是數(shù)據(jù)分析師所需要的,也是數(shù)據(jù)分析師必備的。那么,如何培養(yǎng)數(shù)據(jù)分析的思維呢?不妨先培養(yǎng)解決數(shù)學(xué)問題的思維。經(jīng)常做一些邏輯推理題或是看一些偵探小說,會有幫助的。
數(shù)據(jù)分析思維一方面體現(xiàn)在它的邏輯性和方向性,另一個(gè)重要特征是絕對客觀與絕對理性。“不以物喜,不以己悲”的態(tài)度對于數(shù)據(jù)分析思維來說很重要,它能夠幫助你摒棄主觀的偏見與看法。諸如遇到突發(fā)事件能在第一時(shí)間冷靜下來,拋去恐慌的情緒;對自己喜歡的項(xiàng)目客觀分析,不對數(shù)據(jù)進(jìn)行修飾;對自己犯下的錯(cuò)誤能客觀評論,給出解決方法等。喜怒哀樂是每個(gè)人都會有的情緒,而對數(shù)據(jù)分析師而言,一旦進(jìn)入工作就要絕對理性與客觀,這也是數(shù)據(jù)分析師思考問題的前提。
任何人都會犯錯(cuò)誤,我們在日常工作中難免會犯錯(cuò)誤,作為數(shù)據(jù)分析師,每天都和一大堆數(shù)據(jù)打交道,稍有不慎就會犯錯(cuò)誤。如何對待自己犯下的錯(cuò)誤是衡量一個(gè)數(shù)據(jù)分析師處理問題客觀性的重要標(biāo)準(zhǔn)。人們在面臨指責(zé)時(shí)的本能反應(yīng)是逃避或是反擊,這是人性的弱點(diǎn),數(shù)據(jù)分析師能否克服這樣的弱點(diǎn)將是他能否進(jìn)階的重要因素。當(dāng)領(lǐng)導(dǎo)指責(zé)你工作沒做好的時(shí)候你會以怎樣的態(tài)度去面對這個(gè)問題?
攻擊的態(tài)度:不是我的錯(cuò),是什么什么原因造成的。
逃避的態(tài)度:好像是錯(cuò)了,對不起!
客觀理性的態(tài)度:是我錯(cuò)了,糾正方法是XXXX2小時(shí)內(nèi)可以完成。此次錯(cuò)誤的原因是XXXX,以后不會再犯了,本月績效相應(yīng)的部分會進(jìn)行扣除。
如果你是領(lǐng)導(dǎo),你會喜歡哪種態(tài)度呢?
領(lǐng)導(dǎo)永遠(yuǎn)是以結(jié)果為導(dǎo)向的,指責(zé)你犯錯(cuò)或是沉浸在內(nèi)疚的情緒中于事無補(bǔ),第一時(shí)間應(yīng)該做的事情是把結(jié)果做好,然后再進(jìn)行自我檢討,用最客觀的態(tài)度進(jìn)行自我批評。這樣不僅給自己一個(gè)教訓(xùn),也會讓領(lǐng)導(dǎo)不會因此過度責(zé)怪你。你已經(jīng)給出了面對此錯(cuò)誤的最好的解決方案,別人也不會再節(jié)外生枝。更大的可能是領(lǐng)導(dǎo)會因?yàn)檫@件事增加對你的好感度與信任度。
我想大家都讀過歷史類或是戰(zhàn)爭類的小說,謀士給統(tǒng)帥的策略一般會給出上策、中策、下策,而統(tǒng)帥經(jīng)常會出于人道主義原則選擇中策或是下策。越是厲害的謀士給出的策略出發(fā)點(diǎn)越是絕對理性,不考慮感性的情懷與仁慈,一切以成功為最終目的。高階的數(shù)據(jù)分析師就要具有這種謀士的精神,客觀與理性的解決問題。同樣,只要統(tǒng)帥提出問題,謀士總能給出解決方案,雖然有些理想主義的情懷,但是能從一定意義上反映數(shù)據(jù)分析思維的兩個(gè)方面:分析問題的思想;處理問題時(shí)的態(tài)度。
思維與態(tài)度作為數(shù)據(jù)分析思維的兩個(gè)核心要素是衡量一個(gè)數(shù)據(jù)分析師水平的軟指標(biāo),培養(yǎng)自己的思維與處理問題的態(tài)度需要在實(shí)踐中不斷完善和進(jìn)步。“學(xué)而不思則罔,思而不學(xué)則殆”,數(shù)據(jù)分析的過程需要大家不斷思考、不斷實(shí)踐,才能在這樣一個(gè)過程中不斷提升自己。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
訓(xùn)練與驗(yàn)證損失驟升:機(jī)器學(xué)習(xí)訓(xùn)練中的異常診斷與解決方案 在機(jī)器學(xué)習(xí)模型訓(xùn)練過程中,“損失曲線” 是反映模型學(xué)習(xí)狀態(tài)的核心指 ...
2025-09-19解析 DataHub 與 Kafka:數(shù)據(jù)生態(tài)中兩類核心工具的差異與協(xié)同 在數(shù)字化轉(zhuǎn)型加速的今天,企業(yè)對數(shù)據(jù)的需求已從 “存儲” 轉(zhuǎn)向 “ ...
2025-09-19CDA 數(shù)據(jù)分析師:讓統(tǒng)計(jì)基本概念成為業(yè)務(wù)決策的底層邏輯 統(tǒng)計(jì)基本概念是商業(yè)數(shù)據(jù)分析的 “基礎(chǔ)語言”—— 從描述數(shù)據(jù)分布的 “均 ...
2025-09-19CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-19SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11