
作者 | CDA數(shù)據(jù)分析師
我們把菜品挑選出來以后,就可以開始切菜了。比如要做涼拌黃瓜絲,吧黃瓜找出來以后,你就可以把黃瓜切成絲了。
一、數(shù)值替換
數(shù)值替換就是將數(shù)值A(chǔ)替換成B,可以用在異常值替換處理、缺失值填充處理中。主要有一對(duì)一替換、多對(duì)一替換、多對(duì)多替換三種替換方法。
1、一對(duì)一替換
一對(duì)一替換是將某一塊區(qū)域中的一個(gè)值全部替換成另一個(gè)值。已知現(xiàn)在有一個(gè)年齡值是240,很明顯這是一個(gè)異常值,我們要把它替換成一個(gè)正常范圍內(nèi)的年齡值(用正常年齡的均值33),怎么實(shí)現(xiàn)呢?
(1)Excel實(shí)現(xiàn)
在Excel中對(duì)某個(gè)值進(jìn)行替換,首先要把待替換的區(qū)域選中,如果只是替換某一列中的值,只需要選中這一列即可;如果要在一片區(qū)域中進(jìn)行替換,那么拖動(dòng)鼠標(biāo)選中這一片區(qū)域。然后依次單擊編輯菜單欄中的查找和選擇>替換選項(xiàng)(如下圖所示)即可調(diào)出替換界面。使用快捷鍵Ctrl+H也可以調(diào)出替換界面。
下圖為替換界面,分別輸入查找內(nèi)容和替換內(nèi)容,然后根據(jù)需要單擊全部替換或者替換即可。
(2)Python實(shí)現(xiàn)
在Python中對(duì)某個(gè)值進(jìn)行替換利用的是replace ( ) 方法,replace ( A,B )表示將A替換成B。
上面的代碼是對(duì)年齡這一列進(jìn)行替換,所以把年齡這一列選中,然后調(diào)用replace ( ) 方法。有時(shí)候要對(duì)整個(gè)表進(jìn)行替換,比如對(duì)全表中的缺失值進(jìn)行替換,這個(gè)時(shí)候replace ( ) 方法就相當(dāng)于fillna ( ) 方法了。
np.NaN是Python中對(duì)缺失值的一種表示方法。
2、多對(duì)一替換
多對(duì)一替換就是把一塊區(qū)域中的多個(gè)值替換成某一個(gè)值,已知現(xiàn)在有三個(gè)異常年齡(240、260、280),需要把這三個(gè)年齡都替換成正常范圍年齡的平均值33,該怎么實(shí)現(xiàn)呢?
(1)Excel實(shí)現(xiàn)
在Excel中需要借助if函數(shù)來實(shí)現(xiàn)多對(duì)一替換。已知年齡這一列是D列,要想對(duì)多個(gè)異常值進(jìn)行替換,可以通過如下函數(shù)實(shí)現(xiàn)。
上面的公式借助了Excel中的 OR ( ) 函數(shù),表示如果D列等于240、260或者280時(shí),該單元格的值為33,否則為D列的值。替換后的結(jié)果如下圖所示。
(2)Python實(shí)現(xiàn)
在Python 中實(shí)現(xiàn)多對(duì)一的替換比較簡單,同樣也是利用 replace ( ) 方法, replace ( [A,B],C )表示將A、B替換成C。
3、多對(duì)多替換
多對(duì)多替換其實(shí)就是某個(gè)區(qū)域中多個(gè)一對(duì)一的替換。比如將年齡異常值240替換成平均值減一,260替換成平均值,280替換成平均值加一,該怎么實(shí)現(xiàn)呢?
(1)Excel實(shí)現(xiàn)
若想在Excel中實(shí)現(xiàn),需要借助函數(shù),且需要多個(gè)if嵌套語句來實(shí)現(xiàn),同樣已知年齡列為D列,具體函數(shù)如下:
下圖為該函數(shù)執(zhí)行的流程。
替換后的結(jié)果如下圖所示。
(2)Python實(shí)現(xiàn)
在Python中若想實(shí)現(xiàn)多對(duì)多的替換,同樣是借助replace ( ) 方法,將替換值與待替換值用字典的形式表示,replace({"A":"a","B":"b"}表示用a替換A,用b替換B。
二、數(shù)值排序
數(shù)值排序是按照具體數(shù)值的大小進(jìn)行排序,有升序和降序兩種,升序就是數(shù)值由小到大排列,降序是數(shù)值由大到小排列。
1、按照一列數(shù)值進(jìn)行排序
按照一列數(shù)值進(jìn)行排序就是整個(gè)數(shù)據(jù)表都以某一列為準(zhǔn),進(jìn)行升序或降序排列。
(1)Excel實(shí)現(xiàn)
在Excel中想要按照某列進(jìn)行數(shù)值排序,只要選中這一列的字段名,然后單擊編輯菜單欄下的排序和篩選按鈕,在下拉菜單中選擇升序或降序選項(xiàng)即可,操作流程如下圖所示。
按照銷售ID進(jìn)行升序排列前后的結(jié)果如下圖所示。
(2)Python實(shí)現(xiàn)
在 Python 中我們?nèi)粝氚凑漳沉羞M(jìn)行排序,需要用到 sort_values ( ) 方法,在sort_values ( )后的括號(hào)中指明要排序的列名,以及升序還是降序排列。
上面代碼表示df表按照col1列進(jìn)行排序,ascending = False表示按照col1列進(jìn)行降序排列。ascending 參數(shù)默認(rèn)值為 True,表示升序排列。所以,如果是要根據(jù) col1列進(jìn)行升序排序,則可以只指明列名,不需要額外聲明排序方式。
2、按照有缺失值的列進(jìn)行排序
(1)Python實(shí)現(xiàn)
在Python中,當(dāng)待排序的列中有缺失值時(shí),可以通過設(shè)置na_position參數(shù)對(duì)缺失值的顯示位置進(jìn)行設(shè)置,默認(rèn)參數(shù)值為last,可以不寫,表示將缺失值顯示在最后。
通過設(shè)置na_position參數(shù)將缺失值顯示在最前面。
3、按照多列數(shù)值進(jìn)行排序
按照多列數(shù)值排序是指同時(shí)依據(jù)多列數(shù)據(jù)進(jìn)行升序、降序排列,當(dāng)?shù)谝涣谐霈F(xiàn)重復(fù)值時(shí)按照第二列進(jìn)行排序,當(dāng)?shù)诙谐霈F(xiàn)重復(fù)值時(shí)按照第三列進(jìn)行排序,以此類推。
(1)Excel實(shí)現(xiàn)
在Excel中實(shí)現(xiàn)按照多列排序,選中待排序的所有數(shù)據(jù),單擊編輯菜單欄下的排序和篩選按鈕,在下拉菜單中選擇自定義排序選項(xiàng)就會(huì)出現(xiàn)如下圖所示界面。添加條件就是添加按照排序的列,在次序里面可以單獨(dú)定義每一列的升序或者降序。
舉個(gè)例子,對(duì)下圖左側(cè)的Before表先按照銷售ID升序排列,當(dāng)遇到重復(fù)的銷售ID時(shí),再按成交時(shí)間降序排列,得出下圖右側(cè)的After表。
(2)Python實(shí)現(xiàn)
在 Python 中實(shí)現(xiàn)按照多列進(jìn)行排序,用到的方法同樣是 sort_values ( ),只要在sort-values后的括號(hào)中以列表的形式指明要排序的多列列名及每列的排序方式即可。
上面代碼表示df表先按照col1列進(jìn)行升序排列,當(dāng)col1列遇到重復(fù)時(shí),再按照col2列進(jìn)行降序排列。對(duì)于表df我們依舊先按照銷售ID升序排列,當(dāng)遇到重復(fù)的銷售ID時(shí),再按成交時(shí)間降序排列,代碼如下所示。
三、數(shù)值排名
數(shù)值排名和數(shù)值排序是相對(duì)應(yīng)的,排名會(huì)新增一列,這一列用來存放數(shù)據(jù)的排名情況,排名是從1開始的。
1、Excel實(shí)現(xiàn)
在Excel中用于排名的函數(shù)有RANK.AVG()和RANK.EQ()兩個(gè)。
當(dāng)待排名的數(shù)值沒有重復(fù)值時(shí),這兩個(gè)函數(shù)的效果是完全一樣的,兩個(gè)函數(shù)的不同在于處理重復(fù)值方式的不同。
RANK.AVG(number,ref,order)
number表示待排名的數(shù)值,ref表示一整列數(shù)值的范圍,order用來指明降序還是升序排名。當(dāng)待排名的數(shù)值有重復(fù)值時(shí),返回重復(fù)值的平均排名。
對(duì)銷售ID進(jìn)行平均排名以后的結(jié)果如下圖所示。圖中銷售ID為1的值有兩個(gè),假設(shè)一個(gè)排名是1,另一個(gè)排名是2,那么二者的均值就是1.5,所以平均排名就是1.5;銷售ID為2的值同樣有兩個(gè),同樣假設(shè)一個(gè)排名為3,另一個(gè)排名是4,那么二者的均值是3.5,所以平均排名就是3.5;銷售ID為3的值沒有重復(fù)值,所以排名就是5。
RANK.EQ( number,ref,order )
RANK.EQ 的參數(shù)值與 RANK.AVG 的意思一樣。當(dāng)待排名的數(shù)值有重復(fù)值時(shí), RANK.EQ返回重復(fù)值的最佳排名。
對(duì)銷售ID進(jìn)行最佳排名以后的結(jié)果如下圖所示。圖中銷售ID為1的值有兩個(gè),第一個(gè)重復(fù)值的排名為1,所以兩個(gè)值的最佳排名均為1;銷售ID為2的值也有兩個(gè),第一個(gè)重復(fù)值的排名為3,所以兩個(gè)值的最佳排名均為3;銷售ID為3的值沒有重復(fù)值,最佳排名為5。
2、Python實(shí)現(xiàn)
在Python中對(duì)數(shù)值進(jìn)行排名,需要用到rank ( ) 方法。Rank ( ) 方法主要有兩個(gè)參數(shù),一個(gè)是ascending,用來指明升序排列還是降序排列,默認(rèn)為升序排列,和Excel中order的意思一致;另一個(gè)是method,用來指明待排列值有重復(fù)值時(shí)的處理情況。下表是參數(shù)method可取的不同參數(shù)值及說明。
method取值為average時(shí)的排名情況,與Excel中RANK.AVG函數(shù)的一致。
method取值為first時(shí)的排名情況,銷售ID為1的值有兩個(gè),第一個(gè)出現(xiàn)的排名為1,第二個(gè)出現(xiàn)的排名為2;銷售ID為2的以此類推。
method取值為min時(shí)的排名情況,與Excel中RANK.EQ函數(shù)的一致。
method取值為max時(shí)的排名情況,與method取值min時(shí)相反,銷售ID為1的值有兩個(gè),第二個(gè)重復(fù)值的排名為2,所以兩個(gè)值的排名均為2;銷售ID為2 的值有兩個(gè),第二個(gè)重復(fù)值的排名為4,所以兩個(gè)值的排名均為4。
四、數(shù)值刪除
數(shù)值刪除是對(duì)數(shù)據(jù)表中一些無用的數(shù)據(jù)進(jìn)行刪除操作。
1、刪除列
(1)Excel實(shí)現(xiàn)
在Excel中,要?jiǎng)h除某一列或某幾列,只需要選中這些列,然后單擊鼠標(biāo)右鍵,在彈出的菜單中選擇刪除選項(xiàng)即可(或者單擊鼠標(biāo)右鍵以后按D鍵),如下圖所示。
(2)Python實(shí)現(xiàn)
在Python中,要?jiǎng)h除某列,用到的是drop ( ) 方法,即在drop方法后的括號(hào)中指明要?jiǎng)h除的列名或者列的位置,即第幾列。
在drop方法后的括號(hào)中直接傳入待刪除列的列名,需要加一個(gè)參數(shù)axis,并讓其參數(shù)值等于1,表示刪除列。
還可以在drop方法后的括號(hào)中直接傳入待刪除列的位置,但也需要用axis參數(shù)。
也可以將列名以列表的形式傳給columns參數(shù),這個(gè)時(shí)候就不需要axis參數(shù)了。
2、刪除行
(1)Excel實(shí)現(xiàn)
在 Excel 中,要?jiǎng)h除某些行使用的方法與刪除列是一致的,先選中要?jiǎng)h除的行,然后單擊鼠標(biāo)右鍵,在彈出的下拉菜單中選擇刪除選項(xiàng)就可以刪除行了。
(2)Python實(shí)現(xiàn)
在Python中,要?jiǎng)h除某些行用到的方法依然是drop ( ) ,與刪除列類似的是,刪除行也要指明行相關(guān)的信息。
在drop方法后的括號(hào)中直接傳入待刪除行的行名,并讓axis參數(shù)值等于0,表示刪除行。
除了傳入行索引名稱,還可以在drop方法后的括號(hào)中直接傳入待刪除行的行號(hào),也需要用axis參數(shù),并讓其參數(shù)值等于0。
也可以將待刪除行的行名傳給index參數(shù),這個(gè)時(shí)候就不需要axis參數(shù)了。
3、刪除特定行
刪除特定行一般指刪除滿足某個(gè)條件的行,我們前面的異常值刪除算是刪除特定的行。
(1)Excel實(shí)現(xiàn)
在Excel中刪除特定行分為兩步,第一步先將符合條件的行篩選出來,第二步選中這些篩選出來的行然后單擊鼠標(biāo)右鍵,在彈出的下拉菜單中選擇刪除選項(xiàng)。
(2)Python實(shí)現(xiàn)
在Python中刪除特定行使用的方法有些特殊,我們不直接刪除滿足條件的值,而是把不滿足條件的值篩選出來作為新的數(shù)據(jù)源,這樣就把要?jiǎng)h除的行過濾掉了。
在如下例子中,要?jiǎng)h除年齡值大于等于40對(duì)應(yīng)的行,我們并不直接刪除這一部分,而是把它的相反部分取出來,即把年齡小于40的行篩選出來作為新的數(shù)據(jù)源。
五、數(shù)值計(jì)數(shù)
數(shù)值計(jì)數(shù)就是計(jì)算某個(gè)值在一系列數(shù)值中出現(xiàn)的次數(shù)。
1、Excel實(shí)現(xiàn)
在Excel中實(shí)現(xiàn)數(shù)值計(jì)數(shù),我們使用的是COUNTIF ( ) 函數(shù),COUNTIF ( ) 函數(shù)用來計(jì)算某個(gè)區(qū)域中滿足給定條件的單元格數(shù)目。
range表示一系列值的范圍,criteria表示某一個(gè)值或者某一個(gè)條件。
銷售ID的值的計(jì)數(shù)結(jié)果如下圖所示。銷售ID為1的值在F2:F6這個(gè)范圍內(nèi)出現(xiàn)了兩次;銷售ID為2的值在該范圍內(nèi)也出現(xiàn)了兩次;銷售ID為3的值出現(xiàn)了1次。
2、Python實(shí)現(xiàn)
在Python中,要對(duì)某些值的出現(xiàn)次數(shù)進(jìn)行計(jì)數(shù),我們用到的方法是value_counts ( ) 。
上面代碼運(yùn)行的結(jié)果表示銷售ID為2的值出現(xiàn)了兩次,銷售ID為1的值出現(xiàn)了兩次,銷售ID為3的值出現(xiàn)了1次。這些是值出現(xiàn)的絕對(duì)次數(shù),還可以看一下不同值出現(xiàn)的占比, 只需要給 value_ counts ( )方法傳入?yún)?shù)normalize = True即可。
上面代碼的運(yùn)行結(jié)果表示銷售ID為2的值的占比為0.4,銷售ID為1的值的占比為0.4,銷售ID為3的值的占比為0.2。上面銷售ID的排序是2、1、3,這是按照計(jì)數(shù)值降序排列的(0.4、0.4、0.2),通過設(shè)置sort = False可以實(shí)現(xiàn)不按計(jì)數(shù)值降序排列。
六、唯一值獲取
唯一值獲取就是把某一系列值刪除重復(fù)項(xiàng)以后的結(jié)果,一般可以將表中某一列認(rèn)為是一系列值。
1、Excel實(shí)現(xiàn)
在Excel中,我們?nèi)粝氩榭茨骋涣袛?shù)值中的唯一值,可以把這一列數(shù)值復(fù)制粘貼出來,然后刪除重復(fù)項(xiàng),剩下的就是唯一值了。
2、Python實(shí)現(xiàn)
在Python中,我們要獲取一列值的唯一值,整體思路與Excel的是一致的,先把某一列的值復(fù)制粘貼出來,然后用刪除重復(fù)項(xiàng)的方法實(shí)現(xiàn),關(guān)于刪除重復(fù)項(xiàng)在前面講過了,本節(jié)用另一種獲取唯一值的方法unique ( ) 實(shí)現(xiàn)。
舉個(gè)例子,對(duì)表df中的銷售ID取唯一值,先把銷售ID取出來,然后利用unique ( ) 方法獲取唯一值,代碼如下所示。
七、數(shù)值查找
數(shù)值查找就是查看數(shù)據(jù)表中的數(shù)據(jù)是否包含某個(gè)值或者某些值。
1、Excel實(shí)現(xiàn)
在Excel中我們要想查看數(shù)據(jù)表中是否包含某個(gè)值可以直接利用查找功能。首先要把待查找區(qū)域選中,可以選擇一列或者多列,如果不選,則默認(rèn)在全表中查詢,然后單擊編輯菜單欄的查找和選擇按鈕,在下拉菜單中選擇查找選項(xiàng),如下圖所示。
下圖為選擇查找選項(xiàng)后彈出的查找和替換對(duì)話框(也可以使用快捷鍵Ctrl + F打開查找和替換對(duì)話框),在查找內(nèi)容框輸入要查找的內(nèi)容即可,可以選擇查找全部,這樣就會(huì)把所有查找到的內(nèi)容顯示出來;也可以選擇查找下一個(gè),這樣會(huì)把查找結(jié)果一個(gè)一個(gè)顯示出來。
2、Python實(shí)現(xiàn)
在Python中查看數(shù)據(jù)表中是否包含某個(gè)值用到的是 isin ( )方法,而且可以同時(shí)查找多個(gè)值,只需要在isin ( ) 方法后的括號(hào)中指明即可。
可以將某列數(shù)據(jù)取出來,然后在這一列上調(diào)用 isin ( )方法,看這一列中是否包含某個(gè)/些值,如果包含則返回True,否則返回False。
也可以針對(duì)全表查找是否包含某個(gè)值。
八、區(qū)間切分
區(qū)間切分就是將一系列數(shù)值分成若干份,比如現(xiàn)在有10個(gè)人,你要根據(jù)這10個(gè)人的年齡將他們分為三組,這個(gè)切分過程就稱為區(qū)間切分。
1、Excel實(shí)現(xiàn)
在Excel中實(shí)現(xiàn)區(qū)間切分我們借助的是if函數(shù),具體公式如下:
if函數(shù)的實(shí)現(xiàn)流程如下圖所示。
下圖為利用if嵌套函數(shù)實(shí)現(xiàn)的結(jié)果。
2、Python實(shí)現(xiàn)
在Python中對(duì)區(qū)間切分利用的是cut ( ) 方法,cut ( )方法有一個(gè)參數(shù)bins用來指明切分區(qū)間。
cut ( ) 方法的切分結(jié)果是幾個(gè)左開右閉的區(qū)間,(0,3]就表示大于0小于等于3,(3,6]表示大于3小于等于6,(6,10]表示大于6小于等于10。
與cut ( ) 方法類似的還有qcut ( ) 方法,qcut ( ) 方法不需要事先指明切分區(qū)間,只需要指明切分個(gè)數(shù),即你要把待切分?jǐn)?shù)據(jù)切成幾份,然后它就會(huì)根據(jù)待切分?jǐn)?shù)據(jù)的情況,將數(shù)據(jù)切分成事先指定的份數(shù),依據(jù)的原則就是每個(gè)組里面的數(shù)據(jù)個(gè)數(shù)盡可能相等。
在數(shù)據(jù)分布比較均勻的情況下,cut ( ) 方法和 qcut ( ) 方法得到的區(qū)間基本一致,當(dāng)數(shù)據(jù)分布不均勻,即方差比較大時(shí),兩者得到的區(qū)間的偏差就會(huì)比較大。
九、插入新的行或列
在特定的位置插入行或者列也是比較常用的操作。具體的插入操作有兩個(gè)關(guān)鍵要素,一個(gè)是在哪插入,另一個(gè)是插入什么。
1、Excel實(shí)現(xiàn)
在Excel中要插入行或列首先要確定在哪一行或哪一列前面插入,然后選中這一列或這一行單擊鼠標(biāo)右鍵,在彈出的下拉菜單中選擇插入選項(xiàng)即可。
要在唯一識(shí)別碼列前面插入一列,選中唯一識(shí)別碼這一列然后單擊鼠標(biāo)右鍵,在彈出的下拉菜單中選擇插入選項(xiàng)即可,如下圖所示。
完成上面的操作后,就會(huì)有一個(gè)新的空行或空列,在空行或空列里面輸入要插入的數(shù)據(jù)即可。
2、Python實(shí)現(xiàn)
在Python中沒有專門用來插入行的方法,可以把待插入的行當(dāng)作一個(gè)新的表,然后將兩個(gè)表在縱軸方向上進(jìn)行拼接。關(guān)于表拼接在后面的章節(jié)會(huì)講。
在Python中插入一個(gè)新的列用到的方法是insert ( ),在insert方法后的括號(hào)中指明要插入的位置、插入后新列的列名,以及要插入的數(shù)據(jù)。
還可以直接以索引的方式進(jìn)行列的插入,直接讓新的一列等于某列值即可。
上面的代碼表示新插入一列名為商品類別的值,這一列的值就是后面列表中的值。
十、行列互換
所謂的行列互換(又稱轉(zhuǎn)置)就是將行數(shù)據(jù)轉(zhuǎn)換到列方向上,將列數(shù)據(jù)轉(zhuǎn)換到行方向上。
1、Excel實(shí)現(xiàn)
在Excel中行列互換(轉(zhuǎn)置)需要先把待轉(zhuǎn)置的內(nèi)容復(fù)制,然后粘貼在新的區(qū)域中,粘貼選項(xiàng)選擇轉(zhuǎn)置即可,轉(zhuǎn)置選項(xiàng)如下圖所示。
轉(zhuǎn)置前后的效果對(duì)比如下圖所示。
2、Python實(shí)現(xiàn)
在 Python 中,我們直接在源數(shù)據(jù)表的基礎(chǔ)上調(diào)用.T 方法即可得到源數(shù)據(jù)表轉(zhuǎn)置后的結(jié)果。對(duì)轉(zhuǎn)置后的結(jié)果再次轉(zhuǎn)置就會(huì)回到原來的結(jié)果。
對(duì)表df進(jìn)行轉(zhuǎn)置,代碼如下所示。
對(duì)轉(zhuǎn)后的表再次進(jìn)行轉(zhuǎn)置,代碼如下所示。
十一、索引重塑
所謂的索引重塑就是將原來的索引進(jìn)行重新構(gòu)造。典型的DataFrame結(jié)構(gòu)的表如下表所示。
上面這種表是典型的DataFrame結(jié)構(gòu),它用一個(gè)行索引和一個(gè)列索引來確定一個(gè)唯一值,比如S1-C1唯一值為1,S2-C3唯一值為6。這種通過兩個(gè)位置確定一個(gè)唯一值的方法不僅可以用上述這種表格型結(jié)構(gòu)表示,而且可以用一種樹形結(jié)構(gòu)來表示,如下圖所示。
樹形結(jié)構(gòu)其實(shí)就是在維持表格型行索引不變的前提下,把列索引也變成行索引,其實(shí)就是給表格型數(shù)據(jù)建立層次化索引。
我們把數(shù)據(jù)從表格型數(shù)據(jù)轉(zhuǎn)換到樹形數(shù)據(jù)的過程叫重塑,這種操作在Excel中沒有,在Python用到的方法是stack ( ) ,示例代碼如下所示。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03