
近年來(lái),隨著數(shù)據(jù)科學(xué)的逐步發(fā)展,Python語(yǔ)言的使用率也越來(lái)越高,不僅可以做數(shù)據(jù)處理,網(wǎng)頁(yè)開(kāi)發(fā),更是數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等從業(yè)者的首選語(yǔ)言。
“工欲善其事,必先利其器?!?要做好數(shù)據(jù)分析,離不開(kāi)一個(gè)好的編程工具,不論是從Python的語(yǔ)法之簡(jiǎn)潔、開(kāi)發(fā)之高效,招聘崗位之熱門(mén)來(lái)說(shuō),Python都是數(shù)據(jù)科學(xué)從業(yè)者需要掌握的一門(mén)語(yǔ)言。
但一直以來(lái),人們卻誤以為“學(xué)會(huì)Python”是件很難的事情。
實(shí)則不然,這恰恰是我們選擇學(xué)Python的理由之一。
事實(shí)證明,Python人人皆能學(xué)會(huì)——千萬(wàn)別不信。
老少皆宜 —— 也就是說(shuō),“只要你愿意”,根本沒(méi)有年齡差異。十二歲的孩子可以學(xué);十八歲的大學(xué)生可以學(xué);在職工作人員可以學(xué)…… 就算你已經(jīng)退休了,想學(xué)就能學(xué),誰(shuí)也攔不住你。
不分性別,男性可以學(xué),女性同樣可以學(xué),性別差異在這里完全不存在。
不分國(guó)界,更沒(méi)有區(qū)域差異 —— 互聯(lián)網(wǎng)的恩惠在于,你在北京、紐約也好,老虎溝、門(mén)頭溝也罷,在這個(gè)領(lǐng)域里同樣完全沒(méi)有任何具體差異。
尤其是在中國(guó)?,F(xiàn)狀是,中國(guó)的人口密度極高,優(yōu)質(zhì)教育資源的確就是稀缺…… 但在計(jì)算機(jī)科學(xué)領(lǐng)域,所有的所謂 “優(yōu)質(zhì)教育資源” 事實(shí)上完全沒(méi)有任何獨(dú)特的競(jìng)爭(zhēng)力 —— 編程領(lǐng)域,實(shí)際上是當(dāng)今世上極為罕見(jiàn)的 “教育機(jī)會(huì)公平之地”。又不僅在中國(guó)如此,事實(shí)上,在全球范圍內(nèi)也都是如此。
多年以前,不識(shí)字的人被稱(chēng)為文盲……
后來(lái),不識(shí)英文,也是文盲。人們發(fā)現(xiàn)很多科學(xué)文獻(xiàn)的主導(dǎo)語(yǔ)言都是英語(yǔ)……
再后來(lái),不會(huì)計(jì)算機(jī)的也算是文盲,因?yàn)椴粫?huì)計(jì)算機(jī)基本操作,很多工作的效率很低下,浪費(fèi)了很多時(shí)間……
近些年,不會(huì)數(shù)據(jù)分析的,也算做文盲了,互聯(lián)網(wǎng)高速發(fā)展,用戶(hù)行為數(shù)據(jù)越來(lái)越多,
你作為一個(gè)個(gè)體,每天都在產(chǎn)生各種各樣的數(shù)據(jù),然后時(shí)時(shí)刻刻都在被別人使用著、分析著…… 然而你自己卻全然沒(méi)有數(shù)據(jù)分析能力,甚至不知道這事很重要,是不是感覺(jué)很可怕?你看看周邊那么多人,有多大的比例想過(guò)這事?反正那些天天看機(jī)器算法生成的信息流的人好像就是全然不在意自己正在被支配……
怎么辦?學(xué)唄,學(xué)點(diǎn)編程罷 —— 巧了,這還真是個(gè)正常人都能學(xué)會(huì)的技能。
為便于上手學(xué)習(xí),在開(kāi)始前再做兩點(diǎn)補(bǔ)充
安裝開(kāi)發(fā)工具 眾所周知,在數(shù)據(jù)分析相關(guān)的編程語(yǔ)言中,有三個(gè)重中之重:Python、R、Julia 俗稱(chēng)數(shù)據(jù)科學(xué)三劍客。如果有一個(gè)工具能集中編寫(xiě)這三者的代碼,為大家省去各種安裝開(kāi)發(fā)工具的時(shí)間,那簡(jiǎn)直太好不過(guò)了,于是jupyter應(yīng)運(yùn)而生,作為“工具的工具”而備受數(shù)據(jù)科學(xué)從業(yè)者的青睞!
Jupyter的名字就很好地詮釋了這一發(fā)集大成的思路,它是 Julia、Python、R 語(yǔ)言的組合,拼寫(xiě)相近于木星(Jupiter),而且現(xiàn)在支持的語(yǔ)言也遠(yuǎn)超這三種了。
所以需要讀者自行下載安裝好Anaconda提供的Jupyter notebook或者jupyter lab,以便于更好地運(yùn)行本文相關(guān)代碼。安裝好后可以直接運(yùn)行Python,因?yàn)槔锩嬉呀?jīng)幫你集成好了環(huán)境。
文章閱讀指南 雖然筆者力求極簡(jiǎn),帶你入門(mén)Python,但你依然有可能遇到問(wèn)題,因?yàn)榫幊陶Z(yǔ)言的知識(shí)體系有一個(gè)特點(diǎn),知識(shí)點(diǎn)之間不是線(xiàn)性的從前往后,而是呈網(wǎng)狀的,經(jīng)常出現(xiàn)前置引用。所以很多時(shí)候可能不經(jīng)意間就用的是后面的知識(shí)點(diǎn),這是不可避免的,遇到這種情況,注定要反復(fù)閱讀若干遍,之所以取名叫極簡(jiǎn)入門(mén),這一部分的目標(biāo)就在與并不是讓你立馬學(xué)會(huì)就去寫(xiě)代碼,而是讓你脫盲……
好了,接下來(lái),與大家一起開(kāi)始我們的Python旋風(fēng)之旅,沿用之前《極簡(jiǎn)統(tǒng)計(jì)學(xué)入門(mén)》、《SQL數(shù)據(jù)分析極簡(jiǎn)入門(mén)》的“MVP”思路,用三節(jié)的內(nèi)容梳理一下Python數(shù)據(jù)分析的核心內(nèi)容。整個(gè)系列框架如下:
第1節(jié) Python基礎(chǔ)知識(shí)
第2節(jié) Pandas基礎(chǔ)知識(shí)
第3節(jié) Pandas基礎(chǔ)知識(shí)
如果你接觸過(guò)不同編程語(yǔ)言就會(huì)發(fā)現(xiàn),任何編程語(yǔ)言的學(xué)習(xí),都離不開(kāi)3個(gè)最基本的核心要素,數(shù)據(jù)類(lèi)型、流程控制、函數(shù)
數(shù)據(jù)類(lèi)型是用來(lái)描述數(shù)據(jù)的性質(zhì)和特征的,它決定了數(shù)據(jù)在計(jì)算和處理過(guò)程中的行為和規(guī)則。常見(jiàn)的數(shù)據(jù)類(lèi)型包括整數(shù)、浮點(diǎn)數(shù)、字符串、日期等。簡(jiǎn)而言之,就是你將要操作的東西具有什么樣的特點(diǎn)。
流程控制是指通過(guò)條件判斷和循環(huán)等方式,控制程序按照一定的順序執(zhí)行不同的操作步驟。它決定了數(shù)據(jù)的處理流程,包括判斷條件、循環(huán)次數(shù)、分支選擇等。簡(jiǎn)而言之,就是你要操作這個(gè)東西的基本流程是什么。
函數(shù)是一段預(yù)先定義好的代碼,用于執(zhí)行特定的操作或計(jì)算。它接受輸入?yún)?shù),并返回一個(gè)結(jié)果。函數(shù)可以用來(lái)對(duì)數(shù)據(jù)進(jìn)行各種計(jì)算、轉(zhuǎn)換、篩選等操作,以滿(mǎn)足特定的需求。簡(jiǎn)而言之,就是你要怎么樣才能可復(fù)用地操作這一類(lèi)東西。
我們來(lái)看第一個(gè)核心要素:數(shù)據(jù)類(lèi)型
Python中的數(shù)據(jù)類(lèi)型有很多,如果我們按照大類(lèi)來(lái)分,可以分為三大數(shù)據(jù)類(lèi)型:
整型 int
a = 2022 # 把2022賦值給a
type(a) # 查看數(shù)據(jù)類(lèi)型:<class 'int'>
int
浮點(diǎn)型 float
b = -21.9
type(b) # 數(shù)據(jù)類(lèi)型:<class 'float'>
float
復(fù)數(shù)型 complex
c = 11 + 36j
type(c) # 數(shù)據(jù)類(lèi)型:<class 'complex'>
complex
布爾型 bool
d = True
type(d) # 數(shù)據(jù)類(lèi)型:<class 'bool'>
bool
str_a = "Certified_Data_Analyst" # 創(chuàng)建字符串:"Certified_Data_Analyst"
type(str_a) # 數(shù)據(jù)類(lèi)型:<class 'str'>
str
len(str_a) # 字符串長(zhǎng)度:
22
str_a[0] # 輸出字符串第1個(gè)字符
'C'
str_a[10] # 輸出字符串第11個(gè)字符
'D'
str_a[15] # 輸出字符串第16個(gè)字符
'A'
str_a[:9] # 輸出字符串第1到9個(gè)字符
'Certified'
str_a[10:14] # 輸出從第11到14個(gè)的字符
'Data'
str_a[15:] # 輸出從第15個(gè)后的所有字符
'Analyst'
str_a * 2 # 輸出字符串2次
'Certified_Data_AnalystCertified_Data_Analyst'
str_a+"_Exam" # 連接字符串
'Certified_Data_Analyst_Exam'
str_a.upper() # 轉(zhuǎn)換為大寫(xiě)
'CERTIFIED_DATA_ANALYST'
str_a.lower() # 轉(zhuǎn)換為小寫(xiě)
'certified_data_analyst'
int("1024") # 字符串轉(zhuǎn)數(shù)字:1024
1024
str(3.14) # 數(shù)字轉(zhuǎn)字符串:'3.14'
'3.14'
"Certified_Data_Analyst".split("_") # 分隔符拆分字符串
['Certified', 'Data', 'Analyst']
"Certified_Data_Analyst".replace("_", " ") # 替換字符串"_"為" "
'Certified Data Analyst'
"7".zfill(3) # 左邊補(bǔ)0
'007'
可以容納多個(gè)元素的的對(duì)象叫做容器,這個(gè)概念比較抽象,你可以這么理解,容器用來(lái)存放不同的元素,根據(jù)存放特點(diǎn)的不同,常見(jiàn)的容器有以下幾種:list(列表)、tuple(元組)、dict(字典)、set(集合)
用中括號(hào)[]
可以創(chuàng)建一個(gè)list變量
[2,3,5,7]
[2, 3, 5, 7]
用圓括號(hào)()
可以創(chuàng)建一個(gè)tuple變量
(2,3,5,7)
(2, 3, 5, 7)
用花括號(hào){}
可以創(chuàng)建一個(gè)集合變量
{2,3,5,7}
{2, 3, 5, 7}
用花括號(hào){}
和冒號(hào):
,可以創(chuàng)建一個(gè)字典變量
{'a':2,'b':3,'c':5,'d':7}
{'a': 2, 'b': 3, 'c': 5, 'd': 7}
分支
舉例說(shuō)明,我們給x
賦值-10,然后通過(guò)一個(gè)分支做判斷,當(dāng)x大于零時(shí)候輸出"x是正數(shù)",當(dāng)x小于零的時(shí)候輸出"x是負(fù)數(shù)",其他情況下輸出"x是零"
x = -10
if x > 0:
print("x是正數(shù)")
elif x < 0:
print("x是負(fù)數(shù)")
else:
print("x是零")
x是負(fù)數(shù)
循環(huán)
舉例說(shuō)明for循環(huán),用for循環(huán)來(lái)迭代從1到5的數(shù)字,并將每個(gè)數(shù)字打印出來(lái)
# for循環(huán)
for i in range(1, 6):
print(i)
1
2
3
4
5
首先,range(1, 6)
函數(shù)生成一個(gè)序列,從1到5(不包括6)。
然后,for循環(huán)使用變量i
來(lái)迭代這個(gè)序列中的每個(gè)元素。
在每次迭代中,print(i)
語(yǔ)句將當(dāng)前的i
值打印出來(lái)。
再舉例說(shuō)明while循環(huán):用while循環(huán)迭代從1到10的數(shù)字,并將每個(gè)數(shù)字打印出來(lái)
# while循環(huán)
i = 1
while i <= 10:
print(i)
i += 1
if i == 6:
break
1
20
3
4
5
首先,將i
初始化為1。
然后,while循環(huán)將在i
小于或等于10時(shí)執(zhí)行。在每次循環(huán)中,print(i)
語(yǔ)句將當(dāng)前的i
值打印出來(lái)。
接下來(lái),i += 1
語(yǔ)句將i
的值遞增。在每次循環(huán)中,if i == 6: break
語(yǔ)句將檢查i
的值是否等于6。如果是,則使用break
語(yǔ)句終止循環(huán)。
Python提供了許多常用函數(shù),這部分內(nèi)容數(shù)據(jù)分析最基礎(chǔ)的內(nèi)容,有部分函數(shù)在Python內(nèi)置庫(kù)就已經(jīng)自帶
常用函數(shù):
abs(x) # 返回x的絕對(duì)值。
round(x) # 返回最接近x的整數(shù)。如果有兩個(gè)整數(shù)與x距離相等,將返回偶數(shù)。
pow(x, y) # 返回x的y次方。
sqrt(x) # 返回x的算術(shù)平方根。
max(x1, x2, ...) # 返回一組數(shù)中的最大值。
min(x1, x2, ...) # 返回一組數(shù)中的最小值。
sum([x1,x2,...]) # 返回可迭代對(duì)象中所有元素的和。
也有一些是來(lái)自于math庫(kù),我們需要用from math import *
來(lái)引入math庫(kù),然后才能調(diào)用里面的函數(shù)。這個(gè)過(guò)程就好比你要使用一個(gè)工具箱里面的工具,必須先找到工具箱。通過(guò)使用這些數(shù)學(xué)函數(shù),可以進(jìn)行各種數(shù)學(xué)計(jì)算和數(shù)據(jù)處理操作。
常用數(shù)學(xué)函數(shù)
# 數(shù)學(xué)運(yùn)算函數(shù)
from math import *
sqrt(x) #x的算術(shù)平方根
log(x) #自然對(duì)數(shù)
log2(x) #以2為底的常用對(duì)數(shù)
log10(x) #以10為底的常用對(duì)數(shù)
exp(x) #x的e次冪
modf(x) #返回x的?數(shù)部分和整數(shù)部分
floor(x) #對(duì)x向下取值整
ceil(x) #對(duì)x向上取整
divmod(x,y) #接受兩個(gè)數(shù)字,返回商和余數(shù)的元組(x//y , x%y)# 三角函數(shù)
sin(x) #x的正弦值
cos(x) #x的余弦值
tan(x) #x的正切值
asin(x) #x的反正弦值
acos(x) #x的反余弦值
atan(x) #x的反正切值# 排列組合函數(shù)
# from itertools import *
product() #序列中的元素進(jìn)行排列, 相當(dāng)于使用嵌套循環(huán)組合
permutations(p[, r]) #從序列p中取出r個(gè)元素的組成全排列
combinations(p, r) #從序列p中取出r個(gè)元素組成全組合,元素不允許重復(fù)
combinations_with_replacement(p, r) #從序列p中取出r個(gè)元素組成全組合,允許重復(fù)# 簡(jiǎn)單統(tǒng)計(jì)函數(shù) pandas
describe() #描述性統(tǒng)計(jì)
count() #非空觀測(cè)數(shù)量
sum() #所有值之和
mean() #平均值
median() #中位數(shù)
mode() #一組數(shù)的眾數(shù)
std() #標(biāo)準(zhǔn)差
var() #方差
min() #所有值中的最小值
max() #所有值中的最大值
abs() #絕對(duì)值
prod() #數(shù)組元素的乘積
corr() #相關(guān)系數(shù)矩陣
cov() #協(xié)方差矩陣# 排序函數(shù)
sort() #沒(méi)有返回值,會(huì)對(duì)列表進(jìn)行原地排序
sorted() #需要用一個(gè)變量進(jìn)行接收,不會(huì)修改原有列表# 集合運(yùn)算符號(hào)和函數(shù)
& #交集
| #并集
- #差集
^ #異或集(不相交的部分)
intersection() #交集
union() #并集
difference() #補(bǔ)集
symmetric_difference() #異或集(不相交的部分)
isdisjoint() #兩集合有無(wú)相同元素
issubset() #是不是子集
issuperset() #是不是超集# 缺失值處理(Pandas)
np.nan (Not a Number) #空值
None #缺失值
pd.NaT #時(shí)間格式的空值# 判斷缺失值
isnull()/isna() #斷Series或DataFrame中是否包含空值
notnull() #與isnull()結(jié)果互為取反
isin() #判斷Series或DataFrame中是否包含某些值
dropna() #刪除Series或DataFrame中的空值
fillna() #填充Series或DataFrame中的空值
ffill()/pad() #用缺失值的前一個(gè)值填充
bfill()/backfill() #用缺失值的后一個(gè)值填充
replace() #替換Series或DataFrame中的指定值
自定義函數(shù)是一種在Python中自行定義的可重復(fù)使用代碼塊的方法。通過(guò)定義自己的函數(shù),可以將一系列操作放在一個(gè)函數(shù)中,并在需要時(shí)多次調(diào)用該函數(shù)。
舉例說(shuō)明,如何創(chuàng)建和調(diào)用一個(gè)自定義函數(shù):
def linear(x):
y = 2*x + 4
return y
在上面的例子中,我們用def linear(x):
定義了一個(gè)名為linear
的函數(shù),該函數(shù)接收一個(gè)參數(shù)x。
然后函數(shù)體內(nèi)計(jì)算了一個(gè)y值,它是x的兩倍加上4。
這樣,我們調(diào)用linea函數(shù)的時(shí)候,并傳入一個(gè)參數(shù)x時(shí),函數(shù)將返回計(jì)算得到的y值。例如,如果我們調(diào)用linear(3)
,函數(shù)將返回10
,因?yàn)?code style="font-size: 14px; word-wrap: break-word; padding: 2px 4px; border-radius: 4px; margin: 0 2px; color: #1e6bb8; background-color: rgba(27,31,35,.05); font-family: Operator Mono, Consolas, Monaco, Menlo, monospace; word-break: break-all;">2*3 + 4 = 10。
可以根據(jù)具體的需求來(lái)編寫(xiě)自定義函數(shù),并在程序中調(diào)用它們。
再看一個(gè)稍微復(fù)雜一點(diǎn)的例子(PS:建議初學(xué)者先跳過(guò)這個(gè)例子)
# 斐波那契數(shù)列(通過(guò)迭代方法實(shí)現(xiàn))
def fib(n):
n1=1;n2=1;n3=1
if n<1:
print('輸入有誤!')
return 0
else:
while (n-2) > 0 :
n3 = n2 + n1
n1 = n2
n2 = n3
n -= 1
return n3
result = fib(35)
result
9227465
# 斐波那契數(shù)列(通過(guò)遞歸方法實(shí)現(xiàn))
def fib(n):
if n < 1:
print('輸入有誤!')
return -1
elif n == 1 or n == 2:
return 1
else:
return fib(n-1) + fib(n-2)
result = fib(35)
result
9227465
# 斐波那契數(shù)列(通過(guò)矩陣方法實(shí)現(xiàn))
import numpy as np
def dotx(a,n):
for i in range(1,n+1):
if i == 1:
b = a
else :
b = np.dot(a,b)
return b
def fib(n):
a = np.array([[1,1],[1,0]])
r = dotx(a,n)
return r[0,1]
result = fib(35)
result
9227465
下一節(jié) 《第2節(jié) Pandas簡(jiǎn)介》
這里分享一個(gè)你一定用得到的小程序——CDA數(shù)據(jù)分析師考試小程序。 它是專(zhuān)為CDA數(shù)據(jù)分析認(rèn)證考試報(bào)考打造的一款小程序??梢詭湍憧焖賵?bào)名考試、查成績(jī)、查證書(shū)、查積分,通過(guò)該小程序,考生可以享受更便捷的服務(wù)。 掃碼加入CDA小程序,與圈內(nèi)考生一同學(xué)習(xí)、交流、進(jìn)步!
數(shù)據(jù)分析咨詢(xún)請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢(xún)效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開(kāi)的話(huà)題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開(kāi)始提取前,需先判斷 TIF 文件的類(lèi)型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專(zhuān)業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專(zhuān)業(yè)操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開(kāi)發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶(hù)體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷(xiāo)案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見(jiàn)頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷(xiāo)成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類(lèi)分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類(lèi)分析作為 “無(wú)監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10