DataFrame
DataFrame 是一個(gè)帶有索引的二維數(shù)據(jù)結(jié)構(gòu),每列可以有自己的名字,并且可以有不同的數(shù)據(jù)類型。你可以把它想象成一個(gè) excel 表格或者數(shù)據(jù)庫(kù)中的一張表,DataFrame 是最常用的 Pandas 對(duì)象。
創(chuàng)建
在構(gòu)建 DataFrame 的時(shí)候,主要有兩種思路
數(shù)據(jù)為字典類的格式, 是以列的方式進(jìn)行組織, 字典的 key 將會(huì)作為列名,字典的值value作為列的數(shù)據(jù).
數(shù)據(jù)為列表類形式, 是以行的方式進(jìn)行組織的, 列名需要用參數(shù)傳入進(jìn)去.
從本地磁盤文件讀?。簆d.read_....
參數(shù)說明:
- filepath_or_buffer, 文件路徑
- sep=',', 文件分隔符
- delimiter=None, 同上
- header='infer', 用哪一行作為列名
- names=None, 當(dāng)讀取進(jìn)來沒有列名的時(shí)候, 可以用這個(gè)設(shè)置列名
- index_col=None, 用哪一列作為數(shù)據(jù)行索引
DataFrame 的索引和切片
提取數(shù)據(jù)表中的列, 是最常用的操作之一, 因此這個(gè)操作也非常簡(jiǎn)單。
只要把列名作為索引的 key 就可以了,也可以把列當(dāng)做 DataFrame 的屬性提?。?列名)。
索引和切片對(duì)應(yīng)字典和列表的兩種方式,也是分為兩種思路, 分別是顯式索引和隱式索引
顯式索引
在顯示索引中,把 DataFrame 的索引值當(dāng)做第一個(gè)軸的 key,把列名當(dāng)做第二個(gè)軸的 key
語(yǔ)法 df.loc[索引行,索引列 ]
序列值索引
隱式索引
使用 iloc()
也就是 index_loc
這種方式不看你的行索引和列索引是什么名稱,
可以把數(shù)據(jù)當(dāng)做是一個(gè)有序列表, 只看數(shù)據(jù)是處于表中的一個(gè)什么位置.
新增/刪除列
新增行: .loc['行名'] 加"="為修改
新增列: .loc[:,'列名']
刪除行/列
.pop()和.drop():index=None 刪除行,columns=None 刪除列
查看前幾條信息:head()
查看后幾條信息:tail()
轉(zhuǎn)置: .T
掩碼提取數(shù)據(jù):
利用邏輯判斷提取數(shù)據(jù)
邏輯關(guān)系:
與 and &
或 or |
非 not ~
保存數(shù)據(jù):to_****()








暫無數(shù)據(jù)