
來源:早起Python
作者:劉早起
大家好,我是早起。
在過去的半年內(nèi),我總共發(fā)布了超過了40篇 「Python辦公自動化」文章,不知道大家有沒有發(fā)現(xiàn),有一些模塊、一些代碼會頻繁出現(xiàn)。而os、shutil、glob基本是每篇都會出現(xiàn)。
在寫了幾十篇文章后,我將一些辦公自動化常用操作的代碼單獨(dú)整理出來,大家拿走就可以用在自己的腳本中!
批量操作的前提就是對文件夾進(jìn)行遍歷,使用os模塊可以輕松的遍歷文件夾,os.walk 遍歷后產(chǎn)生三個(gè)參數(shù):
“當(dāng)前文件夾路徑包含文件夾名稱[列表形式]包含文件名稱[列表形式]”
代碼如下,大家可以根據(jù)自己的路徑進(jìn)行修改
import os
for dirpath, dirnames, filenames in os.walk(r'C:Program Files (x86)'):
print(f'打開文件夾{dirpath}') # 當(dāng)前文件夾路徑 if dirnames:
print(dirnames) # 包含文件夾名稱[列表形式] if filenames:
print(filenames) # 包含文件名稱[列表形式] print('-' * 10)
當(dāng)手上的需求明確有獲取給定路徑各級文件夾下所有符合條件的文件,并進(jìn)行相應(yīng)的批處理操作時(shí),即可使用 os.walk
有時(shí)我們需要判斷一個(gè)目錄下是否存在文件也可以使用os模塊。
給定一個(gè)目標(biāo)路徑 path ,通過一行代碼就能夠判斷這是文件還是文件夾路徑
import os path = 'xxx' print(os.path.isfile(path))
os.path.basename 可以直接從絕對路徑中獲取最后的文件名,當(dāng)然如果用傳統(tǒng)的字符串切割方式也可以,即 path.split('')[-1]
import os path = 'xxx' print(os.path.basename)
創(chuàng)建文件夾的代碼非常常用,因?yàn)橥傻男挛募枷M袀€(gè)新的文件夾存儲,代碼如下:
import os dirpath = 'xxx' os.mkdir(dirpath)
但是,如果希望創(chuàng)建的文件夾已經(jīng)存在,再運(yùn)行 os.mkdir() 則會報(bào)錯(cuò)而終止代碼。為了避免這一情況的發(fā)生,可以在創(chuàng)建文件夾之前先判斷文件夾是否存在。
用到的代碼是 os.path.exists,只有當(dāng)路徑不存在(即 os.path.exists 返回的結(jié)果是 False 時(shí)),才會創(chuàng)建:
import os dirpath = 'xxx' if not os.path.exists(dirpath):
os.mkdir(dirpath)
獲取桌面路徑也是非常常用的操作,可以使用os.path.join(os.path.expanduser("~"), 'Desktop') 獲取桌面的絕對路徑。
這樣做的好處是可以把數(shù)據(jù)放在桌面上,在不同的電腦上都能調(diào)用代碼對數(shù)據(jù)進(jìn)行處理。如果是在一條電腦上把桌面路徑固定在字符串中,則換一臺電腦就必須修改桌面路徑。代碼如下:
import os desktop_path = os.path.join(os.path.expanduser("~"), 'Desktop') print(desktop_path)
當(dāng)然把上面的代碼包裝成一個(gè)函數(shù) GetDesktopPath() 需要時(shí)調(diào)用它會更加方便
import os def GetDesktopPath():
return os.path.join(os.path.expanduser("~"), 'Desktop')
需要用到 os.rename() 方法,下面的代碼示例中分別演示如何重命名文件和文件夾
import os os.rename('practice.txt', 'practice_rename.txt') #
重命名文件 os.rename('文件夾1', '文件夾2') # 重命名文件夾
除了前面的 os.walk 之外,有其他的 os 模塊下方法可完成獲取指定路徑的全部或符合條件的文件(非遍歷各級文件夾的需求),還可以使用下面兩個(gè)代碼 第一種用到的方法是os.scandir(),使用如下:
import os path = 'xxx' for file in os.scandir(path):
print(file.name, file.path)
上面代碼最后輸出的是 給定路徑下各內(nèi)容的名字、絕對路徑第二種方法使用 os.listdir(),它比 os.scandir() 簡單一些,可直接調(diào)用輸出名稱而非路徑:
import os path = 'xxx' for file in os.listdir(path):
print(file)
shutil也是經(jīng)常出現(xiàn)在辦公自動化場景中的模塊,我常用的就是移動文件/文件夾。
需要用到shutil.move 方法,下面的代碼示例中分別演示如何移動文件和文件夾:
import shutil
shutil.move(r'.practice.txt', r'.文件夾1/')
shutil.move(r'.practice.txt', r'.文件夾1/new.txt')
注意到上面后兩行代碼的區(qū)別嗎?前一行是將目標(biāo)文件移動到目標(biāo)文件夾里,而后一行,在將目標(biāo)文件移動到目標(biāo)文件夾里的同時(shí),能夠?qū)ζ溥M(jìn)行重命名
也就是說,如果我們需要移動某個(gè)或某些文件到新的文件夾,并且需重命名文件,則我們并不需要用 os.rename 先命名文件再用 shutil.move 將其移動的指定文件夾,而是可以用 shutil.move 一步到位。
最后要介紹的是glob模塊,也是辦公自動化必須要掌握的一個(gè)模塊,同樣可以用于批處理文件。
glob 最重要的功能就是搜索獲取同一級或者各子級下符合條件的文件(絕對路徑),非常適合寫批處理的代碼。
有時(shí)候我們需要對大量文件進(jìn)行相同操作,在寫完針對一份文件的操作后,只需要加上幾行代碼,就可以完成批處理全部文件的工作。大致代碼框架如下:
import glob
for file in glob.glob('**/*', recursive=True):
print(file)
glob.glob() 是一個(gè)非常重要的方法,能夠獲取給定路徑下文件的絕對路徑,并且接受「通配符」搜索,大大拓寬了靈活程度,* 表示任意字符長度,**/* 的使用表示用通配符指代給定路徑下的任何一層,recursive 參數(shù)允許遍歷搜索。
以上就是我為大家整理的十個(gè)常用操作的代碼,大部分都是可以通用的,大家可以收藏本文,并在需要進(jìn)行相關(guān)操作的時(shí)候可以直接復(fù)制粘貼使用。
另外也希望大家在自己寫代碼、讀別人代碼時(shí),可以多去思考哪些函數(shù)/代碼片段是可以為我所用,這樣才會進(jìn)步的更快!
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10