
作者:陳熹
來源:早起Python
大家好,又到了辦公自動化系列!之前講過很多基于Excel的數(shù)據(jù)及樣式調(diào)整案例,今天分享一個python操作Word的真實自動化需求實現(xiàn)過程:
「使用Python批量修改Word樣式」
主要將涉及
需求描述
手上現(xiàn)有若干份財務(wù)分析報告的Word文檔,如下:
每一份Word文檔中的內(nèi)容如下:
為了方便后續(xù)審閱,需要將所有文檔中所有含有資金的語句標(biāo)紅加粗,如圖所示
步驟分析和前置知識
為了解決這個需求簡單復(fù)習(xí)一下相關(guān)知識。Word文檔一般而言由文檔(document) - 段落(paragraph) - 文字塊(run) 三級結(jié)構(gòu)組成:
從需求反饋中可以看出,本質(zhì)上我們需要做的就是對所有含有資金的文字塊Run進行樣式調(diào)整
因此,本需求的邏輯如下:
1.創(chuàng)建一個空文件夾(用于存放修改后的財務(wù)報告,避免直接對原文件修改)
2.通過glob獲取目標(biāo)文件夾下的所有Word路徑
3.利用docx模塊對每個Word文檔遍歷,并獲取包含特定詞的文字塊
4.對文字塊進行樣式修改
代碼實現(xiàn)
首先導(dǎo)入需要的庫并設(shè)置目標(biāo)文件夾路徑
from docx import Document from docx.shared import RGBColor, Pt, Cm import os import glob # 此處更換創(chuàng)建文件夾的路徑 mkdir_path = r'C:\Users\xxx\new_dir' # 此處更換所有文件所在的位置 file_path = r'C:\Users\xxx\'
os和glob我們都很熟悉,這里簡單介紹一下docx模塊 這是一個非標(biāo)準(zhǔn)庫,在命令行中我們需要輸入以下命令安裝:
pip install python-docx
尤其要注意安裝時候輸入的是python-docx,而實際調(diào)用時為docx
實例化具體的Word文檔代碼為:
from docx import Document wordfile = Document(path)
如果不指定路徑則為創(chuàng)建新的Word文檔,這點跟操作Excel的openpyxl不太一樣,有機會再做介紹。
現(xiàn)在我們建立文件夾存放新生成的文件,首先判斷文件夾是否存在,不存在時再運行os.mkdir避免報錯
if not os.path.exists(mkdir_path): os.mkdir(mkdir_path)
接著遍歷Word文檔,利用glob模塊的通配符,框架如下:
for file in glob.glob(file_path + '/*.docx'): pass
根據(jù)三級結(jié)構(gòu),一個文檔Document有一個或多個段落Paragragh,一個段落Paragraph有一個或多個文字塊Run,合起來代碼為:
for file in glob.glob(file_path + '/*.docx'): docx = Document(file) for paragraph in docx.paragraphs: for run in paragraph.runs: pass
最后我們針對特定詞修改樣式,遍歷到文字塊后就可以做判斷了
... for run in paragraph.runs: if '資金' in run.text: run.font.bold = True # 加粗 run.font.color.rgb = RGBColor(255, 0, 255) # 設(shè)置字體顏色 # 最后切記保存 docx.save(mkdir_path + '/' + os.path.basename(file))
當(dāng)然,除了修改字體顏色和加粗之外,還支持其他樣式的設(shè)置,以下列出常用的作為參考:
# 加粗 run.font.bold = True # 斜體 run.font.italic = True # 下劃線 run.font.underline = True # 刪除線 run.font.strike = True # 字號 run.font.size = Pt(20) # 陰影 run.font.shadow = True # 字體顏色 run.font.color.rgb = RGBColor(255, 0, 255)
至此,整個需求就順利結(jié)束了,附上完整代碼:
from docx import Document from docx.shared import RGBColor, Pt, Cm import os import glob mkdir_path = r'C:\xxx\new_dir)' if not os.path.exists(mkdir_path): os.mkdir(mkdir_path) keyword = '資金' file_path = r'C:\Users\xxx' for file in glob.glob(file_path + '\*.docx'): docx = Document(file) for paragraph in docx.paragraphs: for run in paragraph.runs: if keyword in run.text: run.font.bold = True run.font.color.rgb = RGBColor(255, 0, 0) docx.save(mkdir_path + '/' + os.path.basename(file))
通過本文的Python自動化腳本制作過程,我們可以再次體會Python辦公自動化的強大!如果對自動化代碼和數(shù)據(jù)感興趣可以在后臺回復(fù)自動化獲取。
當(dāng)然除了調(diào)整Word字體顏色,其他的大多數(shù)樣式調(diào)整都可以使用Python完成,也可以與Excel和PPT結(jié)合,這些就留給讀者自己開發(fā)。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03