
來源:早起Python
作者:劉早起
大家好,我是早起。
在之前的辦公自動化系列文章中,曾經(jīng)介紹過很多將Excel指定字段提取到Word模版中指定位置的案例
從Excel到Word批量制作合同
在上述案例中,都要求有一個(gè)現(xiàn)成的Word模版才可以執(zhí)行,那么如果現(xiàn)在沒有Word模版,要求針對Excel指定內(nèi)容批量生成Word該如何實(shí)現(xiàn)?
本文就將基于一個(gè)真實(shí)的辦公案例進(jìn)行講解如何提取Excel內(nèi)容并創(chuàng)建Word,主要將涉及以下三個(gè)知識點(diǎn)
“openpyxl 讀取 Excel 文件python-docx 寫入 Word 文件python-docx 各類樣式的設(shè)計(jì)和調(diào)整”
你是公司的底層小蝦米,前段時(shí)間收集了公司各個(gè)部門的請假信息匯總表如下:
現(xiàn)在你需要根據(jù)表格中每個(gè)人的信息依次生成各自的請假條如下:
需求的特殊性在于沒有現(xiàn)成的模板,因此需要在代碼中同時(shí)完成模板的制作和文字、段落樣式設(shè)計(jì)。
比較復(fù)雜的文字版面更建議直接設(shè)計(jì)好模板,以及確定好程序識別位置的定位符,詳細(xì)內(nèi)容可以參考之前的教程:批量生成合同
整個(gè)需求的實(shí)現(xiàn)邏輯很簡單,主要分為以下 2 步:
“
獲取 Excel 文件中每一行的信息,提取 5 個(gè)參數(shù);結(jié)合獲取的參數(shù)設(shè)計(jì)請假條樣式并輸出
”
邏輯并不困難,但是復(fù)雜的地方在于用代碼輸出請假條的過程,包括加粗、字號、下劃線等等。
需求中的請假信息匯總表為 Leave.xlsx,已放鏈接供練習(xí)下載 首先讀取請假信息表,嘗試獲取除表頭外實(shí)際信息的 5 個(gè)參數(shù):
from openpyxl import load_workbook
path = r'C:xxx' # 路徑為Excel 文件所在的位置,可按實(shí)際情況更改
workbook = load_workbook(path + r'Leave.xlsx')
sheet = workbook.active
n = 0 for row in sheet.rows:
if n:
for cell in row:
print(cell.value)
n += 1
通過 for row in sheet.rows 和 for cell in row 就可以迭代 Excel 中有數(shù)據(jù)的每個(gè)單元格了。
循環(huán)體中加上對 n 的判斷是為了跳過表頭 如果讓輸出更加直觀可以稍微修改上面的代碼:
n = 0 for row in sheet.rows:
if n:
for cell in row:
print(cell.value, end=', ')
print('')
n += 1
信息已經(jīng)獲取到了,但我們也發(fā)現(xiàn)申請日期是 datetime 形式,因此我們需要利用 datetime 庫獲取其中的日期成分,也可以轉(zhuǎn)化為字符串后利用空格切片:
n = 0 for row in sheet.rows:
if n:
name = row[0].value department = row[1].value
reason = row[2].value days = row[3].value
date = str(row[4].value).split()[0]
print(name, department, reason, days, date)
n += 1
提取到信息后就可以在循環(huán)體內(nèi)建立個(gè)“請假條函數(shù)”,即把每條記錄的 5 個(gè)變量傳入函數(shù),在函數(shù)中生成完整請假條并保存,即修改成如下形式:
def request_for_leave(name, department, reason, days, date):
pass
n = 0 for row in sheet.rows:
if n:
name = row[0].value department = row[1].value
reason = row[2].value days = row[3].value date = str(row[4].value).split()[0]
request_for_leave(name, department, reason, days, date)
n += 1
生成請假條中,首先導(dǎo)入依賴的庫 python-docx 以及跟樣式設(shè)置有關(guān)的相應(yīng)方法:
# 讀取 Word 文件 from docx import Document # 文件涉及段落樣式修改 from docx.enum.text
import WD_PARAGRAPH_ALIGNMENT # 文件涉及文字樣式修改:顏色修改、字號調(diào)整 from docx.shared
import RGBColor, Pt # 設(shè)置中文字體 from docx.oxml.ns import qn
接下來就是依次添加各部分的內(nèi)容和樣式,因?yàn)槿牡淖煮w均為楷體,可以在函數(shù)體的最末尾一并修改。首先實(shí)例化文件后添加“請假條”:
def request_for_leave(name, department, reason, days, date): doc = Document()
heading_1 = '請 假 條' paragraph_1 = doc.add_heading(heading_1, level=1)
# 居中對齊 paragraph_1.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
# 標(biāo)題要打,單獨(dú)修改較大字號 for run in paragraph_1.runs:
run.font.size = Pt(17)
如果對上面的代碼單獨(dú)輸出會發(fā)現(xiàn)標(biāo)題顏色是藍(lán)色,這是以 .add_heading() 添加標(biāo)題默認(rèn)的顏色。
最后也可以統(tǒng)一修改 對于“尊敬的領(lǐng)導(dǎo):”這一行基本同理,但不需要修改字號:
greeting_word = '尊敬的領(lǐng)導(dǎo):' paragraph_2 = doc.add_paragraph(greeting_word)
接下來是核心請假條的正文了,從需求中的樣式上可以看出,整句話中有一些文字塊是固定的,包括 “本人” “、所在部門” “,由于” “需請假” “天?!?/span>,而幾個(gè)文字塊之間的信息是根據(jù)不同人的情況而不同,并且需要添加下劃線。
簡單的邏輯就是將參數(shù)對應(yīng)的文字塊添加好下劃線之后,和固有不變的變量進(jìn)行拼接,就可以形成完整的段落了:
word_1 = " 本人" word_2 = ",所在部門" word_3 = ",由于"
word_4 = ",需請假" word_5 = "天。" paragraph_3 = doc.add_paragraph()
paragraph_3.add_run(word_1)
paragraph_3.add_run(name).underline = True paragraph_3.add_run(word_2)
paragraph_3.add_run(department).underline = True paragraph_3.add_run(word_3)
paragraph_3.add_run(reason).underline = True paragraph_3.add_run(word_4)
paragraph_3.add_run(str(days)).underline = True paragraph_3.add_run(word_5)
# 設(shè)置下劃線 paragraph_3.paragraph_format.line_spacing = 1.5
代碼中 .underline = True 就是對參數(shù)對應(yīng)的文字塊添加下劃線 接下來的申請人和日期填寫就和上面基本類似。
比較大的區(qū)別在于添加了一行新的命令 paragraph.alignment =
WD_PARAGRAPH_ALIGNMENT.RIGHT, 這行命令能夠?qū)⑦@兩個(gè)段落右對齊:
word_6 = '申請人:' paragraph_4 = doc.add_paragraph()
paragraph_4.add_run(word_6)
paragraph_4.add_run(name).underline = True
paragraph_4.alignment = WD_PARAGRAPH_ALIGNMENT.RIGHT
word_7 = '日期:' sign_date = "{}年{}月{}日".format(date.split('-')[0],
date.split('-')[1], date.split('-')[2])
paragraph_5 = doc.add_paragraph()
paragraph_5.add_run(word_7)
paragraph_5.add_run(sign_date).underline = True
paragraph_5.alignment = WD_PARAGRAPH_ALIGNMENT.RIGHT
最后就是統(tǒng)一修改字體為楷體,中文字體修改比較麻煩,不像英文字體只需要指定如 run.font.name = 'Arial' 就可以,需要額外的幾行代碼。最后記得保存:
for paragraph in doc.paragraphs:
for run in paragraph.runs:
# 統(tǒng)一修改顏色 run.font.color.rgb = RGBColor(0, 0, 0)
run.font.name = '楷體' r = run._element.rPr.rFonts
r.set(qn('w:eastAsia'), '楷體')
doc.save(path + "{}-請假條.docx".format(name))
運(yùn)行上述代碼即可針對每個(gè)人產(chǎn)生相應(yīng)的請假條:
至此,我們就成功利用Python實(shí)現(xiàn)了開頭的需求,解放雙手。注意本案例同樣適用于邀請函、證明等各類文書的制作,大家可以舉一反三。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10