
來源:早起Python
作者:劉早起
大家好,我是早起。
在之前的辦公自動化系列文章中,曾經(jīng)介紹過很多將Excel指定字段提取到Word模版中指定位置的案例
從Excel到Word批量制作合同
在上述案例中,都要求有一個現(xiàn)成的Word模版才可以執(zhí)行,那么如果現(xiàn)在沒有Word模版,要求針對Excel指定內(nèi)容批量生成Word該如何實現(xiàn)?
本文就將基于一個真實的辦公案例進行講解如何提取Excel內(nèi)容并創(chuàng)建Word,主要將涉及以下三個知識點
“openpyxl 讀取 Excel 文件python-docx 寫入 Word 文件python-docx 各類樣式的設(shè)計和調(diào)整”
你是公司的底層小蝦米,前段時間收集了公司各個部門的請假信息匯總表如下:
現(xiàn)在你需要根據(jù)表格中每個人的信息依次生成各自的請假條如下:
需求的特殊性在于沒有現(xiàn)成的模板,因此需要在代碼中同時完成模板的制作和文字、段落樣式設(shè)計。
比較復(fù)雜的文字版面更建議直接設(shè)計好模板,以及確定好程序識別位置的定位符,詳細內(nèi)容可以參考之前的教程:批量生成合同
整個需求的實現(xiàn)邏輯很簡單,主要分為以下 2 步:
“
獲取 Excel 文件中每一行的信息,提取 5 個參數(shù);結(jié)合獲取的參數(shù)設(shè)計請假條樣式并輸出
”
邏輯并不困難,但是復(fù)雜的地方在于用代碼輸出請假條的過程,包括加粗、字號、下劃線等等。
需求中的請假信息匯總表為 Leave.xlsx,已放鏈接供練習(xí)下載 首先讀取請假信息表,嘗試獲取除表頭外實際信息的 5 個參數(shù):
from openpyxl import load_workbook
path = r'C:xxx' # 路徑為Excel 文件所在的位置,可按實際情況更改
workbook = load_workbook(path + r'Leave.xlsx')
sheet = workbook.active
n = 0 for row in sheet.rows:
if n:
for cell in row:
print(cell.value)
n += 1
通過 for row in sheet.rows 和 for cell in row 就可以迭代 Excel 中有數(shù)據(jù)的每個單元格了。
循環(huán)體中加上對 n 的判斷是為了跳過表頭 如果讓輸出更加直觀可以稍微修改上面的代碼:
n = 0 for row in sheet.rows:
if n:
for cell in row:
print(cell.value, end=', ')
print('')
n += 1
信息已經(jīng)獲取到了,但我們也發(fā)現(xiàn)申請日期是 datetime 形式,因此我們需要利用 datetime 庫獲取其中的日期成分,也可以轉(zhuǎn)化為字符串后利用空格切片:
n = 0 for row in sheet.rows:
if n:
name = row[0].value department = row[1].value
reason = row[2].value days = row[3].value
date = str(row[4].value).split()[0]
print(name, department, reason, days, date)
n += 1
提取到信息后就可以在循環(huán)體內(nèi)建立個“請假條函數(shù)”,即把每條記錄的 5 個變量傳入函數(shù),在函數(shù)中生成完整請假條并保存,即修改成如下形式:
def request_for_leave(name, department, reason, days, date):
pass
n = 0 for row in sheet.rows:
if n:
name = row[0].value department = row[1].value
reason = row[2].value days = row[3].value date = str(row[4].value).split()[0]
request_for_leave(name, department, reason, days, date)
n += 1
生成請假條中,首先導(dǎo)入依賴的庫 python-docx 以及跟樣式設(shè)置有關(guān)的相應(yīng)方法:
# 讀取 Word 文件 from docx import Document # 文件涉及段落樣式修改 from docx.enum.text
import WD_PARAGRAPH_ALIGNMENT # 文件涉及文字樣式修改:顏色修改、字號調(diào)整 from docx.shared
import RGBColor, Pt # 設(shè)置中文字體 from docx.oxml.ns import qn
接下來就是依次添加各部分的內(nèi)容和樣式,因為全文的字體均為楷體,可以在函數(shù)體的最末尾一并修改。首先實例化文件后添加“請假條”:
def request_for_leave(name, department, reason, days, date): doc = Document()
heading_1 = '請 假 條' paragraph_1 = doc.add_heading(heading_1, level=1)
# 居中對齊 paragraph_1.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
# 標(biāo)題要打,單獨修改較大字號 for run in paragraph_1.runs:
run.font.size = Pt(17)
如果對上面的代碼單獨輸出會發(fā)現(xiàn)標(biāo)題顏色是藍色,這是以 .add_heading() 添加標(biāo)題默認(rèn)的顏色。
最后也可以統(tǒng)一修改 對于“尊敬的領(lǐng)導(dǎo):”這一行基本同理,但不需要修改字號:
greeting_word = '尊敬的領(lǐng)導(dǎo):' paragraph_2 = doc.add_paragraph(greeting_word)
接下來是核心請假條的正文了,從需求中的樣式上可以看出,整句話中有一些文字塊是固定的,包括 “本人” “、所在部門” “,由于” “需請假” “天?!?/span>,而幾個文字塊之間的信息是根據(jù)不同人的情況而不同,并且需要添加下劃線。
簡單的邏輯就是將參數(shù)對應(yīng)的文字塊添加好下劃線之后,和固有不變的變量進行拼接,就可以形成完整的段落了:
word_1 = " 本人" word_2 = ",所在部門" word_3 = ",由于"
word_4 = ",需請假" word_5 = "天。" paragraph_3 = doc.add_paragraph()
paragraph_3.add_run(word_1)
paragraph_3.add_run(name).underline = True paragraph_3.add_run(word_2)
paragraph_3.add_run(department).underline = True paragraph_3.add_run(word_3)
paragraph_3.add_run(reason).underline = True paragraph_3.add_run(word_4)
paragraph_3.add_run(str(days)).underline = True paragraph_3.add_run(word_5)
# 設(shè)置下劃線 paragraph_3.paragraph_format.line_spacing = 1.5
代碼中 .underline = True 就是對參數(shù)對應(yīng)的文字塊添加下劃線 接下來的申請人和日期填寫就和上面基本類似。
比較大的區(qū)別在于添加了一行新的命令 paragraph.alignment =
WD_PARAGRAPH_ALIGNMENT.RIGHT, 這行命令能夠?qū)⑦@兩個段落右對齊:
word_6 = '申請人:' paragraph_4 = doc.add_paragraph()
paragraph_4.add_run(word_6)
paragraph_4.add_run(name).underline = True
paragraph_4.alignment = WD_PARAGRAPH_ALIGNMENT.RIGHT
word_7 = '日期:' sign_date = "{}年{}月{}日".format(date.split('-')[0],
date.split('-')[1], date.split('-')[2])
paragraph_5 = doc.add_paragraph()
paragraph_5.add_run(word_7)
paragraph_5.add_run(sign_date).underline = True
paragraph_5.alignment = WD_PARAGRAPH_ALIGNMENT.RIGHT
最后就是統(tǒng)一修改字體為楷體,中文字體修改比較麻煩,不像英文字體只需要指定如 run.font.name = 'Arial' 就可以,需要額外的幾行代碼。最后記得保存:
for paragraph in doc.paragraphs:
for run in paragraph.runs:
# 統(tǒng)一修改顏色 run.font.color.rgb = RGBColor(0, 0, 0)
run.font.name = '楷體' r = run._element.rPr.rFonts
r.set(qn('w:eastAsia'), '楷體')
doc.save(path + "{}-請假條.docx".format(name))
運行上述代碼即可針對每個人產(chǎn)生相應(yīng)的請假條:
至此,我們就成功利用Python實現(xiàn)了開頭的需求,解放雙手。注意本案例同樣適用于邀請函、證明等各類文書的制作,大家可以舉一反三。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03