器→工具, 工具软件, 开源项目, 编程语言

Python Word处理文档:python-docx

钱魏Way · · 518 次浏览

python-docx 是用于创建可修改微软 Word(.docx) 的一个 Python 库。个人觉得平时使用的场景不多,最近在学习自动化办公看到的内容,仅做一些简单的梳理。

python-docx的文档拆解

python-docx将整个文档看做是一个Document对象,其基本结构如下:

  • 每个Document包含许多个代表“段落”的Paragraph对象,存放在paragraphs中。
  • 每个Paragraph都有许多个代表”行内元素”的Run对象,存放在runs中。

在python-docx中,run是最基本的单位,每个run对象内的文本样式都是一致的,也就是说,在从docx文件生成文档对象时,python-docx会根据样式的变化来将文本切分为一个个的Run对象。

python-docx将文章中所有的表格都存放在document.tables中,每个Table都有对应的行table. rows、列table. columns和单元格(table. cell()),单元格是最基本的单位,每个单元格又被划分成不同的Paragraph对象,具体内容同上。

python-docx的基本操作

from docx import Document
from docx.enum.text import WD_BREAK
from docx.shared import Cm
from docx.oxml.ns import qn

document = Document('测试文档.docx')
for p in document.paragraphs:
    print(p.text)

document.add_paragraph('这是新的段落内容')

# 添加标题
# 默认情况下添加的标题是最高一级的,即一级标题,通过参数 level 设定,范围是 1 ~ 9
document.add_heading('我是一级标题')
document.add_heading('我是二级标题', level=2)

# 添加换页
# 如果一个段落不满一页,需要分页时,可以插入一个分页符,直接调用会将分页符插入到最后一个段落之后:
document.add_page_break()
paragraph = document.add_paragraph("独占一页")  # 添加一个段落
paragraph.runs[-1].add_break(WD_BREAK.PAGE)  # 在段落的最后一个节段后添加分页

# 表格操作
table = document.add_table(rows=2, cols=2)
cell = table.cell(0, 1)  # 获取第一行第二列单元格
cell.text = '我是单元格文字'  # 设置单元格文本
row = table.rows[1]  # 表格的行
row.cells[0].text = 'Foo bar to you.'
row.cells[1].text = 'And a hearty foo bar to you too sir!'
row = table.add_row()  # 增加行

# 添加表格(复杂)
items = ((7, '1024', '手机'), (3, '2042', '笔记本'), (1, '1288', '台式机'),)
table = document.add_table(1, 3)
heading_cells = table.rows[0].cells
heading_cells[0].text = '数量'
heading_cells[1].text = '编码'
heading_cells[2].text = '描述'
for item in items:
    cells = table.add_row().cells
    cells[0].text = str(item[0])
    cells[1].text = item[1]
    cells[2].text = item[2]

# 添加图片
document.add_picture('docx.png', width=Cm(10))

# 样式
# 样式可以针对整体文档(document)、段落(paragraph)、节段(run),越具体,样式优先级越高

# 段落样式
# 段落样式包括:对齐、列表样式、行间距、缩进、背景色等,可以在添加段落时设定,也可以在添加之后设置:
document.add_paragraph('Header', style='Header')


# 文字样式
# 设置加粗/斜体
paragraph = document.add_paragraph('添加一个段落')
run = paragraph.add_run('添加一个节段')
run.bold = True
run = paragraph.add_run('我是斜体的')
run.italic = True

# 设置字体
paragraph = document.add_paragraph('我的字体是 宋体')
run = paragraph.runs[0]
run.font.name = '宋体'
run._element.rPr.rFonts.set(qn('w:eastAsia'), '微软雅黑')  # 设置完这个才生效

参考链接:

Windows Node.js+Yarn的安装与配置
开源文档生成工具Sphinx
Flask学习之Werkzeug

发表回复 取消回复

您的电子邮箱地址不会被公开。 必填项已用*标注

© 标点符. All rights reserved.
苏ICP备08120382号

深圳SEO优化公司泰州网站设计报价遂宁百度竞价包年推广公司黔东南网站推广方案哪家好黔东南百度标王哪家好三明SEO按效果付费报价张掖百度竞价公司巢湖设计公司网站公司海口网站设计模板推荐辽阳seo优化报价黄南关键词按天扣费报价上饶模板推广报价松原百姓网标王推广公司许昌模板制作巢湖模板网站建设价格南通关键词按天收费报价白银SEO按天扣费多少钱凉山关键词按天扣费报价永湖SEO按天收费黄石网站设计罗湖网站定制哪家好秦皇岛关键词按天收费推荐湘西英文网站建设推荐成都阿里店铺运营公司乐山网络营销公司石家庄网站优化推荐三亚seo排名推荐长葛网络营销公司亳州百度网站优化排名报价海西建站价格蚌埠网络推广公司歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

深圳SEO优化公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化