python给列名称命名_【Python自学笔记】一次不太成功的利用Python整理的利润表实践...
前情提要:蓬佩奥不怕开水烫:XLOOKUP函数简单使用指南
之前这篇文章里面,是使用的word对报表进行处理,相对简单快捷;但是,数据量比较大比较复杂的情况下,用word处理起来会有点吃力。
因此,我钻研了一个下午,写了个python脚本,中间还遇到不少问题,不过还是写出来了,以后再处理类似的报表的时候,就不用再打开word了。
原始Excel有很多问题:股票代码不是标准的六位数字;万亿不分,没有单位;有多余的数据行。
这里使用Python 3 的Pandas库进行整理,主要使用pandas库基本操作。
#读取准备好的财务报表
import pandas as pd
import re
input_file = r"电子信息行业利润表.xlsx"
df = pd.read_excel(input_file)
df=df.drop(['序号','相关','公告日期'],axis=1) #删除不需要的列
然后用format补全六位代码,在这