利用Python实现报告自动生成
前几天,在网上看到一篇介绍利用Python组件实现MS word内容生成的文章。可能是很久没接触编码,感觉在技术领域变得有点孤陋寡闻了,看见一些实用的功能都觉的屌屌的。以前经常通过代码写Excel文件,写Word相对较少,即使有也是基于XML/HTML来实现的。所以,今天我是以一种非专业的态度来分享这个功能,各路Python高手且擅长此类技术的同学请自行忽略。
背景介绍这篇文章来自Chris Moffitt的《Populating MS Word Templates with Python》,文中提到了一个Python开源组件docx-mailmerge,组件的原理是依赖MS Word的mailmerge功能,基于模板式的内容填充,实现动态内容加载和生成。
在安装了docx-mailmerge包并亲自动手尝试后发现,这个包还存在一些缺陷,对于有数值型格式的数据支持不好。为了有一个比较好的演示效果,我将代码进行了简单修改并集成到了tushare里,所以以下的演示将通过tushare来实现。为了表示对作者的尊敬,有兴趣的同学可以直接参阅作者的github:Bouke/docx-mailmerge
方法步骤
1、新建模板
打开word(本演示环境是word2013),新建一个docx文件,按照一定的格式假设完成了一个报告。在需要动态加载文字或者数据的地方,可以预留基于word mailmerge功能的域。
2、选择域功能
在需要插入域的地方,点击word工具栏“插入”->"文档部件" -> "域"来设置。
3、设置域代码
在弹出的域值设置对话框里,在“域名”下拉框选择MergeField,在右边域属性输入一个域代码名称。
根据需要可设置各种文字域,也可以设置动态表格域。
我这里实现了一个简单的示例,展示当日沪深指数行情和当日涨幅前15位的股票列表数据。
代码实现因为已经将代码集成到了tushare,我们只需要导入tushare包即可(需升级到0.6.9版本)。
为了展示当日涨幅排名前15位的股票,我们通过tushare取到行情数据。
导入模板,可查看所有域属性。
根据数据生成内容:
对于沪深指数行情部分,为了演示数据格式,这里写成了固定形式便于理解,通过动态获取数据并传入域值内也是很简单的。
运行代码后,我们来看看效果:
关键函数
1、初始代码
document
= ts.MailMerge(template),将模板传入初始函数。
2、填充域数据
document.merge(dict_data),通过传入字典类型数据,实现域值填充。
3、生成多页数据报告
document.merge_pages(list_dict_data),传入数组字典,可生成多个数据页。
4、生成表格数据
document.merge_rows(field_name, list_dict_data),生成固定格式的表格数据。
总结
总的来看,这个工具还是很方便实用的,接口设计和使用都非常简单。可用于动态生成数据报告,类似于公司word版工资条的生成,每月看到公司HR同事发来的工资条,好几百人每个都不一样,如果手动实现的话,真心认为真的是辛苦他们了。如果有这么一个小工具,应该是非常方便的。当然,这里只是拿它举个例子,相信在如今高度发达的信息技术下,靠人肉来实现类似工作的情况应该越来越少见了。 返回搜狐,查看更多
责任编辑: