Python解析xml大文件(sax)

使用到的包:xml.sax 文档

代码托管位置 github-pytools

需求

读取xml数据文件,文件较大,需要实时处理插入到数据库

xml文档

处理

sax处理时并不会像dom一样可以以类似节点的维度进行读取,它只有 开始标签 内容 结束标签 之分

处理思想是:通过一个handler,对开始标签,内容,结束标签各有一个处理函数

代码及注解

person 处理类

加上入库的完整代码

平时拿python来分析数据,工具脚本还有hadoop streamming,但是用的面和深度实在欠缺
只能说道行还浅,需要多多实践

The end!

打赏支持我写出更多好文章,谢谢!

打赏作者

打赏支持我写出更多好文章,谢谢!

任选一种支付方式

1 3 收藏 评论

关于作者:wklken

Pythonista/vimer 个人主页 · 我的文章 · 37 ·   

相关文章

可能感兴趣的话题



直接登录
跳到底部
返回顶部