Python通用数据格式转换工具


已独立成项目在github上面 dataformat


涉及模块 os, getopt, sys

需求

在进行hadoop测试时,需要造大量数据,例如某个表存在56列,但实际程序逻辑只适用到某几列,我们造的数据 也只需要某几列

构造几列数据,转化为对应数据表格式

源代码

使用说明

功能:可指定输入分隔,输出分隔,无配置字段填充,某列默认值,可按顺序填充,也可乱序映射填充

输入:输入文件路径

选项:

列填充的配置示例:

普通用法【最常用】

命令:

说明:

列默认值用法:【需要对某些列填充相同的值,但不想在源文件中维护】

命令:

说明:

列乱序映射:

命令:

说明:

代码托管位置 链接

打赏支持我写出更多好文章,谢谢!

打赏作者

打赏支持我写出更多好文章,谢谢!

任选一种支付方式

1 收藏 评论

关于作者:wklken

Pythonista/vimer 个人主页 · 我的文章 · 37 ·   

可能感兴趣的话题



直接登录
跳到底部
返回顶部