登录       
  人生苦短,必用Python

Python自动化之如何格式化VerbTable.txt数据

Python KenZhang 39浏览 0评论

上一篇文章我们介绍了处理简单的txt文档,格式化数据为我们所用,但是有时客户给的数据不会这么简单,而是比较复杂的内容,这篇文章,我们来介绍下更复杂的txt文档,从里面提取我们需要的信息并格式化数据。


处理复杂的数据文档,流程也是一样的,只不过是在处理数据这一块更复杂一点。


我们先看下这一次我们要处理的VerbTable数据。


原始数据:


640 (1).png


然后我们想处理为如下的格式来使用,处理后的格式:


640 (2).png


我们还是分三个步骤来做


读取原始文件


这次我们使用read函数一次性读入全部内容,然后再去做处理。


具体用法如下:

def read_data_file(file_name):
    with open(file_name, "r") as fr: # file_name就是你要打开的文件名
        contents = fr.read() # 一次性全部读取文件内容
    return contents


处理数据格式


我们先来比较下原始数据格式与我们想要的数据格式。


我们只需要“;===== HDA Codec Subsystem ID Verb-table =====”之后的数据,所以我们用split来分割后取后面的数据.


要把“;”转换为“//”, “dd ”转化为“0x”, 把“h”转化为“,”, 所以,我们使用replace来替换。


代码如下:

def format_data(contents):
    verb_tables = contents.split(";===== HDA Codec Subsystem ID Verb-table =====")
    format_verb_datas = verb_table[1].replace(";", "//").replace("dd ", "0x").replace("h", ",")
    return format_verb_datas

写入新文件


写入文件没有什么大的区别,就是写入参数做一下变化,我们不需要追加的模式写入,直接一次性写入就行了,使用“w”参数,代码如下:

def write_to_file(output_file, format_contents):
    with open(output_file, "w") as fw:
        fw.write(format_contents)


运行主函数


主函数和上篇可以说没有任何改变,所以我们在实现函数式,尽量做到模块化,可以重复利用,代码如下:

import osimport sysimport datetime
if __name__ == "__main__":    file_name = sys.argv[1] # 得到用户输入的文件    output_time = datetime.datetime.now().strftime("%Y-%m-%d-%H%M%S") # 获取当时时间并格式化    output_name = os.path.basename(file_name).split(".")[0] # 获取用户输入文件名字    output_file = output_name + "_" + output_time + ".txt" # 输出文件名        before_datas = read_data_file(file_name)    format_datas = format_data(before_datas)    write_to_file(output_file, format_datas)        print("Finished, please check file-> " + output_file)


前两篇我们都是处理的txt文档数据,基本没什么难度,下一篇我们介绍下如何处理excel文档,从SPD的excel里面提取某一列的数据并格式化为我们需要的格式。


转载请注明: KenZhang » Python自动化之如何格式化VerbTable.txt数据

喜欢 (1) or 分享 ( 0)

联系我请直接在公众号留言~

扫码或搜索:极简小课

极简小课

微信公众号 扫一扫关注

想结交更多的朋友吗?

来PyDjango瞧瞧吧

PyDjango

QQ群号 88133982 立即加入

您的支持是博主写作最大的动力,如果您喜欢我的文章,感觉我的文章对您有帮助,请狠狠点击下面的