python读取txt、json和hdf5文件的实例 - 行业资讯 - 肥雀云

最简单的开函数:

　　　　　　# - * -编码:utf - 8 - * 　　打开(“用法”,“r”,编码=癵bk”,错误=昂雎浴?f: 　　print (f.read ()) 　　　　

这里用开函数读取了一个txt文件,“编码”表明了读取格式是“gbk”,还可以忽略错误编码。

另外,使与语用句操作文件IO是个好习惯,省去了每次打开都要关闭()。

简单的test.json文件如下:

　　　　　　{ 　　“术语表”:{ 　　“标题”:“术语表”, 　　" GlossDiv ": { 　　“标题”:“S”, 　　" GlossList ": { 　　" GlossEntry ": { 　　“ID”:“SGML”, 　　“近似”:“SGML”, 　　“GlossTerm”:“标准通用标记语言”, 　　“缩写”:“SGML”, 　　Abbrev”:“ISO 8879:1986”, 　　" GlossDef ": { 　　“帕拉”:“元标记语言,用于创建标记语言比如DocBook。”, 　　“GlossSeeAlso”: (“GML”、“XML”) 　　}，　　“GlossSee”:“标记” 　　} 　　} 　　} 　　} 　　} 　　　　

这里需要用python的json模块处理解析:

　　　　　　进口json 　　data=https://www.yisu.com/zixun/json.load(打开(example.json)) 　　print(类型(数据)) 　　打印(数据) 　　　　

<>强打印如下:

　　　　　　& lt;类dict的祝辞　　{“术语表”:{“标题”:“示例术语表”,“GlossDiv”:{“标题”:“年代”,“GlossList”: {“GlossEntry”: {“ID”:“SGML”,“近似”:“SGML”,“GlossTerm”:“标准通用标记语言”,“缩写”:“SGML”,“Abbrev”:“ISO 8879:1986”、“GlossDef”: {“para”:“元标记语言,用于创建标记语言,比如DocBook。”、“GlossSeeAlso”: (“GML”、“XML”)},“GlossSee‘:’标记的}}}}} 　　　　

可见json.load()函数返回值是dict, json数据现在就成了一个网状的Python字典。

接下来我们就可以用标准的键检索来进行解读,比如:

　　　　　　打印(数据[“术语表”][' GlossDiv '] [' GlossList ']) 　　　　

<>强打印结果如下:

　　　　　　{“GlossEntry”: {“ID”:“SGML”,“近似”:“SGML”,“GlossTerm”:“标准通用标记语言”,“缩写”:“SGML”,“Abbrev”:“ISO 8879:1986”、“GlossDef”: {“para”:“元标记语言,用于创建标记语言,比如DocBook。”、“GlossSeeAlso”: (“GML”、“XML”)},“GlossSee‘:’标记的}} 　　　　

HDF5是一种层次化的格式(层次化格式),经常用于存储复杂的科学数据,例如MATLAB就是用这个格式来存储数据。在存储带有关联的元数据(元数据)的复杂层次化数据的时候,这个格式非常有用,例如计算机模拟实验的运算结果等等。

<强>与HDF5相关的主要概念有以下几个:

文件文件:层次化数据的容器,相当于树根(“根”树)

组群:树的一个节点(节点树)

数据集数据集:数值数据的数组,可以非常非常大

属性属性:提供额外信息的小块的元数据

　　　　　　# - * -编码:utf - 8 - * 　　#创建hdf5文件　　进口日期时间　　进口操作系统　　进口h6py 　　进口numpy np 　　imgData=https://www.yisu.com/zixun/np.zeros ((3128256)) 　　如果不是os.path.exists (“test.hdf5”): 　　h6py.File (test.hdf5) f: 　　f(“数据”)=imgData #将数据写入文件的主键数据下面　　f['标签']=范围(100) 　　之前　　　　

<>强创建完成之后读取:

　　　　　　进口日期时间　　进口操作系统　　进口h6py 　　进口numpy np 　　h6py.File (test.hdf5) f: 　　打印(f) 　　打印(f.keys) 　　之前　　　　

除了上述方法,熊猫还提供一个直接读取代替文件的函数:

　　　　　　pd.HDFStore 　　进口日期时间　　进口操作系统　　进口h6py 　　进口numpy np 　　熊猫作为pd导入　　data=https://www.yisu.com/zixun/pd.HDFStore (“dataset_log.h6”) 　　print(类型(数据)) 　　之前　　　　

<>强打印结果为:

　　　　　　& lt;类“pandas.io.pytables.HDFStore”比; 　　剩余关闭打开的文件:dataset_log.h6… 　　之前　　　　

以上这篇python读取txt, json和hdf5文件的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。