python读取txt、json和hdf5文件的实例

  

  

最简单的开函数:

        # - * -编码:utf - 8 - *   打开(“用法”,“r”,编码=癵bk”,错误=昂雎浴?f:   print (f.read ())      

这里用开函数读取了一个txt文件,“编码”表明了读取格式是“gbk”,还可以忽略错误编码。

  

另外,使与语用句操作文件IO是个好习惯,省去了每次打开都要关闭()。

  

  

简单的test.json文件如下:

        {   “术语表”:{   “标题”:“术语表”,   " GlossDiv ": {   “标题”:“S”,   " GlossList ": {   " GlossEntry ": {   “ID”:“SGML”,   “近似”:“SGML”,   “GlossTerm”:“标准通用标记语言”,   “缩写”:“SGML”,   Abbrev”:“ISO 8879:1986”,   " GlossDef ": {   “帕拉”:“元标记语言,用于创建标记语言比如DocBook。”,   “GlossSeeAlso”: (“GML”、“XML”)   },   “GlossSee”:“标记”   }   }   }   }   }      

这里需要用python的json模块处理解析:

        进口json   data=https://www.yisu.com/zixun/json.load(打开(example.json))   print(类型(数据))   打印(数据)      

<>强打印如下:

        & lt;类dict的祝辞   {“术语表”:{“标题”:“示例术语表”,“GlossDiv”:{“标题”:“年代”,“GlossList”: {“GlossEntry”: {“ID”:“SGML”,“近似”:“SGML”,“GlossTerm”:“标准通用标记语言”,“缩写”:“SGML”,“Abbrev”:“ISO 8879:1986”、“GlossDef”: {“para”:“元标记语言,用于创建标记语言,比如DocBook。”、“GlossSeeAlso”: (“GML”、“XML”)},“GlossSee‘:’标记的}}}}}      

可见json.load()函数返回值是dict, json数据现在就成了一个网状的Python字典。

  

接下来我们就可以用标准的键检索来进行解读,比如:

        打印(数据[“术语表”][' GlossDiv '] [' GlossList '])      

<>强打印结果如下:

        {“GlossEntry”: {“ID”:“SGML”,“近似”:“SGML”,“GlossTerm”:“标准通用标记语言”,“缩写”:“SGML”,“Abbrev”:“ISO 8879:1986”、“GlossDef”: {“para”:“元标记语言,用于创建标记语言,比如DocBook。”、“GlossSeeAlso”: (“GML”、“XML”)},“GlossSee‘:’标记的}}      

  

HDF5是一种层次化的格式(层次化格式),经常用于存储复杂的科学数据,例如MATLAB就是用这个格式来存储数据。在存储带有关联的元数据(元数据)的复杂层次化数据的时候,这个格式非常有用,例如计算机模拟实验的运算结果等等。

  

<强>与HDF5相关的主要概念有以下几个:

  

文件文件:层次化数据的容器,相当于树根(“根”树)

  

组群:树的一个节点(节点树)

  

数据集数据集:数值数据的数组,可以非常非常大

  

属性属性:提供额外信息的小块的元数据

        # - * -编码:utf - 8 - *   #创建hdf5文件   进口日期时间   进口操作系统   进口h6py   进口numpy np   imgData=https://www.yisu.com/zixun/np.zeros ((3128256))   如果不是os.path.exists (“test.hdf5”):   h6py.File (test.hdf5) f:   f(“数据”)=imgData #将数据写入文件的主键数据下面   f['标签']=范围(100)   之前      

<>强创建完成之后读取:

        进口日期时间   进口操作系统   进口h6py   进口numpy np   h6py.File (test.hdf5) f:   打印(f)   打印(f.keys)   之前      

除了上述方法,熊猫还提供一个直接读取代替文件的函数:

        pd.HDFStore   进口日期时间   进口操作系统   进口h6py   进口numpy np   熊猫作为pd导入   data=https://www.yisu.com/zixun/pd.HDFStore (“dataset_log.h6”)   print(类型(数据))   之前      

<>强打印结果为:

        & lt;类“pandas.io.pytables.HDFStore”比;   剩余关闭打开的文件:dataset_log.h6…   之前      

以上这篇python读取txt, json和hdf5文件的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。

python读取txt、json和hdf5文件的实例