最近在倒腾一个txt文件,因为文件太大,所以给切割成了好几个小的文件,只有第一个文件有标题,从第二个开始就没有标题了。
我的需求是取出指定的列的数据,踩了些坑给研究出来了。
熊猫作为pd导入 #我们的需求是取出所有的姓名 # test1的内容 “‘ 身份证的名字分数 1张100年三 2李四99 3王五98 “‘ test1=pd.read_table (test1.txt) #这个是带有标题的文件 名称=test1(“名字”)#根据标题来取的值 打印(名字) “‘ 张三 李四 王五 “‘ # test2的内容 “‘ 艾伦100 鲍勃99 糖98 “‘ test2=pd.read_table (“test2。txt”,标题=None) #这个是没有标题的文件 名称=test2[1] #根据指数来取的值 打印(名字) “‘ 艾伦 鲍勃 糖果 “‘ >之前
<>强语法:pandas.read_table() 强>
参数:
filepath_or_buffer文件路径或者输入对象
9月分隔符,默认为制表符
名字读取哪些列以及读取列的顺序,默认按顺序读取所有列
引擎文件路径包含中文的时候,需要设置引擎=皃ython”
编码文件编码,默认使用计算机操作系统的文字编码
na_values指定空值,例如可指定空,空,NA,没有等为空值<强>常见错误:设置不全强>
进口熊猫 data=https://www.yisu.com/zixun/pandas.read_table (' D/蟒蛇/数据分析/文本. txt”, 引擎=皃ython”) 打印(数据)输出结果:
补全代码:
进口熊猫 data=https://www.yisu.com/zixun/pandas.read_table (' D/anadondas/数据分析/文本. txt”, 9月=',' #指定分隔符”、“,默认为制表符 名称=(“名字”,“年龄”),#设置列名,默认将第一行数据作为列名 引擎=皃ython”, 编码=' use utf8 ' #指定编码格式) 打印(数据)输出结果:
以上这篇如何使用熊猫读取txt文件中指定的列(有无标题)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。
如何使用熊猫读取txt文件中指定的列(有无标题)