介绍
小编给大家分享一下python数据处理之怎样选取csv文件中某几行的数据,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获、下面让我们一起去了解一下吧!
<强>前言强>
有些人看到这个问题觉得不是问题,是嘛,不就是df。坳[]函数嘛,其实忽略了一个重点,那就是我们要省去把csv文件全部读取这个过程,因为如果在面临亿万级别的大规模数据,得到的结果就是繁荣,繁荣,繁荣。
我们要使用一下现成的函数里面的参数nrows,和skiprows,一个代表你要读几行,一个代表你从哪开始读,这就可以了,比如从第3行读取4个
<强>示例代码强>
import pandas as pd df =, pd.DataFrame({& # 39;一个# 39;:[1,2,3,4,5,6,7,8,9),& # 39;b # 39;:[22日,33岁,44岁,55岁,66年,77年,88年,99年,10]}) df.to_csv (& # 39; test.csv& # 39;) 时间=dt pd.read_csv (& # 39; test.csv& # 39;, skiprows=5, nrows=3) , 打印(dt) , , : ,4,5,66 0,5,6,77 1,6,7,88 2,7,8,99 3,8,9,10
就可以了,不过这个列头不知道是怎么回事,顺便如果想根据列值找指数,可以参考下面的
然后
df =, pd.DataFrame ({& # 39; BoolCol& # 39;:, (1,, 2,, 3,, 3,, 4], & # 39; attr # 39;:,[22日,33岁,22日,44岁,66]}, 指数才能=(10、20、30、40、50)) 打印(df) 时间=a df ((df.BoolCol==3), (df.attr==22)] .index.tolist () print () , , 时间=df pd.DataFrame ({& # 39; BoolCol& # 39;:, (1,, 2,, 3,, 3,, 4], & # 39; attr # 39;:,[22日,33岁,22日,44岁,66]}, 指数才能=(10、20、30、40、50)) 打印(df) 时间=a df ((df.BoolCol==3), (df.attr==22)] .index.tolist () print ()
问题得到了解决
以上是“python数据处理之怎样选取csv文件中某几行的数据”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注行业资讯频道!