基于python的大数据分析大熊猫数据读取(代码实战)

  

我们常见的数据存储格式无非就是csv, excel, txt以及数据库等形式。


在熊猫中可以使用一些函数完成数据的读取。比如read_csv, read_excel, read_table, read_sql等,这些分别是啥意思呢....自己看后缀就能明白啦~


下面我们就通过撸代码来了解它们


格式:read_table(文件路径与文件名,名字=[列名1,列第2名,.....),9=" ",…)

其中名称为列名,默认为文件中的第一行作为列名

9月为分隔符,默认为空

从熊猫read_table进口      #三种   df=read_table (r会:python_workspaceanacondarz.txt”)   #查看前五行数据   df.head (5)   #查看后两行数据   # df.tail (2)

rz。txt的内容如下

基于python的大数据分析大熊猫数据读取(代码实战)


格式:read_csv(文件路径与文件名,名字=[列名1,列第2名,.....),9=" ",…)

解释同上,不在废话

# csv   从熊猫进口read_csv      df=read_csv (r会:python_workspaceanacondarz.csv”)   df

rz。csv的内容如下

基于python的大数据分析大熊猫数据读取(代码实战)


格式:read_excel(文件路径与文件名,sheetname=表的名称,头=0)

sheetname可以指定读取几个表,表数目从0开始。如果sheetname=(0, 2)则代表读取第一个和第三个表

0头为表示以文件第一行作为表头显示;为1则把文件第一行丢弃不作为表头显示。

#埃克塞尔   从熊猫进口read_excel      df=read_excel (r会:python_workspaceanacondarz。xls, sheetname=' Sheet3”)   df

首先安装pymysql,通过pip命令即可安装

格式:read_sql(要查询的sql语句,数据库的链接对象)

熊猫作为pd导入   进口pymysql      #具体的数据库链接信息自行替换   康涅狄格州=pymysql.connect(主机=皒xxx”=皒xx”数据库,用户=?   密码=",端口=3306,charset=use utf8)   sql=' select *的'   康涅狄格州r=pd.read_sql (sql)   #关闭数据库链接   conn.close ()   打印(r.head (5)


基于python的大数据分析大熊猫数据读取(代码实战)