基于python的大数据分析大熊猫数据读取(代码实战) - 行业资讯

我们常见的数据存储格式无非就是csv, excel, txt以及数据库等形式。

在熊猫中可以使用一些函数完成数据的读取。比如read_csv, read_excel, read_table, read_sql等,这些分别是啥意思呢....自己看后缀就能明白啦~

下面我们就通过撸代码来了解它们

格式:read_table(文件路径与文件名,名字=[列名1,列第2名,.....),9=" ",…)

其中名称为列名,默认为文件中的第一行作为列名

9月为分隔符,默认为空

从熊猫read_table进口　　　　#三种　　df=read_table (r会:python_workspaceanacondarz.txt”) 　　#查看前五行数据　　df.head (5) 　　#查看后两行数据　　# df.tail (2)

rz。txt的内容如下

基于python的大数据分析大熊猫数据读取(代码实战)

格式:read_csv(文件路径与文件名,名字=[列名1,列第2名,.....),9=" ",…)

解释同上,不在废话

# csv 　　从熊猫进口read_csv 　　　　df=read_csv (r会:python_workspaceanacondarz.csv”) 　　df

rz。csv的内容如下

基于python的大数据分析大熊猫数据读取(代码实战)

格式:read_excel(文件路径与文件名,sheetname=表的名称,头=0)

sheetname可以指定读取几个表,表数目从0开始。如果sheetname=(0, 2)则代表读取第一个和第三个表

0头为表示以文件第一行作为表头显示;为1则把文件第一行丢弃不作为表头显示。

#埃克塞尔　　从熊猫进口read_excel 　　　　df=read_excel (r会:python_workspaceanacondarz。xls, sheetname=' Sheet3”) 　　df

首先安装pymysql,通过pip命令即可安装

格式:read_sql(要查询的sql语句,数据库的链接对象)

熊猫作为pd导入　　进口pymysql 　　　　#具体的数据库链接信息自行替换　　康涅狄格州=pymysql.connect(主机=皒xxx”=皒xx”数据库,用户=? 　　密码=",端口=3306,charset=use utf8) 　　sql=' select *的' 　　康涅狄格州r=pd.read_sql (sql) 　　#关闭数据库链接　　conn.close () 　　打印(r.head (5)