我们常见的数据存储格式无非就是csv, excel, txt以及数据库等形式。
在熊猫中可以使用一些函数完成数据的读取。比如read_csv, read_excel, read_table, read_sql等,这些分别是啥意思呢....自己看后缀就能明白啦~
下面我们就通过撸代码来了解它们
格式:read_table(文件路径与文件名,名字=[列名1,列第2名,.....),9=" ",…)
其中名称为列名,默认为文件中的第一行作为列名
9月为分隔符,默认为空
从熊猫read_table进口 #三种 df=read_table (r会:python_workspaceanacondarz.txt”) #查看前五行数据 df.head (5) #查看后两行数据 # df.tail (2)
rz。txt的内容如下
格式:read_csv(文件路径与文件名,名字=[列名1,列第2名,.....),9=" ",…)
解释同上,不在废话
# csv 从熊猫进口read_csv df=read_csv (r会:python_workspaceanacondarz.csv”) df
rz。csv的内容如下
格式:read_excel(文件路径与文件名,sheetname=表的名称,头=0)
sheetname可以指定读取几个表,表数目从0开始。如果sheetname=(0, 2)则代表读取第一个和第三个表
0头为表示以文件第一行作为表头显示;为1则把文件第一行丢弃不作为表头显示。
#埃克塞尔 从熊猫进口read_excel df=read_excel (r会:python_workspaceanacondarz。xls, sheetname=' Sheet3”) df
首先安装pymysql,通过pip命令即可安装
格式:read_sql(要查询的sql语句,数据库的链接对象)
熊猫作为pd导入 进口pymysql #具体的数据库链接信息自行替换 康涅狄格州=pymysql.connect(主机=皒xxx”=皒xx”数据库,用户=? 密码=",端口=3306,charset=use utf8) sql=' select *的' 康涅狄格州r=pd.read_sql (sql) #关闭数据库链接 conn.close () 打印(r.head (5)