小编给大家分享一下关于Python数据分析的小技巧,相信大部分人都还不怎么了解,因此分享这边文章给大家学习,希望大家阅读完这篇文章后大所收获、下面让我们一起去学习方法吧!
一些小提示和小技巧可能是非常有用的,特别是在编程领域。有时候使用一点点黑客技术,既可以节省时间,还可能挽救“生命”。
一个小小的快捷方式或附加组件有时真是天赐之物,并且可以成为真正的生产力助推器。所以,这里有一些小提示和小技巧,有些可能是新的,但我相信在下一个数据分析项目中会让你非常方便。
<强>熊猫中数据框数据的分析过程强>
分析(分析器)是一个帮助我们理解数据的过程,而熊猫分析是一个Python包,它可以简单快速地对大熊猫的数据框数据进行探索性数据分析。
熊猫中df.describe()和df.info()函数可以实现EDA过程第一步。但是,它们只提供了对数据非常基本的概述,对于大型数据集没有太大帮助。而熊猫中的剖析功能简单通过一行代码就能显示大量信息,且在交互式HTML报告中也是如此。
对于给定的数据集,熊猫中的分析包计算了以下统计信息:
由熊猫分析包计算出的统计信息包括直方图,众数,相关系数,分位数,描述统计量,其他信息——类型,单一变量值,缺失值等。
用脉冲安装或者用conda安装
pip install pandas-profiling conda install -c 蟒蛇 pandas-profiling
下面代码是用很久以前的泰坦尼克数据集来演示多功能Python分析器的结果。
# importing 从而necessary packages import pandas  as pd import pandas_profiling 时间=df pd.read_csv(& # 39;《泰坦尼克号》/train.csv& # 39;), pandas_profiling.ProfileReport (df)
一行代码就能实现在Jupyter笔记本中显示完整的数据分析报告,该报告非常详细,且包含了必要的图表信息。
还可以使用以下代码将报告导出到交互式HTML文件中。
profile =, pandas_profiling.ProfileReport (df) profile.to_file (outputfile=癟itanic data  profiling.html")
<强>熊猫实现交互式作图强>
熊猫有一个内置的.plot()函数作为DataFrame类的一部分。但是,使用此功能呈现的可视化不是交互式的,这使得它没那么吸引人。同样,使用pandas.DataFrame。图()函数绘制图表也不能实现交互。如果我们需要在不对代码进行重大修改的情况下用熊猫绘制交互式图表怎么办呢?这个时候就可以用袖扣库来实现。
袖扣库可以将有强大功能的情节和拥有灵活性的熊猫结合在一起,非常便于绘图。下面就来看在熊猫中如何安装和使用袖扣库。
pip install 情节 #,Plotly is  a pre-requisite before installing 袖扣 pip install 袖扣
# importing Pandas , import pandas  as pd # importing plotly 以及cufflinks 拷贝offline mode import cufflinks  as cfimport  plotly.offline cf.go_offline (), cf.set_config_file(离线=False, world_readable=True)
是时候展示泰坦尼克号数据集的魔力了。
df.iplot ()
df.iplot (), vs df.plot ()
右侧的可视化显示了静态图表,而左侧图表是交互式的,更详细,并且所有这些在语法上都没有任何重大更改。
<强>魔法命令强>
魔法命令是Jupyter笔记本中的一组便捷功能,旨在解决标准数据分析中的一些常见问题。使用命令% lsmagic可以看到所有的可用命令。