Python有许多吸引力,如效率,代码可读性和速度,使其成为数据科学爱好者的首选编程语言.Python通常是希望升级其应用程序功能的数据科学家和机器学习专家的首选。
由于其广泛的用途,Python拥有大量的库,使数据科学家可以更轻松地完成复杂的任务,而无需很多编写代码的麻烦。以下是数据科学的前3个Python库。
使用这些库将Python转化为一个科学的数据分析和建模工具。
<强> 1。NumPy 强>
NumPy (Numerical Python的缩写)是配备有用资源的顶级库之一,可帮助数据科学家将Python转变为强大的科学分析和建模工具。流行的开源库可以在BSD许可下使用。它是用于在科学计算中执行任务的基础Python库.NumPy是一个更大的基于Python的开源工具生态系统的一部分,称为SciPy。
他的库为Python提供了大量的数据结构,可以毫不费力地执行多维数组和矩阵计算。除了用于求解线性代数方程和其他数学计算外,NumPy还可用作不同类型通用数据的通用多维容器。
此外,它与其他编程语言(如C/c++和Fortran)完美集成.NumPy库的多功能性使其能够轻松快速地与各种数据库和工具结合使用。
<强> 2。熊猫强>
熊猫是另一个很棒的库,可以增强你的数据科学Python技能。与NumPy一样,它属于SciPy开源软件系列,可在BSD免费软件许可下使用。
熊猫提供多功能和强大的工具,用于整理数据结构和执行大量数据分析。该库适用于不完整,非结构化和无序的实际数据,并附带用于整形,聚合,分析和可视化数据集的工具。
此库中有三种类型的数据结构:
-
<李>系列:单维,均匀阵列李>
<李> DataFrame:具有异构类型列的二维李>
<李>面板:三维,大小可变阵列李>
例如,让我们看看熊猫Python库(缩写为pd)可用于执行一些描述性统计计算。
让我们从导入库开始。
<代码>进口熊猫pd
代码>
让我们创建一个系列词典。
d '名字':pd.Series 'Alfrick“迈克尔”温迪“保罗”科维奇“乔治”安德烈亚斯的 “艾琳”Sagar“西蒙”詹姆斯“玫瑰” “多年的经验”:pd.Series “程序设计语言”:pd.Series 'Python JavaScript“PHP“c++”Java“Scala”反应“Ruby”角Python“PHP JavaScript的 >之前让我们创建一个DataFrame。
<代码> df pd。DataFramed 代码>
下面是一个很好的输出表:
名编程语言多年的经验 Alfrick Python 迈克尔JavaScript 温迪PHP 保罗c++ 科维奇Java 乔治Scala 安德烈亚斯的反应 艾琳红宝石 Sagar角 西蒙PHP 詹姆斯Python 玫瑰JavaScript >之前下面是这个示例的全部代码:
进口熊猫pd #创建一个字典的系列 d '名字':pd.Series 'Alfrick“迈克尔”温迪“保罗”科维奇“乔治”安德烈亚斯的 “艾琳”Sagar“西蒙”詹姆斯“玫瑰” “多年的经验”:pd.Series “程序设计语言”:pd.Series 'Python JavaScript“PHP“c++”Java“Scala”反应“Ruby”角Python“PHP JavaScript的 #创建一个DataFrame df pd.DataFramed printdf >之前<强> 3。Matplotlib
强>Matplotlib也是SciPy核心软件包的一部分,并在BSD许可下提供。它是一个流行Python的科学库,用于生成简单而强大的可视化。你可以使用Python框架进行数据科学生成创意图形,图表,直方图以及其他形状和图形,而无需担心编写多行代码。
例如,让我们看看如何使用Matplotlib库创建一个简单的条形图。
让我们从导入库开始。
<代码> matplotlib进口pyplot plt 代码>
让我们为x轴和y轴生成值。
让我们调用绘制条形图的函数。
<代码> plt。xy,
代码>让我们展示一下情节。
<代码> plt。,
代码>这是条形图:
下面是这个示例的全部代码:
#进口Matplotlib Python库 matplotlib进口pyplot plt #进口matplotlib一样。pyplot作为plt #生成值轴 x #发电部、轴 y #调用函数来绘制条形图 plt.xy #显示情节 plt。3个用于数据科学的顶级Python库