Python如何实现加载数据

介绍

这篇文章将为大家详细讲解有关Python如何实现加载数据,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。

数据是数据科学家的基础,因此了解许多加载数据进行分析的方法至关重要。在这里,我们将介绍五种Python数据输入技术,并提供代码示例供您参考。

作为初学者,您可能只知道一种使用p呼吸。read_csv函数读取数据的方式(通常以CSV格式)。它是最成熟,功能最强大的功能之一,但其他方法很有帮助,有时肯定会派上用场。

我要讨论的方法是:

    <李>手动函数 <李> loadtxt函数 <李> genfromtxtf函数 <李> read_csv函数 <李>泡菜

我们将用于加载数据的数据集可以在此处找到。它被称为100 -销售记录。

进口我们将使用Numpy,熊猫和泡菜软件包,因此将其导入。

 Python如何实现加载数据

这是最困难的,因为您必须设计一个自定义函数,该函数可以为您加载数据。您必须处理Python的常规归档概念,并使用它来读取. CSV文件。

让我们在100个销售记录文件上执行此操作。

 Python如何实现加载数据

嗯,这是什么? ? ? ?似乎有点复杂的代码! ! !让我们逐步打破它,以便您了解正在发生的事情,并且可以应用类似的逻辑来读取自己的. CSV文件。

在这里,我创建了一个load_csv函数,该函数将要读取的文件的路径作为参数。

我有一个名为数据的列的表,它将具有我的CSV文件数据,而另一个列表坳将具有我的列名。现在,在手动检查了CSV之后,我知道列名在第一行中,因此在我的第一次迭代中,我必须将第一行的数据存储在山坳中,并将其余行存储在数据中。

为了检查第一次迭代,我使用了一个名为checkcol的布尔变量,它为假,并且在第一次迭代中为假时,它将第一行的数据存储在山坳中,然后将checkcol设置为真的,因此我们将处理数据列表并将其余值存储在数据列表中。

逻辑

这里的主要逻辑是,我使用readline () Python中的函数在文件中进行了迭代。此函数返回一个列的表,其中包含文件中的所有行。

当阅读标题时,它会将新行检测为\ n字符,即行终止字符,因此为了删除它,我使用了str.replace函数。

由于这是一个的。csv文件,所以我必须要根据不同的东西逗号,所以我会各执一个字符串,用字符串。分裂(“”)。对于第一次迭代,我将存储第一行,其中包含列名的列表称为上校然后,我会将所有数据附加到名为数据的列表中。

为了更漂亮地读取数据,我将其作为数据框格式返回,因为与numpy数组或python的列表相比,读取数据框更容易。

输出量

 python如何实现加载数据

 python如何实现加载数据

利弊

重要的好处是您具有文件结构的所有灵活性和控制权,并且可以以任何想要的格式和方式读取和存储它。

您也可以使用自己的逻辑读取不具有标准结构的文件。

它的重要缺点是,特别是对于标准类型的文件,编写起来很复杂,因为它们很容易读取。您必须对需要反复试验的逻辑进行硬编码。

仅当文件不是标准格式或想要灵活性并且以库无法提供的方式读取文件时,才应使用它。

这是python中著名的数字库numpy中的内置函数。加载数据是一个非常简单的功能。这对于读取相同数据类型的数据非常有用。

当数据更复杂时,使用此功能很难读取,但是当文件简单时,此功能确实非常强大。

要获取单一类型的数据,可以下载此处虚拟数据集。让我们跳到代码。

 python如何实现加载数据

这里,我们简单地使用了在传入的定界符中作为& # 39;,& # 39;的loadtxt函数,因为这是一个CSV文件。

现在,如果我们打印df,我们将看到可以使用的相当不错的numpy数组中的数据。

 python如何实现加载数据

 python如何实现加载数据

Python如何实现加载数据