该用Python还是SQL ? 4个案例教你节省时间

在数据分析行业,对数据提出的每一个问题都可以用多种潜在的语言和工具包来回答。每种语言都有其优势,它们之间也存在着不同的区别。不能否认的是,有些操作用Python执行起来要比SQL更加高效。这篇文章分享了4个能够节省时间的案例,在这几个案例中,Python在探索和分析数据集方面远远优于SQL。

假设你正在探索新的数据集,可以使用许多不同的方法来统计描述这些数据,并得到总体感知。例如:

·,计数

·,平均值

·,标准偏差

·,最小值

·,第一四分位数

·,第二四分位数(中位数)

·,第三四分位数

·,最大值

要想在SQL中得到以上信息,你需要输入:


该用Python还是SQL ? 4个案例教你节省时间“> <br/> </p> <p>但也许你并不想输入以上所有代码。你可以使用熊猫的DataFrame.describe()函数来得出基础数据集的基本描述性统计信息。</p> <p>数据集[& # 39;Python输入# 39;].describe () .round (1) </p> <p>查看此报告并仿照该报告自行探索描述性统计。</p> <p> </p> <p>假设你现在想计算移动平均值,以便于在输入不断变化的情况下得到其明确的平均值。移动平均值有助于消除数据骤降和峰值的影响,从而使长期趋势更加显而易见的。</p> <p>在SQL中,你可以输入这样的查询(查询):</p> <p> <br/> </p> <p> <img src=该用Python还是SQL ? 4个案例教你节省时间