介绍
这篇文章主要介绍使用python的statsmodels模块拟合ARIMA模型,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!
导入必要包和模块
得到scipy import statsimport pandas as pdimport matplotlib.pyplot as pltimport statsmodels.api as smfrom statsmodels.tsa.arima.model import ARIMAfrom statsmodels.graphics.tsaplots import plot_predict plt.rcParams [& # 39; font.sans-serif& # 39;]=[& # 39; simhei& # 39;] #用于正常显示中文标签plt.rcParams [& # 39; axes.unicode_minus& # 39;]=False #用于正常显示负号
<强> 1。读取数据并画图强>
data=https://www.yisu.com/zixun/pd.read_csv(“数据/客运量. csv”, index_col=0) data.index=pd.Index (sm.tsa.datetools。dates_from_range(' 1949 ', ' 2008 ')) #将时间列改为专门时间格式、方便后期操作data.plot (figsize=(12日8),标志=皁”,颜色=黑色,ylabel=翱驮肆俊?#画图
#本文所使用的客流量时间序列数据:https://download.csdn.net/download/weixin_45590329/14143811
#时间序列折线图如下所示,显然数据有递增趋势,初步判断数据不平稳
<强> 2。平稳性检验强>
sm.tsa.adfuller(数据,回归=& # 39;c # 39;) sm.tsa.adfuller(数据,回归=& # 39;数控# 39;)sm.tsa.adfuller(数据,回归=& # 39;ct # 39;)
进行三种形式的ADF单位根检验,如部分结果所示,发现序列不平稳
<强> 3。对数据作一阶差分处理强>
diff=data.diff (1) diff.dropna(原地=True) diff.plot (figsize=(12日8),标志=& # 39;o # 39;,颜色=& # 39;黑色# 39;)#画图
作出数据一阶差分后折线图,初步判断平稳
<强> 4。对一阶差分数据进行平稳性检验强>
sm.tsa.adfuller (diff,回归=& # 39;c # 39;) sm.tsa.adfuller (diff,回归=& # 39;数控# 39;)sm.tsa.adfuller (diff,回归=& # 39;ct # 39;)
如图所示,说明序列平稳
<强> 5。确定ARIMA (p d q)阶数强>
fig =, plt.figure (figsize=(12日8))ax1 =, fig.add_subplot (211) fig =, sm.graphics.tsa.plot_acf (diff.values.squeeze(),,=12日落后,ax=ax?) #自相关系数图1阶截尾,决定马(1)ax2 =, fig.add_subplot (212) fig =, sm.graphics.tsa.plot_pacf (diff,滞后=12,ax=ax2) #偏相关系数图1阶截尾,决定AR (1)
根据自相关系数图ACF和偏自相关系数图PACF,将原始数据确定为ARIMA(1 1 1)模型
<强> 6。参数估计强>
model =, ARIMA(数据,,订单=(1,1,1)).fit() #拟合模型model.summary() #统计信息汇总#系数检验params=model.params #系数tvalues=model.tvalues #系数t值疯牛?model.bse #系数标准误pvalues=model.pvalues #系数p值#绘制残差序列折线图渣油=model.resid #残差序列fig =, plt.figure (figsize=(12日8))ax =, fig.add_subplot (111) ax =, model.resid.plot (ax=ax) #计算模型拟合值符合=model.predict (exog=数据[[& # 39;TLHYL& # 39;]])
<强> 7。模型检验强>
# 8.1。检验序列自相关sm.stats.durbin_watson (model.resid.values) # DW检验:靠近2——正常;靠近0,正自相关;靠近4——负自相关# 8.2.AIC和BIC准则model.aic #模型的AIC值model.bic #模型的BIC值# 8.3。残差序列正态性检验stats.normaltest(渣油)#检验序列残差是否为正态分布#最终检验结果显示无法拒绝原假设,说明残差序列为正态分布,模型拟合良好# 8.4。绘制残差序列自相关图和偏自相关图fig =, plt.figure (figsize=(12日8))ax1 =, fig.add_subplot (211) fig =, sm.graphics.tsa.plot_acf (resid.values.squeeze(),,=12日落后,ax=ax?) ax2 =, fig.add_subplot (212) fig =, sm.graphics.tsa.plot_pacf(=12,渣油,滞后,ax=ax2) #如果两图都零阶截尾,这说明模型拟合良好
<强> 8。预测强>
#预测至2016年的数据,由于ARIMA模型有两个参数,至少需要包含两个初始数据,因此从2006年开始预测predict =, model.predict(& # 39; 2006 & # 39;, & # 39; 2016 & # 39;,,动态=True)打印(预测)#画预测图及置信区间图无花果、,ax =, plt.subplots (figsize=(10、8)) fig =, plot_predict(模型,开始=& # 39;2002 & # 39;,,结束=& # 39;2006 & # 39;,,ax=ax) legend =, ax.legend (loc=& # 39; upper 左# 39;)
以上是“使用python的statsmodels模块拟合ARIMA模型”这篇文章的所有内容,感谢各位的阅读!希望分享的内容对大家有帮助,更多相关知识,欢迎关注行业资讯频道!