news 2026/4/18 7:10:54

基于自回归整合滑动平均模型(ARIMA)的时间序列预测

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
基于自回归整合滑动平均模型(ARIMA)的时间序列预测

基于自回归整合滑动平均模型(ARIMA)的时间序列预测

最近在折腾时间序列预测的项目,发现ARIMA这玩意儿虽然老派但确实能打。今天咱们就抛开教科书上的复杂公式,用实际代码和通俗解释聊聊怎么用它做预测。先扔个结论:ARIMA的核心就是三句话——看历史数据、算差异、纠误差。

先搞个模拟数据试试水。假设我们有个每周销售额的波动数据:

import numpy as np import pandas as pd np.random.seed(42) base = np.linspace(0, 20, 100) trend = 0.5 * np.arange(100) seasonality = 5 * np.sin(2 * np.pi * np.arange(100)/7) noise = np.random.normal(0, 1, 100) ts_data = pd.Series(base + trend + seasonality + noise, index=pd.date_range('2020-01-01', periods=100, freq='D'))

这时候直接上ARIMA肯定翻车,得先看数据是否平稳。划重点:ADF检验才是亲爹:

from statsmodels.tsa.stattools import adfuller result = adfuller(ts_data) print(f'ADF统计量: {result[0]:.3f}') print(f'p值: {result[1]:.3f}') # 输出大概率大于0.05,说明不平稳

如果p值大于0.05,直接进入差分环节。这里有个骚操作——动态差分直到平稳:

diff_count = 0 current_data = ts_data.copy() while True: result = adfuller(current_data.dropna()) if result[1] < 0.05: break current_data = current_data.diff().dropna() diff_count += 1 print(f'需要差分次数: {diff_count}') # 通常1-2次就能搞定

接下来要确定AR和MA的阶数。别被ACF/PACF图搞懵,实战中直接让auto_arima干活更省事:

from pmdarima import auto_arima model = auto_arima(ts_data, seasonal=False, trace=True) # 输出里找AIC最小的组合,比如(2,1,1)

拿到最佳参数后正式建模:

from statsmodels.tsa.arima.model import ARIMA model = ARIMA(ts_data, order=(2,1,1)) results = model.fit() # 重点看系数P值是否小于0.05,否则考虑删减参数 print(results.summary())

预测阶段注意要包含历史数据的类型:

forecast = results.get_forecast(steps=7) # 别直接用predict,要带置信区间 print(forecast.predicted_mean)

踩过几个坑特别提醒:

  1. 遇到周期性数据记得用SARIMA(比如销售数据周循环)
  2. 预测结果出现直线下滑?检查是否差分过度
  3. 样本量小于50条的建议换模型

最后来个可视化收尾:

import matplotlib.pyplot as plt ts_data.plot(label='历史数据') forecast.predicted_mean.plot(label='预测', color='red') plt.fill_between(forecast.conf_int().index, forecast.conf_int()['lower close'], forecast.conf_int()['upper close'], color='pink', alpha=0.3) plt.legend()

ARIMA就像老中医把脉,数据平稳了、参数调准了,预测效果自然就上来了。下次遇到股票价格、服务器负载这些时间序列,不妨先拿它试试手。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 5:43:08

基因编码设计(关键!)

遗传算法微网优化。 考虑风光柴油机等设备&#xff0c;程序注释详细&#xff0c;适合初学者学习凌晨三点的实验室键盘声格外清脆&#xff0c;我盯着屏幕上跳动的曲线突然来了精神——那个折腾了半个月的微网优化模型终于收敛了&#xff01;记得刚开始接触风光柴储系统时&#x…

作者头像 李华
网站建设 2026/4/15 14:09:40

Qwen3-VL-WEBUI教学实践:计算机教室秒变AI实验室

Qwen3-VL-WEBUI教学实践&#xff1a;计算机教室秒变AI实验室 引言 作为一名大学讲师&#xff0c;你是否也遇到过这样的困境&#xff1a;实验室设备老旧&#xff0c;无法运行最新的AI模型&#xff1b;学生人数众多&#xff0c;每人配置高性能GPU成本过高&#xff1b;想教授前沿…

作者头像 李华
网站建设 2026/4/18 0:12:46

Qwen3-VL智能相册方案:5分钟自动归类家庭照片,隐私不外传

Qwen3-VL智能相册方案&#xff1a;5分钟自动归类家庭照片&#xff0c;隐私不外传 1. 为什么你需要这个智能相册方案 作为一位宝妈&#xff0c;手机里存满了宝宝的成长照片——从出生时的第一声啼哭&#xff0c;到第一次翻身、第一次走路。这些珍贵瞬间往往散落在不同文件夹中…

作者头像 李华
网站建设 2026/4/18 2:51:36

Qwen3-VL开源替代方案:比商用API省80%成本

Qwen3-VL开源替代方案&#xff1a;比商用API省80%成本 引言&#xff1a;为什么选择Qwen3-VL&#xff1f; 作为小程序开发者&#xff0c;你可能已经被GPT-4V API的高昂价格吓退。商用API按调用次数收费&#xff0c;长期使用成本惊人。而阿里开源的Qwen3-VL多模态模型&#xff…

作者头像 李华
网站建设 2026/4/4 16:05:18

Hunyuan-HY-MT1.5实战指南:民族语言翻译支持部署步骤详解

Hunyuan-HY-MT1.5实战指南&#xff1a;民族语言翻译支持部署步骤详解 随着全球化进程加速&#xff0c;多语言交流需求日益增长&#xff0c;尤其在少数民族地区和跨文化场景中&#xff0c;高质量、低延迟的翻译服务成为关键基础设施。腾讯推出的混元翻译大模型 HY-MT1.5 系列&a…

作者头像 李华
网站建设 2026/4/15 20:29:41

Java团队转型AI应用开发:痛点解析与破局之道

在AI技术席卷各行各业的当下&#xff0c;不少Java开发团队纷纷投身AI应用开发浪潮。但转型之路并非坦途&#xff0c;一系列难题让很多团队举步维艰。技术架构适配是首当其冲的问题。Java团队熟悉传统“算法数据结构”的技术范式&#xff0c;而AI应用开发需要“算法大模型数据结…

作者头像 李华