时序预测算法简单对比

[复制链接]
查看47 | 回复0 | 6 天前 | 显示全部楼层 |阅读模式
1. 模型类型与本质差异
ARIMA 和 Prophet 属于统计派,前者基于线性自回归与差分,后者本质是加性分解模型,把趋势、季节、节假日显式拆开。XGBoost 和 LightGBM 同属梯度提升决策树(GBDT)家族,核心都是用多棵决策树逐步拟合残差,差异在操作层面而不在理论框架。LSTM 是循环神经网络,引入门控解决梯度消失;TFT 则是Transformer + LSTM 的混合架构,专为多变量时序设计,是目前工业级预测最前沿的方案之一。

2. 线性 vs 非线性建模能力
ARIMA 只能拟合线性关系,Prophet 的加性结构也以线性为主,二者在面对温度突变、节假日效应叠加等非线性场景时偏弱。XGBoost 和 LightGBM 天然捕捉非线性交互,无需人工指定交叉项。LSTM 和 TFT 均为非线性模型,且 TFT 通过多头注意力进一步增强了复杂的多变量非线性交互建模能力。

3. 多变量支持程度
ARIMA 需扩展为 ARIMAX 才能引入外生变量,操作繁琐且只能处理少数变量。Prophet 仅支持少量 add_regressor,大规模多变量场景受限。XGBoost 和 LightGBM 对多变量支持良好,但依赖人工构造 lag、rolling、交叉特征,模型本身不"理解"时间。LSTM 支持多维输入序列,端到端学习;TFT 则设计了三类输入(已知未来、观测已知、静态元数据),是多变量支持最完善的方案。

4. 特征工程负担
ARIMA 和 Prophet 几乎不需要特征工程,Prophet 甚至自动处理节假日和季节,是"开箱即用"的代表。XGBoost 和 LightGBM 极度依赖特征工程,lag_1h/lag_24h/lag_168h、rolling_mean、时间编码等都需要手工构造,特征质量直接决定上限。LSTM 只需构造滑动窗口,特征工程负担较轻。TFT 最省心,变量选择网络(VSN)自动筛选重要变量,几乎零特征工程。

5. 节假日与特殊事件处理
ARIMA 对节假日无原生支持,需手动加虚拟变量。Prophet 的节假日处理是独门绝技,add_country_holidays('CN') 一行代码覆盖中国法定假日,还能设置节前节后影响窗口。XGBoost/LightGBM 需手工编码节假日特征。LSTM 同理。TFT 的"已知未来输入"设计天然支持节假日,预测时直接传入未来节假日标记即可。

6. 概率预测与不确定性量化
ARIMA 可提供置信区间,但假设高斯噪声,现实中负荷预测残差往往重尾。Prophet 输出不确定性区间,对异常值有一定鲁棒性。XGBoost 和 LightGBM 原生不支持概率预测,需训练多个分位数模型或后处理。LSTM 同理。TFT 的分位数输出(10%/50%/90%)是其杀手级特性,直接给出预测区间,对负荷预测的风险预警极具工程价值。

7. 可解释性
ARIMA 系数有明确统计含义,可解释性最强。Prophet 的分量分解图让业务人员也能看懂趋势和季节贡献,沟通成本极低。XGBoost/LightGBM 提供特征重要性排序,但无法解释某个具体预测是怎么做出的。LSTM 是典型黑盒,特征重要性难以追溯。TFT 通过变量选择权重 + 时间注意力热力图实现了深度学习模型中的顶级可解释性,能回答"模型预测此刻负荷时,最关注过去哪些时间步的哪些变量"。

8. 训练速度与算力需求
ARIMA 和 Prophet 训练在秒级,CPU 即可。XGBoost 训练在分钟级,CPU 友好。LightGBM 比 XGBoost 快 2~10 倍,同样 CPU 可跑。LSTM 训练慢,序列无法并行,强烈依赖 GPU。TFT 训练最慢,且必须使用 GPU,显存需求高,是算力成本最高的选择。

9. 数据量门槛
ARIMA 只需 50~100 个数据点即可建模,适合冷启动场景。Prophet 建议至少 2 年数据以稳定季节项估计。XGBoost/LightGBM 在 1 万条以上数据开始发挥优势,LightGBM 在 10 万条以上显著优于 XGBoost。LSTM 和 TFT 均需 1 万条以上,TFT 在 5 万条以上才能充分释放多头注意力的威力。

10. 选型一句话总结
  • ARIMA:数据少、要快、要解释 → 打基线专用
  • Prophet:节假日多、趋势有变点、要给业务方看分解图 → 首选
  • LightGBM:特征工程到位、要快、大数据量 → 性价比最高
  • XGBoost:同 LightGBM,但数据量偏小或对过拟合敏感时更稳
  • LSTM:要端到端、不想做特征工程、有机会用 GPU → 可考虑
  • TFT:要概率预测、要多变量可解释、算力充足、追求 SOTA → 终极方案

融合策略(工厂实战推荐):
  • LightGBM做短期(1~6h)预测,响应快、特征灵活
  • TFT做中长期(6~48h)预测,概率区间输出用于风险预警
  • 简单加权 y = α·y_lgb + (1-α)·y_tft,α按时效距离动态调整
  • ARIMA做冷启动基线,模型训练完成前先顶上

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则