时序预测算法简单对比

显示全部楼层 · 6 天前

1. 模型类型与本质差异

ARIMA 和 Prophet 属于统计派，前者基于线性自回归与差分，后者本质是加性分解模型，把趋势、季节、节假日显式拆开。XGBoost 和 LightGBM 同属梯度提升决策树（GBDT）家族，核心都是用多棵决策树逐步拟合残差，差异在操作层面而不在理论框架。LSTM 是循环神经网络，引入门控解决梯度消失；TFT 则是Transformer + LSTM 的混合架构，专为多变量时序设计，是目前工业级预测最前沿的方案之一。

2. 线性 vs 非线性建模能力

ARIMA 只能拟合线性关系，Prophet 的加性结构也以线性为主，二者在面对温度突变、节假日效应叠加等非线性场景时偏弱。XGBoost 和 LightGBM 天然捕捉非线性交互，无需人工指定交叉项。LSTM 和 TFT 均为非线性模型，且 TFT 通过多头注意力进一步增强了复杂的多变量非线性交互建模能力。

3. 多变量支持程度

ARIMA 需扩展为 ARIMAX 才能引入外生变量，操作繁琐且只能处理少数变量。Prophet 仅支持少量 add_regressor，大规模多变量场景受限。XGBoost 和 LightGBM 对多变量支持良好，但依赖人工构造 lag、rolling、交叉特征，模型本身不"理解"时间。LSTM 支持多维输入序列，端到端学习；TFT 则设计了三类输入（已知未来、观测已知、静态元数据），是多变量支持最完善的方案。

4. 特征工程负担

ARIMA 和 Prophet 几乎不需要特征工程，Prophet 甚至自动处理节假日和季节，是"开箱即用"的代表。XGBoost 和 LightGBM 极度依赖特征工程，lag_1h/lag_24h/lag_168h、rolling_mean、时间编码等都需要手工构造，特征质量直接决定上限。LSTM 只需构造滑动窗口，特征工程负担较轻。TFT 最省心，变量选择网络（VSN）自动筛选重要变量，几乎零特征工程。

5. 节假日与特殊事件处理

ARIMA 对节假日无原生支持，需手动加虚拟变量。Prophet 的节假日处理是独门绝技，add_country_holidays('CN') 一行代码覆盖中国法定假日，还能设置节前节后影响窗口。XGBoost/LightGBM 需手工编码节假日特征。LSTM 同理。TFT 的"已知未来输入"设计天然支持节假日，预测时直接传入未来节假日标记即可。

6. 概率预测与不确定性量化

ARIMA 可提供置信区间，但假设高斯噪声，现实中负荷预测残差往往重尾。Prophet 输出不确定性区间，对异常值有一定鲁棒性。XGBoost 和 LightGBM 原生不支持概率预测，需训练多个分位数模型或后处理。LSTM 同理。TFT 的分位数输出（10%/50%/90%）是其杀手级特性，直接给出预测区间，对负荷预测的风险预警极具工程价值。

7. 可解释性

ARIMA 系数有明确统计含义，可解释性最强。Prophet 的分量分解图让业务人员也能看懂趋势和季节贡献，沟通成本极低。XGBoost/LightGBM 提供特征重要性排序，但无法解释某个具体预测是怎么做出的。LSTM 是典型黑盒，特征重要性难以追溯。TFT 通过变量选择权重 + 时间注意力热力图实现了深度学习模型中的顶级可解释性，能回答"模型预测此刻负荷时，最关注过去哪些时间步的哪些变量"。

8. 训练速度与算力需求

ARIMA 和 Prophet 训练在秒级，CPU 即可。XGBoost 训练在分钟级，CPU 友好。LightGBM 比 XGBoost 快 2~10 倍，同样 CPU 可跑。LSTM 训练慢，序列无法并行，强烈依赖 GPU。TFT 训练最慢，且必须使用 GPU，显存需求高，是算力成本最高的选择。

9. 数据量门槛

ARIMA 只需 50~100 个数据点即可建模，适合冷启动场景。Prophet 建议至少 2 年数据以稳定季节项估计。XGBoost/LightGBM 在 1 万条以上数据开始发挥优势，LightGBM 在 10 万条以上显著优于 XGBoost。LSTM 和 TFT 均需 1 万条以上，TFT 在 5 万条以上才能充分释放多头注意力的威力。

10. 选型一句话总结

ARIMA：数据少、要快、要解释 → 打基线专用
Prophet：节假日多、趋势有变点、要给业务方看分解图 → 首选
LightGBM：特征工程到位、要快、大数据量 → 性价比最高
XGBoost：同 LightGBM，但数据量偏小或对过拟合敏感时更稳
LSTM：要端到端、不想做特征工程、有机会用 GPU → 可考虑
TFT：要概率预测、要多变量可解释、算力充足、追求 SOTA → 终极方案

融合策略（工厂实战推荐）：

LightGBM做短期（1~6h）预测，响应快、特征灵活
TFT做中长期（6~48h）预测，概率区间输出用于风险预警
简单加权 y = α·y_lgb + (1-α)·y_tft，α按时效距离动态调整
ARIMA做冷启动基线，模型训练完成前先顶上

时序预测算法简单对比

本帖子中包含更多资源

浏览过的版块