Rainbow · POC 2025

单品级
需求智能预测

基于 LightGBM 的全局梯度提升模型,对 20,000+ 个 SKU 进行逐日销量预测, 融合 2 年以上历史交易数据与 8 项促销特征,覆盖五大商品经营中类。

查询预测结果 → 计算预测精度
20,412
参与预测 SKU 数
5
商品经营中类
46
预测时间跨度(天)
22
模型输入特征数

预测模型介绍

五种模型涵盖经典统计方法到深度学习,各有独立的数学基础。 所有模型共享相同的 22 维特征输入,采用递归多步策略生成 46 天预测。

LightGBM 全局模型 · 全量 SKU

梯度提升决策树。每轮新树拟合前一步预测的损失梯度残差, 逐步纠正误差。按叶优先生长与 GOSS 单侧梯度采样显著提升训练效率。

ŷi = Σk=1500 η · fk(xi)   (η = 0.05)
Gain = ½[GL²/(HL+λ) + GR²/(HR+λ) − (GL+GR)²/(HL+HR+λ)] − γ
w* = −G / (H + λ)
500 棵树 深度 6 31 叶节点 GOSS 采样
LSTM 全局模型 · 500 SKU 样本

长短期记忆网络。三个可学习门控机制分别控制遗忘、写入与读取, 使网络能在 28 天输入窗口内捕捉长程季节性依赖关系。

ft = σ(Wf·[ht-1, xt] + bf)  遗忘门
it = σ(Wi·[ht-1, xt] + bi)  输入门
ct = ft⊙ct-1 + it⊙tanh(Wc·[ht-1, xt] + bc)
ht = σ(Wo·[ht-1,xt]+bo) ⊙ tanh(ct)
2 层 64 隐藏单元 序列长度 28 天 Huber 损失
Prophet 单品模型 · 按需拟合

Meta 开源的加法分解模型,将时序信号拆解为分段线性趋势 (含自动变点检测)、Fourier 级数季节性分量与节假日效应三部分。

y(t) = g(t) + s(t) + h(t) + εt
g(t):分段线性趋势 + 自动变点
s(t) = Σn[ancos(2πnt/P) + bnsin(2πnt/P)]
P = 7(周季节性周期)
加法模式 周季节性 结果内存缓存
Holt-Winters 单品模型 · 按需拟合

三重指数平滑法,用三个加权方程分别追踪水平、趋势与季节性分量, 平滑参数 α、β、γ 逐 SKU 最优化拟合。

lt = α(yt/st-m) + (1−α)(lt-1+bt-1)  水平
bt = β(lt−lt-1) + (1−β)bt-1  趋势
st = γ(yt/lt) + (1−γ)st-m  季节
ŷt+h = (lt + h·bt) · st−m+h
周期 m = 7 αβγ 最优化 三级容错回退
集成模型 融合所有模型

对所选模型输出取简单均值。当各模型误差相互独立时,集成预测的方差 随模型数量 K 以 1/K 的比例收缩,预测更稳定。

ŷens = 1K Σk=1K ŷk
Var(ŷens) ≈ 1K · σ²
(各模型误差独立时成立)
简单均值 K = 已选模型数 方差 ∝ 1/K

22 维共享输入特征(所有模型通用)

滞后特征 · 7
lag_1 lag_2 lag_3
lag_7 lag_14 lag_21 lag_28
滚动均值 · 3
roll7   roll14   roll28
(shift-1 防止数据泄漏)
日历特征 · 3
星期几
月中第几天   月份
促销特征 · 8 + id
是否促销   折扣力度
组合/满额/库区/线上促销
距上次促销天数   近7天促销次数
商品编号 sku_id

LightGBM vs 基准模型交叉验证对比(3 折步进式 · 每折 28 天)

测试集 MAE
22.28
LightGBM · 成本单位
相较朴素基准
−21.9%
MAE 改善幅度
短历史 CV MAE
16.11
历史跨度 112–179 天
长历史 CV MAE
23.47
历史跨度 ≥ 180 天
ℹ️ 以上 MAE 指标来自销售成本预测模型(v2 notebook)的交叉验证结果。 POC 评估采用以销售数量为目标的 FA 指标,按周聚合计算。 请在下方"精度评估"模块上传实际销量数据,实时查看 FA 得分。

📐 POC 准确率计算方法 — FA 公式

FA  =  1 − |F − A| / ((F + A) × 2)

F = 该 SKU 当周预测销量合计  ·  A = 该 SKU 当周实际销量合计

若 F 或 A < 0,则取 0
若 F = A = 0,则 FA = 100%
FA 取值范围限定在 [0%, 100%]

加权汇总步骤(共 3 步):

1. 将逐日预测与实际销量聚合为周合计, 按周期划分(7月1–7日、8–14日、15–21日、22–28日……)
2. 各 SKU 权重 = 该周开始前 4 周的实际销量合计
3. 加权平均 FA → 品类层级(8802–8807)→ 全局汇总
加权 FA = Σ(FAi × wi) / Σwi

wi = SKUi 过去 4 周实际销量

预测结果查询

选择模型、商品与日期范围,通过本地 Python 服务器运行实时预测, 或在静态模式下浏览预计算结果。

正在检测本地服务器…
执行 uvicorn api_server:app --port 8000 以启用多模型实时预测

1 加载预测数据 (静态模式 — 或连接上方本地服务器)


预测精度评估

上传实际销量文件,系统在浏览器内完成 FA 指标计算, 数据全程不离开您的设备。

⚠️ 请先在 预测查询 模块中加载预测数据。