1. 数据概况
本系统使用来自 FRED (Federal Reserve Economic Data) 的宏观经济数据,包含 7 个目标指标 和 18 个外生变量。
1.1 数据列表
| 指标代码 |
名称 |
FRED代码 |
频率 |
起始日期 |
最新日期 |
数据点数 |
用途 |
| PCE_Core |
核心PCE物价指数 |
PCEPILFE |
M |
2000-01-01 |
2025-12-01 |
312 |
目标变量 |
| NonFarm_Payrolls |
非农就业人数 |
PAYEMS |
M |
2000-01-01 |
2026-02-01 |
314 |
目标变量 |
| Ind_Production |
工业产出 |
INDPRO |
M |
2000-01-01 |
2026-01-01 |
313 |
目标变量 |
| Yield_10Y |
10年期美债收益率 |
DGS10 |
D |
2000-01-03 |
2026-03-05 |
6545 |
目标变量 |
| Yield_2Y |
2年期美债收益率 |
DGS2 |
D |
2000-01-03 |
2026-03-05 |
6545 |
目标变量 |
| Yield_10Y2Y |
10Y-2Y美债利差 |
T10Y2Y |
D |
2000-01-03 |
2026-03-06 |
6546 |
目标变量 |
| Initial_Claims |
初请失业金 |
ICSA |
M |
2000-01-01 |
2026-02-28 |
1366 |
目标变量 |
| WTI_Oil |
WTI原油价格 |
DCOILWTICO |
M |
2000-01-04 |
2026-03-02 |
6559 |
外生变量 |
| PPI |
PPI最终需求 |
PPIFIS |
M |
2009-11-01 |
2026-01-01 |
195 |
外生变量 |
| Import_Price |
进口价格指数 |
IR |
M |
2000-01-01 |
2026-01-01 |
312 |
外生变量 |
| Avg_Hourly_Earnings |
平均时薪 |
CES0500000003 |
M |
2006-03-01 |
2026-02-01 |
240 |
外生变量 |
| Consumer_Sentiment |
消费者信心指数 |
UMCSENT |
M |
2000-01-01 |
2026-01-01 |
313 |
外生变量 |
| M2_Money |
M2货币供应 |
M2SL |
M |
2000-01-01 |
2026-01-01 |
313 |
外生变量 |
| Fed_Funds_Rate |
Fed基金利率 |
FEDFUNDS |
M |
2000-01-01 |
2026-02-01 |
314 |
外生变量 |
| Continued_Claims |
续请失业金 |
CCSA |
M |
2000-01-01 |
2026-02-21 |
1365 |
外生变量 |
| Job_Openings |
职位空缺(JOLTS) |
JTSJOL |
M |
2000-12-01 |
2025-12-01 |
301 |
外生变量 |
| ISM_Manufacturing |
ISM制造业就业 |
MANEMP |
M |
2000-01-01 |
2026-02-01 |
314 |
外生变量 |
| Durable_Goods |
耐用品订单 |
DGORDER |
M |
2000-01-01 |
2025-12-01 |
312 |
外生变量 |
| Durable_Goods_Smoothed |
耐用品订单(平滑) |
DGORDER |
M |
2000-01-01 |
2025-12-01 |
312 |
外生变量 |
| Capacity_Util |
产能利用率 |
TCU |
M |
2000-01-01 |
2026-01-01 |
313 |
外生变量 |
| Inventory_Sales |
库存销售比 |
ISRATIO |
M |
2000-01-01 |
2025-12-01 |
312 |
外生变量 |
2. 探索性数据分析 (EDA)
2.1 描述性统计
| 指标 |
样本数 |
均值 |
标准差 |
最小值 |
中位数 |
最大值 |
偏度 |
峰度 |
| PCE_Core |
312 |
95.2967 |
14.187 |
74.306 |
93.6085 |
127.918 |
0.5716 |
-0.4904 |
| NonFarm_Payrolls |
314 |
140538.949 |
9184.5121 |
129706.0 |
137706.0 |
158558.0 |
0.6184 |
-0.9531 |
| Ind_Production |
313 |
97.2504 |
4.7304 |
84.5619 |
98.8833 |
104.1004 |
-0.7241 |
-0.5753 |
| Yield_10Y |
6545 |
3.3275 |
1.2931 |
0.52 |
3.44 |
6.79 |
0.0387 |
-0.7284 |
| Yield_2Y |
6545 |
2.2683 |
1.764 |
0.09 |
1.83 |
6.93 |
0.5353 |
-0.867 |
| Yield_10Y2Y |
6546 |
1.0591 |
0.9688 |
-1.08 |
1.04 |
2.91 |
0.0327 |
-1.1166 |
| Initial_Claims |
1366 |
369147.1449 |
345315.9061 |
189000.0 |
321000.0 |
6137000.0 |
10.7677 |
147.7201 |
2.2 相关性分析
目标指标间的相关系数矩阵:
| PCE_Core | NonFarm_ | Ind_Prod | Yield_10 | Yield_2Y | Yield_10 | Initial_ |
| PCE_Core | 1.0 | 0.9187 | 0.6018 | -0.3731 | -0.0329 | -0.438 | -0.0572 |
|---|
| NonFarm_ | 0.9187 | 1.0 | 0.7215 | -0.2049 | 0.2004 | -0.6376 | -0.1631 |
|---|
| Ind_Prod | 0.6018 | 0.7215 | 1.0 | -0.2944 | 0.056 | -0.4946 | -0.2894 |
|---|
| Yield_10 | -0.3731 | -0.2049 | -0.2944 | 1.0 | 0.8419 | -0.196 | -0.2318 |
|---|
| Yield_2Y | -0.0329 | 0.2004 | 0.056 | 0.8419 | 1.0 | -0.6941 | -0.2263 |
|---|
| Yield_10 | -0.438 | -0.6376 | -0.4946 | -0.196 | -0.6941 | 1.0 | 0.1019 |
|---|
| Initial_ | -0.0572 | -0.1631 | -0.2894 | -0.2318 | -0.2263 | 0.1019 | 1.0 |
2.3 平稳性检验 (ADF Test)
| 指标 |
原序列统计量 |
p值 |
结论 |
一阶差分统计量 |
p值 |
结论 |
建议 d |
| PCE_Core |
2.1396 |
0.998829 |
✗ 非平稳 |
-1.7756 |
0.392662 |
✗ 非平稳 |
d = 2 |
| NonFarm_Payrolls |
-0.3594 |
0.916666 |
✗ 非平稳 |
-14.3849 |
0.0 |
✓ 平稳 |
d = 1 |
| Ind_Production |
-2.0831 |
0.251347 |
✗ 非平稳 |
-13.3282 |
0.0 |
✓ 平稳 |
d = 1 |
| Yield_10Y |
-2.6091 |
0.091125 |
✗ 非平稳 |
-60.2177 |
0.0 |
✓ 平稳 |
d = 1 |
| Yield_2Y |
-2.4933 |
0.11711 |
✗ 非平稳 |
-11.487 |
0.0 |
✓ 平稳 |
d = 1 |
| Yield_10Y2Y |
-1.9321 |
0.3171 |
✗ 非平稳 |
-15.0413 |
0.0 |
✓ 平稳 |
d = 1 |
| Initial_Claims |
-5.2356 |
7e-06 |
✓ 平稳 |
-12.0248 |
0.0 |
✓ 平稳 |
d = 0 |
ADF检验说明:
- H₀(零假设):序列存在单位根,即非平稳
- p值 < 0.05:拒绝零假设,序列平稳
- 5%临界值约为 -2.86
3. 数据处理流程
3.1 特征工程转换
| 转换类型 | 公式 | 适用指标 |
yoy_mom |
YoY = (Vₜ / Vₜ₋₁₂) - 1 ; MoM = (Vₜ / Vₜ₋₁) - 1 |
PCE_Core, CPI_Core |
yoy_diff_mom |
同上 + Change = Vₜ - Vₜ₋₁ |
NonFarm_Payrolls |
level |
保持原值 |
Yield_10Y, Yield_2Y, Yield_10Y2Y |
3.2 频率转换
| 原始频率 | 目标频率 | 方法 | 适用指标 |
| 日频 (D) |
月频 (M) |
取月末值 resample('ME').last() |
Yield_10Y, Yield_2Y, Yield_10Y2Y |
| 周频 (W) |
月频 (M) |
取最后值 method="last" |
Initial_Claims |
4. 模型设定
4.1 AUTO-ARIMAX 模型
模型形式: ARIMA(p, d, q) + 外生变量 X
预测公式:
ŷₜ = c + φ₁yₜ₋₁ + ... + φₚyₜ₋ₚ
+ θ₁εₜ₋₁ + ... + θqεₜ₋q
+ β₁X₁ₜ + ... + βₖXₖₜ
+ εₜ
参数说明:
- p: 自回归阶数(AR项)
- d: 差分阶数
- q: 移动平均阶数(MA项)
- X: 外生变量向量
4.2 各指标模型配置
| 指标 |
模型阶数 |
外生变量数 |
外生变量列表 |
数据频率 |
预测方式 |
| PCE_Core |
ARIMA(1, 1, 0) |
4 |
M2_Money, Import_Price, Retail_Sales, Initial_Claims |
M |
单步 |
| NonFarm_Payrolls |
ARIMA(0, 1, 0) |
5 |
Initial_Claims, Job_Openings, Ind_Production, Retail_Sales, Fed_Funds_Rate |
M |
单步 |
| Ind_Production |
ARIMA(0, 1, 0) |
5 |
Retail_Sales, Capacity_Util, WTI_Oil, Business_Loans, Initial_Claims |
M |
单步 |
| Yield_10Y |
ARIMA(1, 1, 3) |
4 |
Fed_Funds_Rate, Inflation_Expect_5Y, HighYield_Spread, ISM_Manufacturing |
日→月 |
3步滚动 |
| Yield_2Y |
ARIMA(1, 1, 0) |
4 |
Fed_Funds_Rate, ISM_Manufacturing, Inflation_Expect_5Y, PCE_Core |
日→月 |
3步滚动 |
| Yield_10Y2Y |
ARIMA(3, 1, 0) |
3 |
Fed_Funds_Rate, Unemployment_Rate, PCE_Core |
日→月 |
3步滚动 |
| Initial_Claims |
ARIMA(1, 1, 1) |
0 |
无 |
M |
单步 |
5. ARIMA 参数选择 (p, d, q)
5.1 差分阶数 d 的确定
方法:ADF (Augmented Dickey-Fuller) 检验
步骤:
1. 对原序列进行ADF检验
2. 如果 p-value >= 0.05,序列非平稳,进行一阶差分
3. 对一阶差分序列进行ADF检验
4. 如果 p-value < 0.05,d=1;否则继续差分或设d=2
临界值参考(5%显著性水平):
- 1%: -3.43
- 5%: -2.86
- 10%: -2.57
5.2 p 和 q 的确定
方法:AIC (Akaike Information Criterion) 网格搜索
步骤:
1. 设定搜索范围:p ∈ [0, 3], q ∈ [0, 3]
2. 对每个 (p, q) 组合拟合ARIMA模型
3. 计算AIC值:AIC = 2k - 2ln(L)
4. 选择AIC最小的组合作为最优参数
其中 k 为参数个数,L 为似然函数值
6. 数据集划分
6.1 滚动回测 (Walk-Forward)
方法:扩展窗口滚动预测
示意图:
时间 →→→→→→→→→→→→→→→→→→→
|<------ 训练集 ------>|<- 预测 ->|
|=====================|==| 第1次
|======================|==| 第2次
|=======================|==| 第3次
逐步扩展训练集
特点:
- 无独立验证集(使用滚动预测代替)
- 每次预测使用所有历史数据
- 模拟实际预测场景
6.2 具体设置
| 参数 | 值 | 说明 |
| 最小训练长度 | 60个月 | 至少需要5年数据 |
| 预测步长 | 1个月(标准)/ 3步滚动(利率类) | - |
| 训练窗口 | 扩展窗口 (window=None) | 使用所有历史数据 |
7. 样本外预测指标 (OOF)
7.1 指标定义
| 指标 | 公式 | 说明 |
| MAE | Σ|y - ŷ| / n | 平均绝对误差 |
| RMSE | √(Σ(y - ŷ)² / n) | 均方根误差 |
| MAPE | Σ|y - ŷ| / y × 100% | 平均绝对百分比误差 |
| 方向准确率 | (正确方向数) / (总数) | 预测方向正确的比例 |
7.2 各指标OOF结果
| 指标 |
MAE |
RMSE |
MAPE |
方向准确率 |
| PCE_Core |
0.1295 |
0.2195 |
0.12% |
93.1% |
| NonFarm_Payrolls |
623.5464 |
2090.5637 |
0.44% |
75.9% |
| Ind_Production |
0.6955 |
1.4238 |
0.72% |
47.0% |
| Yield_10Y |
0.1905 |
0.249 |
8.4% |
43.3% |
| Yield_2Y |
0.1633 |
0.2228 |
16.49% |
49.2% |
| Yield_10Y2Y |
0.1208 |
0.1926 |
33.85% |
50.0% |
| Initial_Claims |
34378.0588 |
187041.5078 |
5.95% |
43.8% |
指标解读:
- 绿色:方向准确率 ≥ 60%,预测效果良好
- 橙色:方向准确率 50-60%,预测效果一般
- 红色:方向准确率 < 50%,需要改进