← 返回主页面 | 基准线性模型 | 宏观研究

📊 模型数据与方法论

最后更新: 2026-03-07 09:30:29

目录

1. 数据概况

本系统使用来自 FRED (Federal Reserve Economic Data) 的宏观经济数据,包含 7 个目标指标18 个外生变量

1.1 数据列表

指标代码 名称 FRED代码 频率 起始日期 最新日期 数据点数 用途
PCE_Core 核心PCE物价指数 PCEPILFE M 2000-01-01 2025-12-01 312 目标变量
NonFarm_Payrolls 非农就业人数 PAYEMS M 2000-01-01 2026-02-01 314 目标变量
Ind_Production 工业产出 INDPRO M 2000-01-01 2026-01-01 313 目标变量
Yield_10Y 10年期美债收益率 DGS10 D 2000-01-03 2026-03-05 6545 目标变量
Yield_2Y 2年期美债收益率 DGS2 D 2000-01-03 2026-03-05 6545 目标变量
Yield_10Y2Y 10Y-2Y美债利差 T10Y2Y D 2000-01-03 2026-03-06 6546 目标变量
Initial_Claims 初请失业金 ICSA M 2000-01-01 2026-02-28 1366 目标变量
WTI_Oil WTI原油价格 DCOILWTICO M 2000-01-04 2026-03-02 6559 外生变量
PPI PPI最终需求 PPIFIS M 2009-11-01 2026-01-01 195 外生变量
Import_Price 进口价格指数 IR M 2000-01-01 2026-01-01 312 外生变量
Avg_Hourly_Earnings 平均时薪 CES0500000003 M 2006-03-01 2026-02-01 240 外生变量
Consumer_Sentiment 消费者信心指数 UMCSENT M 2000-01-01 2026-01-01 313 外生变量
M2_Money M2货币供应 M2SL M 2000-01-01 2026-01-01 313 外生变量
Fed_Funds_Rate Fed基金利率 FEDFUNDS M 2000-01-01 2026-02-01 314 外生变量
Continued_Claims 续请失业金 CCSA M 2000-01-01 2026-02-21 1365 外生变量
Job_Openings 职位空缺(JOLTS) JTSJOL M 2000-12-01 2025-12-01 301 外生变量
ISM_Manufacturing ISM制造业就业 MANEMP M 2000-01-01 2026-02-01 314 外生变量
Durable_Goods 耐用品订单 DGORDER M 2000-01-01 2025-12-01 312 外生变量
Durable_Goods_Smoothed 耐用品订单(平滑) DGORDER M 2000-01-01 2025-12-01 312 外生变量
Capacity_Util 产能利用率 TCU M 2000-01-01 2026-01-01 313 外生变量
Inventory_Sales 库存销售比 ISRATIO M 2000-01-01 2025-12-01 312 外生变量

2. 探索性数据分析 (EDA)

2.1 描述性统计

指标 样本数 均值 标准差 最小值 中位数 最大值 偏度 峰度
PCE_Core 312 95.2967 14.187 74.306 93.6085 127.918 0.5716 -0.4904
NonFarm_Payrolls 314 140538.949 9184.5121 129706.0 137706.0 158558.0 0.6184 -0.9531
Ind_Production 313 97.2504 4.7304 84.5619 98.8833 104.1004 -0.7241 -0.5753
Yield_10Y 6545 3.3275 1.2931 0.52 3.44 6.79 0.0387 -0.7284
Yield_2Y 6545 2.2683 1.764 0.09 1.83 6.93 0.5353 -0.867
Yield_10Y2Y 6546 1.0591 0.9688 -1.08 1.04 2.91 0.0327 -1.1166
Initial_Claims 1366 369147.1449 345315.9061 189000.0 321000.0 6137000.0 10.7677 147.7201

2.2 相关性分析

目标指标间的相关系数矩阵:

PCE_CoreNonFarm_Ind_ProdYield_10Yield_2YYield_10Initial_
PCE_Core1.00.91870.6018-0.3731-0.0329-0.438-0.0572
NonFarm_0.91871.00.7215-0.20490.2004-0.6376-0.1631
Ind_Prod0.60180.72151.0-0.29440.056-0.4946-0.2894
Yield_10-0.3731-0.2049-0.29441.00.8419-0.196-0.2318
Yield_2Y-0.03290.20040.0560.84191.0-0.6941-0.2263
Yield_10-0.438-0.6376-0.4946-0.196-0.69411.00.1019
Initial_-0.0572-0.1631-0.2894-0.2318-0.22630.10191.0

2.3 平稳性检验 (ADF Test)

指标 原序列统计量 p值 结论 一阶差分统计量 p值 结论 建议 d
PCE_Core 2.1396 0.998829 ✗ 非平稳 -1.7756 0.392662 ✗ 非平稳 d = 2
NonFarm_Payrolls -0.3594 0.916666 ✗ 非平稳 -14.3849 0.0 ✓ 平稳 d = 1
Ind_Production -2.0831 0.251347 ✗ 非平稳 -13.3282 0.0 ✓ 平稳 d = 1
Yield_10Y -2.6091 0.091125 ✗ 非平稳 -60.2177 0.0 ✓ 平稳 d = 1
Yield_2Y -2.4933 0.11711 ✗ 非平稳 -11.487 0.0 ✓ 平稳 d = 1
Yield_10Y2Y -1.9321 0.3171 ✗ 非平稳 -15.0413 0.0 ✓ 平稳 d = 1
Initial_Claims -5.2356 7e-06 ✓ 平稳 -12.0248 0.0 ✓ 平稳 d = 0
ADF检验说明:
  • H₀(零假设):序列存在单位根,即非平稳
  • p值 < 0.05:拒绝零假设,序列平稳
  • 5%临界值约为 -2.86

3. 数据处理流程

3.1 特征工程转换

转换类型公式适用指标
yoy_mom YoY = (Vₜ / Vₜ₋₁₂) - 1 ; MoM = (Vₜ / Vₜ₋₁) - 1 PCE_Core, CPI_Core
yoy_diff_mom 同上 + Change = Vₜ - Vₜ₋₁ NonFarm_Payrolls
level 保持原值 Yield_10Y, Yield_2Y, Yield_10Y2Y

3.2 频率转换

原始频率目标频率方法适用指标
日频 (D) 月频 (M) 取月末值 resample('ME').last() Yield_10Y, Yield_2Y, Yield_10Y2Y
周频 (W) 月频 (M) 取最后值 method="last" Initial_Claims

4. 模型设定

4.1 AUTO-ARIMAX 模型

模型形式: ARIMA(p, d, q) + 外生变量 X 预测公式: ŷₜ = c + φ₁yₜ₋₁ + ... + φₚyₜ₋ₚ + θ₁εₜ₋₁ + ... + θqεₜ₋q + β₁X₁ₜ + ... + βₖXₖₜ + εₜ 参数说明: - p: 自回归阶数(AR项) - d: 差分阶数 - q: 移动平均阶数(MA项) - X: 外生变量向量

4.2 各指标模型配置

指标 模型阶数 外生变量数 外生变量列表 数据频率 预测方式
PCE_Core ARIMA(1, 1, 0) 4 M2_Money, Import_Price, Retail_Sales, Initial_Claims M 单步
NonFarm_Payrolls ARIMA(0, 1, 0) 5 Initial_Claims, Job_Openings, Ind_Production, Retail_Sales, Fed_Funds_Rate M 单步
Ind_Production ARIMA(0, 1, 0) 5 Retail_Sales, Capacity_Util, WTI_Oil, Business_Loans, Initial_Claims M 单步
Yield_10Y ARIMA(1, 1, 3) 4 Fed_Funds_Rate, Inflation_Expect_5Y, HighYield_Spread, ISM_Manufacturing 日→月 3步滚动
Yield_2Y ARIMA(1, 1, 0) 4 Fed_Funds_Rate, ISM_Manufacturing, Inflation_Expect_5Y, PCE_Core 日→月 3步滚动
Yield_10Y2Y ARIMA(3, 1, 0) 3 Fed_Funds_Rate, Unemployment_Rate, PCE_Core 日→月 3步滚动
Initial_Claims ARIMA(1, 1, 1) 0 M 单步

5. ARIMA 参数选择 (p, d, q)

5.1 差分阶数 d 的确定

方法:ADF (Augmented Dickey-Fuller) 检验 步骤: 1. 对原序列进行ADF检验 2. 如果 p-value >= 0.05,序列非平稳,进行一阶差分 3. 对一阶差分序列进行ADF检验 4. 如果 p-value < 0.05,d=1;否则继续差分或设d=2 临界值参考(5%显著性水平): - 1%: -3.43 - 5%: -2.86 - 10%: -2.57

5.2 p 和 q 的确定

方法:AIC (Akaike Information Criterion) 网格搜索 步骤: 1. 设定搜索范围:p ∈ [0, 3], q ∈ [0, 3] 2. 对每个 (p, q) 组合拟合ARIMA模型 3. 计算AIC值:AIC = 2k - 2ln(L) 4. 选择AIC最小的组合作为最优参数 其中 k 为参数个数,L 为似然函数值

6. 数据集划分

6.1 滚动回测 (Walk-Forward)

方法:扩展窗口滚动预测 示意图: 时间 →→→→→→→→→→→→→→→→→→→ |<------ 训练集 ------>|<- 预测 ->| |=====================|==| 第1次 |======================|==| 第2次 |=======================|==| 第3次 逐步扩展训练集 特点: - 无独立验证集(使用滚动预测代替) - 每次预测使用所有历史数据 - 模拟实际预测场景

6.2 具体设置

参数说明
最小训练长度60个月至少需要5年数据
预测步长1个月(标准)/ 3步滚动(利率类)-
训练窗口扩展窗口 (window=None)使用所有历史数据

7. 样本外预测指标 (OOF)

7.1 指标定义

指标公式说明
MAEΣ|y - ŷ| / n平均绝对误差
RMSE√(Σ(y - ŷ)² / n)均方根误差
MAPEΣ|y - ŷ| / y × 100%平均绝对百分比误差
方向准确率(正确方向数) / (总数)预测方向正确的比例

7.2 各指标OOF结果

指标 MAE RMSE MAPE 方向准确率
PCE_Core 0.1295 0.2195 0.12% 93.1%
NonFarm_Payrolls 623.5464 2090.5637 0.44% 75.9%
Ind_Production 0.6955 1.4238 0.72% 47.0%
Yield_10Y 0.1905 0.249 8.4% 43.3%
Yield_2Y 0.1633 0.2228 16.49% 49.2%
Yield_10Y2Y 0.1208 0.1926 33.85% 50.0%
Initial_Claims 34378.0588 187041.5078 5.95% 43.8%
指标解读:
  • 绿色:方向准确率 ≥ 60%,预测效果良好
  • 橙色:方向准确率 50-60%,预测效果一般
  • 红色:方向准确率 < 50%,需要改进