Files
btc_price_anany/PLAN.md
riba2534 6f2fede5ba feat: 添加8个多尺度分析模块并完善研究报告
新增分析模块:
- microstructure: 市场微观结构分析 (Roll价差, VPIN, Kyle's Lambda)
- intraday_patterns: 日内模式分析 (U型曲线, 三时区对比)
- scaling_laws: 统计标度律 (15尺度波动率标度, R²=0.9996)
- multi_scale_vol: 多尺度已实现波动率 (HAR-RV模型)
- entropy_analysis: 信息熵分析
- extreme_value: 极端值与尾部风险 (GEV/GPD, VaR回测)
- cross_timeframe: 跨时间尺度关联分析
- momentum_reversion: 动量与均值回归检验

现有模块增强:
- hurst_analysis: 扩展至15个时间尺度,新增Hurst vs log(Δt)标度图
- fft_analysis: 扩展至15个粒度,支持瀑布图
- returns/acf/volatility/patterns/anomaly/fractal: 多尺度增强

研究报告更新:
- 新增第16章: 基于全量数据的深度规律挖掘 (15尺度综合)
- 完善第17章: 价格推演添加实际案例 (2020-2021牛市, 2022熊市等)
- 新增16.10节: 可监控的实证指标与预警信号
- 添加VPIN/波动率/Hurst等指标的实时监控阈值和案例

数据覆盖: 全部15个K线粒度 (1m~1mo), 440万条记录
关键发现: Hurst随尺度单调递增 (1m:0.53→1mo:0.72), 极端风险不对称

Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
2026-02-03 16:35:08 +08:00

6.5 KiB
Raw Blame History

BTC 全数据深度分析扩展计划

目标

充分利用全部 15 个 K 线数据文件1m~1mo新增 8 个分析模块 + 增强 5 个现有模块,覆盖目前完全未触及的分钟级微观结构、多尺度统计标度律、极端风险等领域。


一、新增 8 个分析模块

1. microstructure.py — 市场微观结构分析

使用数据: 1m, 3m, 5m

  • Roll 价差估计(基于收盘价序列相关性)
  • Corwin-Schultz 高低价价差估计
  • Kyle's Lambda价格冲击系数
  • Amihud 非流动性比率
  • VPIN基于成交量同步的知情交易概率
  • 图表: 价差时序、流动性热力图、VPIN 预警图

2. intraday_patterns.py — 日内模式分析

使用数据: 1m, 5m, 15m, 30m, 1h

  • 日内成交量 U 型曲线(按小时/分钟聚合)
  • 日内波动率微笑模式
  • 亚洲/欧洲/美洲交易时段对比
  • 日内收益率自相关结构
  • 图表: 时段热力图、成交量/波动率日内模式、三时区对比

3. scaling_laws.py — 统计标度律分析

使用数据: 全部 15 个文件

  • 波动率标度: σ(Δt) ∝ (Δt)^H拟合 H 指数
  • Taylor 效应: |r|^q 的自相关衰减与 q 的关系
  • 收益率聚合特性(正态化速度)
  • Epps 效应(高频相关性衰减)
  • 图表: 标度律拟合、Taylor 效应矩阵、正态性 vs 时间尺度

4. multi_scale_vol.py — 多尺度已实现波动率

使用数据: 5m, 15m, 30m, 1h, 2h, 4h, 6h, 8h, 12h, 1d

  • 已实现波动率 (RV) 在各尺度上的计算
  • 波动率签名图 (Volatility Signature Plot)
  • HAR-RV 模型 (Corsi 2009) — 用 5m RV 预测日/周/月 RV
  • 多尺度波动率溢出 (Diebold-Yilmaz)
  • 图表: 签名图、HAR-RV 拟合、波动率溢出网络

5. entropy_analysis.py — 信息熵分析

使用数据: 1m, 5m, 15m, 1h, 4h, 1d

  • Shannon 熵跨时间尺度比较
  • 样本熵 (SampEn) / 近似熵 (ApEn)
  • 排列熵 (Permutation Entropy) 多尺度
  • 转移熵 (Transfer Entropy) — 时间尺度间信息流方向
  • 图表: 熵 vs 时间尺度、滚动熵时序、信息流向图

6. extreme_value.py — 极端值与尾部风险

使用数据: 1h, 4h, 1d, 1w

  • 广义极值分布 (GEV) 区组极大值拟合
  • 广义 Pareto 分布 (GPD) 超阈值拟合
  • 多尺度 VaR / CVaR 计算
  • 尾部指数估计 (Hill estimator)
  • 极端事件聚集检验
  • 图表: 尾部拟合 QQ 图、VaR 回测、尾部指数时序

7. cross_timeframe.py — 跨时间尺度关联分析

使用数据: 5m, 15m, 1h, 4h, 1d, 1w

  • 跨尺度收益率相关矩阵
  • Lead-lag 领先/滞后关系检测
  • 多尺度 Granger 因果检验
  • 信息流方向(粗粒度 → 细粒度 or 反向?)
  • 图表: 跨尺度相关热力图、领先滞后矩阵、信息流向图

8. momentum_reversion.py — 动量与均值回归多尺度检验

使用数据: 1m, 5m, 15m, 1h, 4h, 1d, 1w, 1mo

  • 各尺度收益率自相关符号分析
  • 方差比检验 (Lo-MacKinlay)
  • 均值回归半衰期 (Ornstein-Uhlenbeck 拟合)
  • 动量/反转盈利能力回测
  • 图表: 方差比 vs 尺度、自相关衰减、策略 PnL 对比

二、增强 5 个现有模块

9. fft_analysis.py 增强

  • 当前: 仅用 4h, 1d, 1w
  • 扩展: 加入 1m, 5m, 15m, 30m, 1h, 2h, 6h, 8h, 12h, 3d, 1mo
  • 新增: 全 15 尺度频谱瀑布图

10. hurst_analysis.py 增强

  • 当前: 仅用 1h, 4h, 1d, 1w
  • 扩展: 全部 15 个粒度的 Hurst 指数
  • 新增: Hurst 指数 vs 时间尺度的标度关系图

11. returns_analysis.py 增强

  • 当前: 仅用 1h, 4h, 1d, 1w
  • 扩展: 加入 1m, 5m, 15m, 30m, 2h, 6h, 8h, 12h, 3d, 1mo
  • 新增: 峰度/偏度 vs 时间尺度图,正态化收敛速度

12. acf_analysis.py 增强

  • 当前: 仅用 1d
  • 扩展: 加入 1h, 4h, 1w 的 ACF/PACF 多尺度对比
  • 新增: 自相关衰减速度 vs 时间尺度

13. volatility_analysis.py 增强

  • 当前: 仅用 1d
  • 扩展: 加入 5m, 1h, 4h 的波动率聚集分析
  • 新增: 波动率长记忆参数 d vs 时间尺度

三、main.py 更新

在 MODULE_REGISTRY 中注册全部 8 个新模块:

("microstructure", ("市场微观结构",   "microstructure",       "run_microstructure_analysis",   False)),
("intraday",       ("日内模式分析",   "intraday_patterns",    "run_intraday_analysis",         False)),
("scaling",        ("统计标度律",     "scaling_laws",         "run_scaling_analysis",           False)),
("multiscale_vol", ("多尺度波动率",   "multi_scale_vol",      "run_multiscale_vol_analysis",    False)),
("entropy",        ("信息熵分析",     "entropy_analysis",     "run_entropy_analysis",           False)),
("extreme",        ("极端值分析",     "extreme_value",        "run_extreme_value_analysis",     False)),
("cross_tf",       ("跨尺度关联",     "cross_timeframe",      "run_cross_timeframe_analysis",   False)),
("momentum_rev",   ("动量均值回归",   "momentum_reversion",   "run_momentum_reversion_analysis",False)),

四、实施策略

  • 8 个新模块并行开发(各模块独立无依赖)
  • 5 个模块增强并行开发
  • 全部完成后更新 main.py 注册 + 运行全量测试
  • 每个模块遵循现有 run_xxx(df, output_dir) -> Dict 签名
  • 需要多尺度数据的模块内部调用 load_klines(interval) 自行加载

五、数据覆盖验证

数据文件 当前使用 扩展后使用
1m - microstructure, intraday, scaling, momentum_rev, fft(增)
3m - microstructure, scaling
5m - microstructure, intraday, scaling, multi_scale_vol, entropy, cross_tf, momentum_rev, returns(增), volatility(增)
15m - intraday, scaling, entropy, cross_tf, momentum_rev, returns(增)
30m - intraday, scaling, multi_scale_vol, returns(增), fft(增)
1h hurst,returns,causality,calendar +intraday, scaling, multi_scale_vol, entropy, cross_tf, momentum_rev, acf(增), volatility(增)
2h - multi_scale_vol, scaling, fft(增), returns(增)
4h fft,hurst,returns +multi_scale_vol, entropy, cross_tf, momentum_rev, acf(增), volatility(增), extreme
6h - multi_scale_vol, scaling, fft(增), returns(增)
8h - multi_scale_vol, scaling, fft(增), returns(增)
12h - multi_scale_vol, scaling, fft(增), returns(增)
1d 全部17模块 +所有新增模块
3d - scaling, fft(增), returns(增)
1w fft,hurst,returns +extreme, cross_tf, momentum_rev, acf(增)
1mo - momentum_rev, scaling, fft(增), returns(增)

结果: 全部 15 个数据文件 100% 覆盖使用