Files
btc_price_anany/PLAN.md
riba2534 24d14a0b44 feat: 添加8个多尺度分析模块并完善研究报告
新增分析模块:
- microstructure: 市场微观结构分析 (Roll价差, VPIN, Kyle's Lambda)
- intraday_patterns: 日内模式分析 (U型曲线, 三时区对比)
- scaling_laws: 统计标度律 (15尺度波动率标度, R²=0.9996)
- multi_scale_vol: 多尺度已实现波动率 (HAR-RV模型)
- entropy_analysis: 信息熵分析
- extreme_value: 极端值与尾部风险 (GEV/GPD, VaR回测)
- cross_timeframe: 跨时间尺度关联分析
- momentum_reversion: 动量与均值回归检验

现有模块增强:
- hurst_analysis: 扩展至15个时间尺度,新增Hurst vs log(Δt)标度图
- fft_analysis: 扩展至15个粒度,支持瀑布图
- returns/acf/volatility/patterns/anomaly/fractal: 多尺度增强

研究报告更新:
- 新增第16章: 基于全量数据的深度规律挖掘 (15尺度综合)
- 完善第17章: 价格推演添加实际案例 (2020-2021牛市, 2022熊市等)
- 新增16.10节: 可监控的实证指标与预警信号
- 添加VPIN/波动率/Hurst等指标的实时监控阈值和案例

数据覆盖: 全部15个K线粒度 (1m~1mo), 440万条记录
关键发现: Hurst随尺度单调递增 (1m:0.53→1mo:0.72), 极端风险不对称

Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
2026-02-03 16:35:08 +08:00

153 lines
6.5 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# BTC 全数据深度分析扩展计划
## 目标
充分利用全部 15 个 K 线数据文件1m~1mo新增 8 个分析模块 + 增强 5 个现有模块,覆盖目前完全未触及的分钟级微观结构、多尺度统计标度律、极端风险等领域。
---
## 一、新增 8 个分析模块
### 1. `microstructure.py` — 市场微观结构分析
**使用数据**: 1m, 3m, 5m
- Roll 价差估计(基于收盘价序列相关性)
- Corwin-Schultz 高低价价差估计
- Kyle's Lambda价格冲击系数
- Amihud 非流动性比率
- VPIN基于成交量同步的知情交易概率
- 图表: 价差时序、流动性热力图、VPIN 预警图
### 2. `intraday_patterns.py` — 日内模式分析
**使用数据**: 1m, 5m, 15m, 30m, 1h
- 日内成交量 U 型曲线(按小时/分钟聚合)
- 日内波动率微笑模式
- 亚洲/欧洲/美洲交易时段对比
- 日内收益率自相关结构
- 图表: 时段热力图、成交量/波动率日内模式、三时区对比
### 3. `scaling_laws.py` — 统计标度律分析
**使用数据**: 全部 15 个文件
- 波动率标度: σ(Δt) ∝ (Δt)^H拟合 H 指数
- Taylor 效应: |r|^q 的自相关衰减与 q 的关系
- 收益率聚合特性(正态化速度)
- Epps 效应(高频相关性衰减)
- 图表: 标度律拟合、Taylor 效应矩阵、正态性 vs 时间尺度
### 4. `multi_scale_vol.py` — 多尺度已实现波动率
**使用数据**: 5m, 15m, 30m, 1h, 2h, 4h, 6h, 8h, 12h, 1d
- 已实现波动率 (RV) 在各尺度上的计算
- 波动率签名图 (Volatility Signature Plot)
- HAR-RV 模型 (Corsi 2009) — 用 5m RV 预测日/周/月 RV
- 多尺度波动率溢出 (Diebold-Yilmaz)
- 图表: 签名图、HAR-RV 拟合、波动率溢出网络
### 5. `entropy_analysis.py` — 信息熵分析
**使用数据**: 1m, 5m, 15m, 1h, 4h, 1d
- Shannon 熵跨时间尺度比较
- 样本熵 (SampEn) / 近似熵 (ApEn)
- 排列熵 (Permutation Entropy) 多尺度
- 转移熵 (Transfer Entropy) — 时间尺度间信息流方向
- 图表: 熵 vs 时间尺度、滚动熵时序、信息流向图
### 6. `extreme_value.py` — 极端值与尾部风险
**使用数据**: 1h, 4h, 1d, 1w
- 广义极值分布 (GEV) 区组极大值拟合
- 广义 Pareto 分布 (GPD) 超阈值拟合
- 多尺度 VaR / CVaR 计算
- 尾部指数估计 (Hill estimator)
- 极端事件聚集检验
- 图表: 尾部拟合 QQ 图、VaR 回测、尾部指数时序
### 7. `cross_timeframe.py` — 跨时间尺度关联分析
**使用数据**: 5m, 15m, 1h, 4h, 1d, 1w
- 跨尺度收益率相关矩阵
- Lead-lag 领先/滞后关系检测
- 多尺度 Granger 因果检验
- 信息流方向(粗粒度 → 细粒度 or 反向?)
- 图表: 跨尺度相关热力图、领先滞后矩阵、信息流向图
### 8. `momentum_reversion.py` — 动量与均值回归多尺度检验
**使用数据**: 1m, 5m, 15m, 1h, 4h, 1d, 1w, 1mo
- 各尺度收益率自相关符号分析
- 方差比检验 (Lo-MacKinlay)
- 均值回归半衰期 (Ornstein-Uhlenbeck 拟合)
- 动量/反转盈利能力回测
- 图表: 方差比 vs 尺度、自相关衰减、策略 PnL 对比
---
## 二、增强 5 个现有模块
### 9. `fft_analysis.py` 增强
- 当前: 仅用 4h, 1d, 1w
- 扩展: 加入 1m, 5m, 15m, 30m, 1h, 2h, 6h, 8h, 12h, 3d, 1mo
- 新增: 全 15 尺度频谱瀑布图
### 10. `hurst_analysis.py` 增强
- 当前: 仅用 1h, 4h, 1d, 1w
- 扩展: 全部 15 个粒度的 Hurst 指数
- 新增: Hurst 指数 vs 时间尺度的标度关系图
### 11. `returns_analysis.py` 增强
- 当前: 仅用 1h, 4h, 1d, 1w
- 扩展: 加入 1m, 5m, 15m, 30m, 2h, 6h, 8h, 12h, 3d, 1mo
- 新增: 峰度/偏度 vs 时间尺度图,正态化收敛速度
### 12. `acf_analysis.py` 增强
- 当前: 仅用 1d
- 扩展: 加入 1h, 4h, 1w 的 ACF/PACF 多尺度对比
- 新增: 自相关衰减速度 vs 时间尺度
### 13. `volatility_analysis.py` 增强
- 当前: 仅用 1d
- 扩展: 加入 5m, 1h, 4h 的波动率聚集分析
- 新增: 波动率长记忆参数 d vs 时间尺度
---
## 三、main.py 更新
在 MODULE_REGISTRY 中注册全部 8 个新模块:
```python
("microstructure", ("市场微观结构", "microstructure", "run_microstructure_analysis", False)),
("intraday", ("日内模式分析", "intraday_patterns", "run_intraday_analysis", False)),
("scaling", ("统计标度律", "scaling_laws", "run_scaling_analysis", False)),
("multiscale_vol", ("多尺度波动率", "multi_scale_vol", "run_multiscale_vol_analysis", False)),
("entropy", ("信息熵分析", "entropy_analysis", "run_entropy_analysis", False)),
("extreme", ("极端值分析", "extreme_value", "run_extreme_value_analysis", False)),
("cross_tf", ("跨尺度关联", "cross_timeframe", "run_cross_timeframe_analysis", False)),
("momentum_rev", ("动量均值回归", "momentum_reversion", "run_momentum_reversion_analysis",False)),
```
---
## 四、实施策略
- 8 个新模块并行开发(各模块独立无依赖)
- 5 个模块增强并行开发
- 全部完成后更新 main.py 注册 + 运行全量测试
- 每个模块遵循现有 `run_xxx(df, output_dir) -> Dict` 签名
- 需要多尺度数据的模块内部调用 `load_klines(interval)` 自行加载
## 五、数据覆盖验证
| 数据文件 | 当前使用 | 扩展后使用 |
|---------|---------|----------|
| 1m | - | microstructure, intraday, scaling, momentum_rev, fft(增) |
| 3m | - | microstructure, scaling |
| 5m | - | microstructure, intraday, scaling, multi_scale_vol, entropy, cross_tf, momentum_rev, returns(增), volatility(增) |
| 15m | - | intraday, scaling, entropy, cross_tf, momentum_rev, returns(增) |
| 30m | - | intraday, scaling, multi_scale_vol, returns(增), fft(增) |
| 1h | hurst,returns,causality,calendar | +intraday, scaling, multi_scale_vol, entropy, cross_tf, momentum_rev, acf(增), volatility(增) |
| 2h | - | multi_scale_vol, scaling, fft(增), returns(增) |
| 4h | fft,hurst,returns | +multi_scale_vol, entropy, cross_tf, momentum_rev, acf(增), volatility(增), extreme |
| 6h | - | multi_scale_vol, scaling, fft(增), returns(增) |
| 8h | - | multi_scale_vol, scaling, fft(增), returns(增) |
| 12h | - | multi_scale_vol, scaling, fft(增), returns(增) |
| 1d | 全部17模块 | +所有新增模块 |
| 3d | - | scaling, fft(增), returns(增) |
| 1w | fft,hurst,returns | +extreme, cross_tf, momentum_rev, acf(增) |
| 1mo | - | momentum_rev, scaling, fft(增), returns(增) |
**结果: 全部 15 个数据文件 100% 覆盖使用**