跳转至

模块2:数据获取与处理

数据是量化交易的原材料。不论你的模型多么先进,如果输入的是“垃圾数据”(Garbage In),输出的一定是“垃圾策略”(Garbage Out)。本模块教你如何获取高质量的本土及全球数据,并处理各种现实世界中的数据坑。

📓 课程目录

文件序号 内容说明
01_data_sources.ipynb 利用 yfinance 等主流工具获取价格、财务和宏观数据
02_data_cleaning.ipynb 缺失值处理、前向填充、异常值检测(3-sigma)与价格复权对齐
03_feature_engineering.ipynb 结合平稳性与滚动标准化,从 OHLCV 构建机器学习可用的滞后特征

⚠️ 避坑指南

  1. 永远不要使用未复权的价格计算长期收益率。
  2. 特征工程中严禁使用“未来函数”(Look-ahead Bias),全局标准化是新手最容易犯的错误之一。