所有文章
基于逐笔委托和逐笔成交数据构造高频因子
量化投资策略设计与分析的第一次作业是基于逐笔数据构造 39 个高频因子。我对高频因子的构造经验比较少,完成这个作业后的一些经验:
- 高频因子的数据格式是比较标准化的,但也要注意细节:例如空缺时间的填补等。
- 构造因子的过程本质上是数据处理的过程,常用的方法有:
groupby
、resample
、to_datetime
、reindex
、rolling
、apply
等。如果是非常大的数据集,应当用numpy
等更快速的科学计算包,或者用C++
。
39 个因子表达式
用提供的某支证券为期不超过一周的高频数据复制 Table A2 中 39 种指标。
基于 ChatGPT 的在线问答机器人
本文介绍了如何基于 OpenAI ChatGPT 接口和 feffery components 构建在线问答机器人,并基于 render
实现自动化持续部署。
它支持:
- 开启多轮对话模式,它将记住你之前的问题。
- 导出当前对话记录为 Markdown 文件,你可以将其保存到本地。
- 一键清空当前对话记录。
Typora 设置默认代码语言
在 Typora 中可以插入代码块,但每次都需要手动添加语言。若经常需要插入同一种语言的代码块,可以借助第三方的快捷键工具 AutoHotkey,自动设置代码块的语言,提高工作效率。
检验样本分布的正态性
在对数据进行处理前,有时需要判断数据是否呈正态分布。本文介绍了定量检验正态性的两种方法:Shapiro-Wilk test 和距离熵。
Shapiro-Wilk 检验正态性
VS Code 代码片段
许多常用的代码片段是重复、通用的,将它们记录并整理起来,在需要时可以方便地调用,可以大幅提高编码效率。
VS Code 代码片段功能是一个非常好用的功能,在保存代码片段后,只需输入几个前缀,即可自动生成代码片段。
利用 snippet-generator 这个工具自动生成代码片段,可以让整理代码片段的过程更高效!
LightGBM 的用法
LightGBM 是一种基于决策树的梯度提升机(GBM)算法,它是一种快速、准确的机器学习算法,可以用于分类和回归问题。
本文介绍了 LightGBM 的使用方法和代码示例,并记录了自定义损失函数、打印训练过程、迭代次数参数等问题的解决方法。