1.9 重叠因子:中点价格(MidPoint over period, MIDPOINT)概念与Python实战
目录
- 0. 本栏目因子汇总表
- 1. 因子简述
- 2. 因子计算逻辑
- 3. 因子应用场景
- 4. 因子优缺点
- 5. 因子代码实现
- 6. 因子取值范围及其含义
- 7. 因子函数参数建议
0. 本栏目因子汇总表
【量海航行】
1. 因子简述
中点价格(MidPoint over period, MIDPOINT)是一种简单但有效的技术指标,它计算指定周期内最高价和最低价的中间值。这种方法可以帮助平滑价格波动,提供一个更稳定的价格参考水平。MIDPOINT通过消除极端价格的影响,反映了一段时期内的价格中枢。
2. 因子计算逻辑
MIDPOINT的计算公式如下:
M I D P O I N T t = m a x ( C l o s e t − n + 1 : t ) + m i n ( C l o s e t − n + 1 : t ) 2 M I D P O I N T f a c t o r = C l o s e − M I D P O I N T σ n ( C l o s e ) \begin{align*} MIDPOINT_t &= \frac{max(Close_{t-n+1:t}) + min(Close_{t-n+1:t})}{2} \\ MIDPOINT_{factor} &= \frac{Close - MIDPOINT}{\sigma_n(Close)} \end{align*} MIDPOINTtMIDPOINTfactor=2max(Closet−n+1:t)+min(Closet−n+1:t)=σn(Close)Close−MIDPOINT
其中:
- n为计算周期
- Close_{t-n+1:t}表示从t-n+1到t时刻的收盘价序列
- σ_n(Close)为n周期收盘价的滚动标准差
3. 因子应用场景
-
价格中枢判断:
- 识别价格运行的中心位置
- 判断价格偏离程度
-
趋势跟踪:
- 价格上穿MIDPOINT,看多信号
- 价格下穿MIDPOINT,看空信号
-
支撑阻力参考:
- MIDPOINT作为动态支撑位
- MIDPOINT作为动态阻力位
-
波动分析:
- 价格与MIDPOINT的距离反映波动强度
- 用于判断市场情绪变化
4. 因子优缺点
优点:
- 计算简单:实现容易,计算量小
- 直观明确:易于理解和使用
- 平滑特性:能有效过滤价格噪音
- 稳定性好:不易受极端值影响
缺点:
- 滞后性强:作为回溯性指标存在延迟
- 信号单一:仅提供价格中枢信息
- 参数依赖:周期选择影响指标效果
- 适用性限:在剧烈波动市场效果欠佳
5. 因子代码实现
def MIDPOINT_factor(df, n=14):
"""
计算中点价格(MIDPOINT)因子
参数:
df (DataFrame): 输入数据
- code: 证券代码,如'600036.SH'
- date: 日期,格式为'YYYY-MM-DD'
- close: 收盘价
n (int): 计算周期,默认14
返回:
DataFrame: 包含原有列和MIDPOINT因子值,理论取值范围(-∞,+∞),实际大多在[-3,3]之间
注意:
1. 返回数据包含所有输入列
2. 新增MIDPOINT列为因子值
3. date列保持原有字符串格式'YYYY-MM-DD'
4. 数据将按code分组、date倒序排列
"""
import numpy as np
import pandas as pd
# 创建副本避免修改原始数据
df_copy = df.copy()
# 检查code格式
valid_codes = df_copy['code'].str.match(r'^(?:\d{6}\.(SH|SZ)|[A-Z]+/[A-Z]+|\w+\.(IB|CFE|US))$')
if not valid_codes.all():
raise ValueError("Invalid code format found")
# 检查date格式
valid_dates = df_copy['date'].str.match(r'^\d{4}-\d{2}-\d{2}$')
if not valid_dates.all():
raise ValueError("Invalid date format found, expected 'YYYY-MM-DD'")
# 排序(使用字符串比较)
df_copy = df_copy.sort_values(['code', 'date'], ascending=[True, False])
# 按code分组计算
def calculate_midpoint(group):
# 计算n周期内的最高价和最低价的中点
close = group['close'].values
midpoint = np.zeros_like(close)
for i in range(len(close)):
if i < n:
window = close[:i+1]
else:
window = close[i-n+1:i+1]
midpoint[i] = (np.max(window) + np.min(window)) / 2
# 计算n周期滚动标准差
rolling_std = group['close'].rolling(window=n).std()
# 计算因子值:使用滚动标准差标准化的价格偏离度
# 处理标准差为0的情况
group['MIDPOINT'] = np.where(
rolling_std != 0,
(group['close'] - midpoint) / rolling_std,
0
)
return group
df_copy = df_copy.groupby('code', group_keys=False).apply(calculate_midpoint)
# 按照最终要求重新排序并重置索引
df_copy = df_copy.sort_values(['code', 'date'], ascending=[True, False]).reset_index(drop=True)
return df_copy
测试数据:
6. 因子取值范围及其含义
MIDPOINT因子的取值范围理论上是(-∞,+∞),但实际上大多数值会落在[-3,3]区间内:
- 取值 > 2:表示价格显著高于中点价格(超过2个标准差),强烈超买信号
- 取值在(1,2]之间:表示价格高于中点价格一个标准差以上,偏多信号
- 取值在[-1,1]之间:表示价格在中点价格一个标准差范围内波动,震荡区间
- 取值在[-2,-1)之间:表示价格低于中点价格一个标准差以上,偏空信号
- 取值 < -2:表示价格显著低于中点价格(超过2个标准差),强烈超卖信号
7. 因子函数参数建议
- n (计算周期):
- 默认值:14
- 建议范围:[5, 30]
- 参数说明:决定中点价格的计算范围和平滑程度
- 选择建议:
- 日线数据建议使用:
- 短期:5-10天
- 中期:10-20天
- 长期:20-30天
- 小时线数据建议使用8-16
- 分钟线数据建议使用5-10
- 高波动市场使用较短周期
- 低波动市场使用较长周期
- 日线数据建议使用: