Investor Behavior Under the Law of Small Numbers

元数据

作者: Cameron Peng
机构: Yale University, School of Management
年份: 2017 (Working Paper)
来源: Working Paper
关键词: law of small numbers, gambler's fallacy, hot-hand fallacy, disposition effect, extrapolation, investor heterogeneity, V-shaped selling propensity
数据: 美国大型折扣经纪商1991-1996年个人投资者交易记录; CRSP股票价格与收益数据

一句话总结

本文以"小数定律"（law of small numbers）为统一心理机制，通过外推视野参数 θ 的异质性，将看似矛盾的三种投资者行为——买入端的趋势追随、卖出端的处置效应、V 型卖出倾向——纳入单一信念形成框架，并以 1991–1996 年大型折扣经纪商个人交易数据系统验证模型五个预测。

研究问题

为什么个人投资者在买入端追逐长期赢家但短期反向？
为什么处置效应同时存在又异质（不同投资者展现不同方向）？
V 型卖出倾向（既倾向卖出大赢家也倾向卖出大输家）能否由单一心理机制统一解释？
投资者异质性能否被一个单维参数（外推视野 θ）所刻画？
θ 是否随经验、财富、时间系统变化？高 θ 投资者表现是否更好？

核心贡献

统一框架： 首次用小数定律一个心理机制同时解释趋势追随、短期反向、处置效应、V 型卖出四个程式化事实
关键参数 θ： 提出"外推视野" θ 作为投资者异质性的唯一维度，并给出基于初始买入方向的经验测度
加总 vs 个体： 论证 V 型卖出倾向本质上是加总现象——由低 θ（外推型）卖大输家与高 θ（均值回归型）卖大赢家叠加而成
持有期结构： 首次系统刻画处置效应随持有期的演化模式，并发现该模式随 θ 反向（高 θ 持有期长则减弱、低 θ 持有期长则加强）
替代理论排除： 通过追加买入和卖出端证据排除有限注意；通过初始买入估计信念排除实现效用与排名效应的混淆

维度1：数据来源与实证策略

理论建模

信念形成过程建模: 基于"小数定律"(law of small numbers)构建投资者信念形成的简约模型。核心假设是投资者错误地认为随机误差项之间存在负自相关(即小样本应快速收敛至总体特征)
模拟练习: 设定两类投资者(高theta与低theta)在含交易成本的单一股票市场中交易40,000期,验证模型能否再现已知的交易现象
参数校准: 每期代表一个月; 外推视野N=36个月; 交易成本c=0.02, 额外搜索成本s=0.03; 均值回归参数rho_bar=0.4

实证检验

数据来源: 大型折扣经纪商的个人交易记录(1991-1996年),同一数据集曾被Odean (1998)、Barber and Odean (2000)等广泛使用
交易分类: 将交易分为三类 -- 初始买入(initial buy)、追加买入(additional buy)和卖出(sell)
theta的经验测度: 通过观察投资者初始买入行为来估计其外推视野theta。将每笔初始买入分类为"高theta买入"或"低theta买入"(基于最近一个月收益与前35个月平均收益的偏差方向),然后计算价值加权平均
排序法(Sorting approach): 将投资者按theta分为5组,比较各组的处置效应(PGR、PLR)、卖出倾向等指标
持有期分析: 考察不同持有期下处置效应的变化规律

关键实证策略

通过初始买入(而非追加买入)来估计信念,以避免实现效用(realization utility)和排名效应(rank effect)等替代理论的干扰
使用追加买入和卖出的证据来排除有限注意(limited attention)的替代解释

维度2：理论框架

核心信念形成方程

预测方程 (Equation 1):
$ $E_t[r_{t+1}] = \mu_t + \bar{\rho}(\mu_t - r_t)$ $

其中:

$\mu_t$ 为从过去收益估计的均值收益（外推项）
$r_t$ 为最近一期收益
$\bar{\rho} \in (0,1)$ 衡量赌徒谬误的程度（均值回归信念的强度）
$\bar{\rho}(\mu_t - r_t)$ 项反映对短期偏离的均值回归预期

外推项的指数加权形式 (Equation 2):
$ $\mu_t = \sum_{i=t-N+1}^{t} \left(\frac{\theta^{t-i}}{\sum_{i=t-N+1}^{t} \theta^{t-i}} r_i\right) \equiv \sum_{i=t-N+1}^{t} w_i r_i$ $

其中:

$\theta \in (0,1]$ 为外推视野参数
$\theta$ 越小,投资者越多地将权重放在近期收益上（外推型信念主导）
$\theta$ 越大(接近1),权重分布越均匀（均值回归信念主导）

展开形式 (Equation 3):
$ $E_t[r_{t+1}] = (1+\bar{\rho})\sum_{i=t-N+1}^{t-1} w_i r_i + (w_t(1+\bar{\rho}) - \bar{\rho}) r_t$ $

关键洞察: 对历史收益 $r_{t-N+1}$ 到 $r_{t-1}$ 的系数始终为正(所有投资者都倾向于购买过去表现好的股票); 但对最近收益 $r_t$ 的系数取决于theta:

低theta: $w_t(1+\bar{\rho}) - \bar{\rho} > 0$ （正系数,外推型,追涨）
高theta: $w_t(1+\bar{\rho}) - \bar{\rho} < 0$ （负系数,均值回归型,逆向）

小数定律的微观基础

股票收益: $r_t = \mu + \epsilon_t$ ，其中 $\epsilon_t \sim N(0, \sigma_\epsilon^2)$ i.i.d.

LSN投资者错误地认为: $\epsilon_{t+1} = -\bar{\rho}\epsilon_t + \omega_{t+1}$ ，其中 $\omega_{t+1} \sim N(0, \sigma_\omega^2)$ , $\sigma_\omega^2 = \frac{\sigma_\epsilon^2}{1-\bar{\rho}^2}$

theta的经验估计 (Equation 4)

\theta_j = \frac{V_j^H}{V_j} \times \theta^H + \frac{V_j^L}{V_j} \times \theta^L

其中 $V_j^H$ ( $V_j^L$ )为投资者j的高theta(低theta)初始买入总交易金额

处置效应度量 (Equations 5-6)

PGR = \frac{\text{Realized Gains}}{\text{Realized Gains} + \text{Paper Gains}}

PLR = \frac{\text{Realized Losses}}{\text{Realized Losses} + \text{Paper Losses}}

处置效应 = $PGR - PLR$ 或 $PGR/PLR$

维度3：核心发现

模型的统一解释力

追随长期趋势与逆向短期趋势的统一: 小数定律同时产生对远期收益的外推信念和对近期收益的均值回归信念。投资者倾向于买入过去2-3年表现好但最近一个月表现差的股票。实证数据证实:初始买入前36个月至3个月的中位收益维持在1%以上,但最近一个月急剧下降甚至转负
处置效应的信念解释: 高theta投资者受均值回归信念驱动,倾向于卖出近期赢家(预期其将下跌),表现出正的处置效应。低theta投资者受外推信念驱动,倾向于卖出近期输家,表现出负的处置效应。总体上高theta投资者占多数,因此总体呈现正的处置效应
V型卖出倾向: 是一个加总现象而非个体行为 -- 高theta投资者驱动大赢家的卖出,低theta投资者驱动大输家的卖出,两者合力形成V型

五个模型预测及实证验证

预测	内容	实证结果
预测1	交易日前收益的方差在临近交易日时上升	已证实: 最近一个月的标准差几乎是前期平均水平的两倍,对初始买入、追加买入和卖出三类交易均成立
预测2	处置效应程度随theta递增	已证实: 从Group 1(theta=0.60)到Group 5(theta=0.94), PGR-PLR和PGR/PLR单调递增
预测3	高theta投资者的处置效应随持有期减弱,低theta反之	已证实: Group 5持有<30天的PGR/PLR=4.2, 持有>720天降至1.6; Group 1则从0.9升至1.3以上
预测4	总体卖出倾向对近期收益呈V型	已证实: 卖出概率在亏损区递减、在盈利区递增
预测5	高theta投资者的卖出倾向随近期收益递增,低theta递减	已证实: Group 5在盈利区卖出概率急剧上升; Group 1在亏损区单调递减

theta的横截面和时序特征

横截面: theta与投资经验、权益价值正相关(更有经验和更富裕的投资者有更长的外推视野)
时序: 同一投资者的theta随时间缓慢增长(theta_2 > theta_1)
投资绩效: 高theta投资者买入的股票短期表现更好,但卖出的股票也在长期表现更好(存在更高的机会成本)

维度6：与其他文献的关系

理论根基

小数定律: Tversky & Kahneman (1971) 提出; Rabin (2002) 正式建模; Rabin & Vayanos (2010) 从赌徒谬误推导出热手谬误
外推与经验效应: Barberis et al. (2015, 2016) X-CAPM外推模型; Malmendier & Nagel (2011) 经验效应; Cassella & Gulen (2015) 外推偏差

解释的现有现象

趋势追随: Odean (1999); Barber et al. (2009) 个人投资者买入过去表现好的股票
短期逆向: Kaniel et al. (2008) 个人投资者在短期买入下跌股票
处置效应: Shefrin & Statman (1985) 首次记录; Odean (1998) 系统性证据
V型卖出倾向: Ben-David & Hirshleifer (2012) 首次记录投资者更倾向于卖出大赢家和大输家

与替代理论的关系

偏好理论: Barberis & Xiong (2012) 实现效用; Ingersoll & Jin (2013) 参照依赖偏好 -- 主要解释卖出行为,难以同时解释买入行为
认知偏差: Chang et al. (2016) 认知失调 -- 本文提供了基于信念的替代/互补解释
注意力: Barber & Odean (2008) 有限注意理论可解释初始买入的收益方差上升,但无法解释追加买入和卖出的类似模式

本文独特贡献

统一框架: 首次用单一心理机制(小数定律)同时解释买入端的趋势追随、卖出端的处置效应和V型卖出倾向三个看似矛盾的现象
投资者异质性: 强调外推视野(theta)的异质性是理解个体差异的关键,而非简单的理性/非理性二分
加总vs.个体: 揭示V型卖出倾向本质上是加总现象,由两组不同投资者分别驱动
处置效应的动态结构: 首次系统性地建立处置效应与持有期之间的关系,并提供实证支持

维度4：关键变量概览

类别	变量	含义/构造
核心信念参数	θ ∈ (0,1]	外推视野；越小则越重视近期收益
核心信念参数	$\bar{\rho}$ ∈ (0,1)	均值回归（赌徒谬误）信念强度
信念变量	$\mu_t$	过去 N 期收益的指数加权均值
信念变量	$E_t[r_{t+1}]$	投资者对下一期收益的主观预期
交易变量	initial buy / additional buy / sell	三类交易（用于身份识别与稳健检验）
θ 的经验测度	$V_j^H, V_j^L$	投资者 j 的高/低 θ 类型初始买入金额
θ 的经验测度	"高 θ 买入"	最近一月收益高于前 35 个月平均
θ 的经验测度	"低 θ 买入"	最近一月收益低于前 35 个月平均
处置效应	PGR	Realized Gains / (Realized + Paper Gains)
处置效应	PLR	Realized Losses / (Realized + Paper Losses)
处置效应	PGR − PLR / PGR / PLR	两种处置效应度量
行为度量	卖出概率	给定持有股票当日卖出的条件概率
持有期	<30, 30–90, 90–180, 180–360, 360–720, >720 天	用于动态结构分析
股票特征	$r_t$ （最近一月收益）、过去 36 个月收益	信号变量
投资者特征	投资经验、权益市值、账户规模	与 θ 的横截面相关分析
绩效	买入/卖出后 1–12 个月超额收益	评估 θ 与投资能力的关系
数据来源	折扣经纪商交易记录 1991–1996 + CRSP	Odean (1998) 同源数据

维度5：局限性

数据时点： 1991–1996 年单一国家、单一经纪商样本，外推到当前以及国际市场需谨慎
理性投资者比较缺失： 模型假设所有投资者均持小数定律信念，未与理性贝叶斯学习者对比识别
θ 的内生性： θ 由投资者的初始买入方向反推，可能混入流动性需求、税收、组合再平衡等其他动机
信念未直接观测： 全部基于交易行为反推信念，未结合调查/实验信念数据交叉验证
均值回归参数 $\bar{\rho}$ 校准： 用单一外生值（0.4），未估计或允许个体异质
追加买入与初始买入的区分： 实证识别策略依赖能区分两类买入，但实践中可能含噪
横截面 θ 测量精度： 部分投资者交易次数少，θ 估计不稳定
遗漏宏观状态依赖： 牛/熊市、波动率体制可能内生地改变 θ，未纳入模型
单股票模拟： 模拟仅校准单一股票市场，多资产组合下的预测有待扩展
未识别 LSN 的来源： 是过度依赖代表性启发式、记忆混淆，还是文化习得？模型不区分

维度6：与其他文献的关系（双链）

Barberis_2015_XCAPM_Extrapolative：外推预期资产定价模型，与本文 θ 异质性互补
Barber_Odean_1998_IndividualInvestors_Performance：本文所用同一数据集的早期分析
BenDavid_2012_RealizingLosses_TradingResponses：V 型卖出倾向的首次记录
Frydman_Nave_2017_ExtrapolativeBeliefs_Perceptual_Economic：外推性信念的实验证据
AssetPricing_2022_ReturnExtrapolation：收益外推的资产定价框架
Hartzmark_Hirshman_2021_Ownership_Learning_Beliefs：所有权与学习对信念的影响
Grosshans_Zeisberger_2025_InvestorBeliefs_TradingActions：投资者信念与交易行为的实验证据
Adam_Marcet_2016_StockMarketVolatility_Learning：学习与股市波动率
Brunnermeier_2007_OptimalBeliefs_SkewedReturns：最优信念与偏态收益
Malmendier_Tate_Overconfidence_EarlyLife：早期经历对信念的影响（与 θ 随经验变化呼应）
Adaptive_2010_Adaptive_Behavior_Leads_Under：适应性行为
Meeuwis_BeliefDisagreement_PortfolioChoice：信念分歧与组合选择
Charness_2017_ConfirmationBias_MotivatedBeliefs：信念偏差与动机性
Coutts_2019_GoodNewsBadNews_BeliefUpdating：好/坏消息更新的不对称
Enke_Zimmermann_2019_CorrelationNeglect_BeliefFormation：信念形成中的相关性忽视

维度7：可拓展的研究方向

结合调查信念数据： 用 Vanguard/Robinhood/Schwab 调查中投资者预期与交易记录联合检验 θ 的有效性
多资产/组合扩展： 将单股票 LSN 模型推广至跨资产相关结构、组合再平衡决策
市场波动率/状态依赖： 在牛市、熊市、高波动率体制中分别估计 θ，检验状态依赖性
机构投资者的 θ： 对比共同基金、对冲基金、HFT 的 θ，检验"专业 = 高 θ"假设
均衡价格含义： 将 θ 异质投资者放入均衡定价模型，研究对动量、反转因子的解释力
教育干预： 实验设计教 LSN 投资者识别"小样本误差"，看 θ 能否被矫正
机器学习与 θ： 用机器学习从交易序列中预测个人投资者 θ，构建实时风险画像
跨文化比较： θ 分布在不同文化（美国、中国、欧洲）是否存在系统差异
加密货币与 NFT 市场： 高频/高波动市场中 θ 是否更小？V 型卖出是否更显著
退休/养老账户： 长持有期账户中 θ 高的投资者是否绩效更好
结合记忆机制： 将 LSN 与情景记忆（episodic memory）模型结合，给出 θ 的认知微观基础
政策含义： 如何在监管/默认设置中减弱 LSN 偏差对长期财富的损害

关键结论

小数定律的双向预测： LSN 同时产生对长期收益的外推信念（追长期赢家）与对近期收益的均值回归信念（卖近期赢家），统一了买入端追涨与卖出端处置效应
θ 异质性是关键： 单一外推视野参数 θ 区分两类投资者——高 θ（均值回归型，处置效应正方向）与低 θ（外推型，处置效应负方向），无需假设非理性程度差异
V 型卖出是加总现象： 高 θ 投资者驱动卖大赢家、低 θ 驱动卖大输家，两端叠加形成总体 V 型，个体层面并无 V 型
持有期的反向效应： 高 θ 处置效应随持有期减弱（信念修正），低 θ 处置效应随持有期增强；预测得到数据支持
θ 的横截面与时序： θ 与投资经验、权益市值正相关；同一投资者 θ 随时间缓慢上升，提示外推视野可习得
绩效含义： 高 θ 投资者短期买入表现较好，但卖出的股票长期表现也好，机会成本未必低
方法论启示： 通过初始买入识别信念可避开实现效用、排名效应、有限注意等替代解释；为信念—行为映射提供干净识别策略
政策含义： 帮助投资者认识并扩大其外推视野（如展示更长收益历史）可能减弱 LSN 偏差及其交易代价

Peng_2017_SmallNumbers_InvestorBehavior