Experimental Evidence on Portfolio Size and Diversification: Human Biases in Naive Security Selection and Portfolio Construction

基本信息

作者: Don M. Chance, Andrei Shynkevich, Tung-Hsiao Yang
年份: 2011
期刊: The Financial Review, 46, 427-457
JEL: G11
关键词: diversification, portfolio size, human bias

一句话总结

通过202名MBA学生的课堂实验，证明"少量证券即可充分分散化"是大样本性质而非个体性质：人类朴素选择的组合不仅不能稳定地呈现指数递减的风险曲线，反而因熟悉度偏差和大盘股偏好导致分散化效果系统性差于随机选择。

研究问题

经典的Evans-Archer指数递减分散化关系（约10-30只股票即可消除大部分非系统性风险）究竟是单个投资者层面的稳健现象，还是仅在大量随机组合的平均意义上成立？当人类按"自由选择、不分析"的方式朴素选股时，组合风险与证券数量的关系会呈现怎样的形态？人类的系统性认知偏差是否会进一步恶化分散化效果？

核心贡献

方法论原创：首次用人类被试（而非随机数生成器）系统检验投资组合分散化中证券数量与风险的关系，并以匹配的随机组合作为对照分离"采样噪声"与"人类偏差"。
理论澄清：明确指出经典分散化结论是大样本现象（large-sample phenomenon），仅适用于大量组合的平均，单个投资者面临的是高度异质的曲线形态。
实证发现：约87%的个体组合曲线偏离主要指数递减模式；逐只添加股票时约34%的时间风险反而上升；约11%的被试在持有30只股票时风险高于持有1只股票时。
行为机制：人类组合的标准化方差和边际相关性始终高于随机组合，揭示熟悉度偏差、大盘股偏好和协方差忽视（covariation neglect）共同恶化了分散化效果。

维度1：实验设计分析

研究问题

"少量证券即可充分分散化"这一广为流传的金融学结论，是否适用于个体投资者？当人类（而非随机数生成器）朴素地选择证券时，投资组合的风险-证券数量关系是否仍呈现经典的指数递减模式？

被试信息

被试类型: MBA学生（四学期制项目的第二学期，一年级）
总人数: 202人（跨三年）
- 2006年：54人（60人中）
- 2007年：86人（90人中）
- 2008年：62人（62人中）
背景: 正在修核心公司金融课程，使用Brealey, Myers, and Allen (2007)教材第九版
激励机制: 课程作业评分（2006年可选，2007和2008年占350分中的15分）；仅要求按时提交即可获满分，无需分析

实验任务详细流程

第一步：课堂教学（前置知识）

学生在课堂上学习了投资组合风险与证券数量之间的指数递减关系
被告知将通过项目验证该关系是否成立于班级平均水平

第二步：股票选择任务

学生获得一个Excel电子表格，包含CRSP数据库中所有拥有过去五年月度收益率数据的股票
表格中约有4,000只股票，按字母顺序排列在下拉菜单中
表格仅显示股票名称的字母排列，不提供任何财务信息（无收益率、无风险指标、无行业分类）
学生被要求依次选择30只股票，不进行任何分析
明确指示不得合作，也不得进行任何分析

第三步：组合构建规则

等权重配置（1/n策略）
第1只股票构成1只股票组合，前2只构成2只股票组合，依此类推直到30只
每个组合规模（1到30）都计算月度标准差

第四步：对照组——随机数生成器

为每个被试匹配一个"虚拟随机投资者"
该虚拟投资者面临相同的股票池和相同的历史数据
使用随机数生成器从同一股票池中随机选择30只股票
共生成202个随机组合

第五步：分析维度

对每个被试的组合拟合指数递减回归： $s_p^2(n) = \alpha + \beta(1/n) + \varepsilon_n$
曲线形态分类（10种类型）
逐只添加股票时风险增加的频率
标准化方差（normalized variance）比较
边际证券与现有组合的相关性分析
重新排序测试（随机排序和反转排序）
价值加权 vs 等权重比较
性别差异比较

关键设计特征

特征	描述
朴素选择	被试仅凭名称选股，无任何财务信息
顺序选择	依次选择30只，每只加入顺序固定
无激励偏差	成绩仅基于是否提交，与组合表现无关
对照组	随机数生成器匹配，同一股票池
跨年重复	三年重复实验（2006-2008）

维度2：理论模型

核心理论基础

投资组合分散化的数学原理：

等权重组合的方差为：
$ $s_p(n)^2 = \frac{1}{n}\bar{s}_i^2 + \left(1 - \frac{1}{n}\right)\bar{s}_{ij}$ $

其中 $\bar{s}_i^2$ 为平均方差， $\bar{s}_{ij}$ 为平均协方差。当 $n \to \infty$ ，组合方差趋近于平均协方差 $\bar{s}_{ij}$ 。

关键理论批判：

上述经典结论是大样本性质（large-sample phenomenon）：它反映的是大量组合的平均风险，而非单个投资者的组合风险
当只有一个组合（如单个投资者），平均方差 $\bar{s}_i^2(n)$ 和平均协方差 $\bar{s}_{ij}(n)$ 都是 $n$ 的函数，不再是常数
大数定律不适用于单个投资者的小样本组合
因此，极限的一般性质无法保证对个体投资者成立

指数递减回归模型

s_p^2(n) = \alpha + \beta \left(\frac{1}{n}\right) + \varepsilon_n

$\alpha$ 代表证券数量趋于无穷时的渐近组合方差
$\beta$ 代表分散化的速度和幅度
对202个被试和202个随机组合分别估计

标准化方差（Normalized Variance）

\text{Normalized Variance} = \frac{\text{组合方差}}{\text{成分股平均方差}}

衡量相对分散化程度
低值表示分散化程度高
超额标准化方差 = 被试组合标准化方差相对于匹配随机组合的百分比差异

维度3：核心发现

发现1：总体平均符合经典模式，但个体差异巨大

总体平均：被试组合和随机组合均呈现经典的指数递减关系（Figure 1）
但约87%的个体曲线不符合经典的"主要指数递减"模式
- 主要指数递减（predominately exponential decline）：仅13.3%（27/202）
- 不规则指数递减：30.2%（61/202）
- 不规则凸形：12.9%
- 无趋势：12.9%
- 快速下降后无趋势：12.4%
- 上升趋势：4.5%

发现2：指数回归拟合效果

被试组合平均R^2 ≈ 50%（分布呈双峰：57个<20%，65个>80%）
随机组合平均R^2更高（90个>80%，仅47个<20%）
约1/4的被试组合beta为非正或不显著（42个不显著 + 7个显著为负）
总体合并回归R^2仅约17%（被试）和13%（随机），拟合很差

发现3：添加股票反而增加风险的惊人频率

平均而言，约34%的时间添加一只股票会增加被试组合风险
随机组合约31%的时间风险增加——仅略好于被试
30只股票组合比1只股票组合风险更高的概率：被试11%，随机11.4%（即每9个被试中有1个通过添加29只股票反而增加了风险）
最后5只股票（第26-30只）添加时，约40%的时间会增加风险（被试和随机均如此）
从5只扩展到30只，约23%的被试组合和约21%的随机组合风险增加

发现4：被试选择行为的系统性偏差

大盘股偏好：最常被选择的股票为Exxon Mobil(67次)、Wal-Mart(56次)、Apple(55次)等知名大公司
202位被试共选择6,060只股票（202 x 30），仅有1,713只唯一股票（可选约4,000只中的43%）
818只股票仅被选1次，327只被选2次
熟悉度偏差：频繁选择日常消费品品牌、当地雇主、校园招聘企业

发现5：被试组合分散化程度低于随机组合

标准化方差：被试组合在所有组合规模上均高于随机组合（Figure 3A）
超额标准化方差最高可达约25%（Figure 3B），随证券数量增加而增大
边际相关性：被试新添股票与现有组合的平均相关性（约0.21-0.39）始终高于随机组合（约0.15-0.35），差异约0.05-0.08（Table 6）
超过58%的时间，被试新添股票与现有组合的相关性高于随机组合对应值

发现6：重新排序的改善效果

反转排序（先加后选的股票）效果显著改善：
- R^2大幅提高（>60%），更多高R^2
- 从1只到30只风险增加的概率从11%降至仅8%
- 从25只到30只风险增加的概率从40%降至31%
说明被试先选的股票（熟悉的大盘股）反而不利于分散化，后选的股票分散化效果更好

发现7：价值加权优于等权重

价值加权组合在所有指标上均优于等权重：85.6% vs 75.7%有显著正beta
R^2>80%的比例更高（value-weighted更优）
原因：被试偏好的大盘低波动股票在价值加权下获得更大权重

发现8：性别差异不显著

女性构建的组合风险略低于男性，但分散化属性无明显差异
标准化方差和超额标准化方差几乎不可区分

维度6：与其他文献的关系

所属领域

行为金融 / 投资组合理论 / 实验金融

与经典文献的关系

文献	关系
Evans & Archer (1968)	开创性研究，发现约10只股票即可充分分散化；本文挑战该结论的个体适用性
Wagner & Lau (1971), Bloomfield et al. (1977)	后续验证指数递减关系；本文指出均为大样本结论
Statman (1987, 2004)	考虑交易成本后认为需30只左右；本文从人类偏差角度质疑
Elton & Gruber (1977)	推导样本偏离总体的风险；与本文发现的个体偏差直接相关
Goetzmann & Kumar (2008)	发现实际投资者分散化不足（仅5-10%持有超过10只股票）；本文提供实验证据解释原因

与行为偏差文献的关系

文献	关系
Barber & Odean (2008)	注意力驱动的股票选择；本文发现类似的熟悉度偏差
Huberman (2001)	熟悉度偏好导致的本地偏差；本文证实MBA学生也表现出类似偏差
Benartzi & Thaler (2001)	1/n启发式；本文采用等权重设计
Hedesstrom et al. (2006)	协方差忽视（covariation neglect）；本文发现被试选择高相关性股票
DeMiguel et al. (2007)	1/N策略的有效性；本文从分散化角度提供补充证据

核心贡献

**首次用人类被试（而非随机数生成器）**系统检验投资组合分散化的证券数量-风险关系
证明经典的"少量证券即可充分分散化"是大样本现象，不适用于大多数个体投资者
揭示人类的系统性偏差（熟悉度偏好、大盘股偏好、高相关性选择）进一步恶化了分散化效果
发现即使是随机选择也存在相当大的变异，纯随机组合也只是略优于人类朴素选择

方法论启示

课堂实验设计：利用课程作业进行大规模、跨年重复的自然实验
通过匹配随机对照组分离"采样噪声"和"人类偏差"两个因素的贡献
综合使用曲线分类、回归分析、逐只添加分析、标准化方差等多种方法

维度4：变量概览

变量类型	变量名	定义/测量
处理变量	证券数量 n	1, 2, ..., 30（顺序加入的等权重组合规模）
处理变量	选股主体	人类被试 vs 匹配的随机数生成器
处理变量	排序方式	原始顺序、随机重排、反转顺序
处理变量	加权方式	等权重 (1/n) vs 价值加权
主要结果变量	组合月度方差 $s_p^2(n)$	用2001-2005年五年月度CRSP收益率计算
主要结果变量	标准化方差	组合方差 / 成分股平均方差
主要结果变量	超额标准化方差	被试组合标准化方差相对匹配随机组合的百分比差异
主要结果变量	边际相关性	新加入股票与已有 n−1 股组合的相关系数
拟合统计量	$\beta$ 、 $R^2$	来自 $s_p^2(n)=\alpha+\beta(1/n)+\varepsilon$ 回归
行为统计量	添加股票导致风险上升的频率	沿 n=1→30 路径上风险递增的次数比例
异质性变量	性别	比较男女被试的组合属性
数据来源	股票池	CRSP数据库中拥有2001-2005年完整月度收益率的全部股票（约4,000只）

维度5：局限性

被试样本特殊：MBA一年级学生，虽具金融知识但非真实投资者，激励为课程作业（仅按时提交即可），无金钱激励，可能与真实账户中的选股行为有差异。
信息环境受限：电子表格仅显示股票名称的字母排序，不提供任何财务数据，与现实投资者使用Yahoo Finance、券商研究报告等信息环境差异极大；这种"极致朴素"设计虽便于识别认知偏差，但可能高估熟悉度依赖。
样本期单一：仅用2001-2005年五年历史月度收益率计算事后方差，未做事前/事后区分，且时段包含科技泡沫余波，结论对其他市场状态的外推性受限。
顺序选择限制：要求依次选择30只构成嵌套组合，与现实中可能一次性构建组合的情境不同；反转排序结果显示顺序敏感。
等权重假设：主分析使用1/n等权重，虽对应Benartzi-Thaler朴素分散化，但忽略了真实投资者按金额或风险预算分配的可能性。
未识别个体异质性来源：未收集被试的金融素养、投资经验、性格特征等数据，无法解释为何部分被试呈现接近经典模式的曲线。
缺乏机制实验：未引入信息提示、行业分类提示等干预，无法直接因果识别"提供信息能否纠正偏差"。

维度7：可拓展的研究方向

激励变更：用真实金钱激励或长期投资模拟重新检验，看金钱激励能否改善分散化。
信息干预：随机提供行业分类、相关系数矩阵或夏普比率提示，识别哪种信息最能纠正人类偏差。
金融素养异质性：对比金融专业学生、注册理财师与一般大众，估计金融教育的纠偏效应。
协方差忽视的微观机制：用眼动追踪或鼠标追踪记录被试在选股时是否查看相关性信息，将协方差忽视具体化。
跨国/跨文化复制：在熟悉度偏差程度不同的市场（如中国、欧洲）复制实验，看本土偏差与大盘偏好的相对重要性。
与市场数据结合：结合券商真实账户数据（如Barber_Odean_1998_IndividualInvestors_Performance所用），将实验中的偏差量化映射到现实组合的福利损失。
算法辅助选股：检验robo-advisor提示或ETF引导能否减少朴素选择的分散化损失。
顺序与框架效应：实验性操纵选股顺序、组合规模上限、是否允许撤回，识别程序性框架对最终组合的影响。

关键结论

经典的"指数递减分散化"是大量组合的平均性质，对单个投资者并不稳健：约87%的个体组合曲线偏离主要指数递减形态，约1/4被试的回归 $\beta$ 不显著或为负。
添加股票并不必然降低风险：被试组合中约34%的添加导致风险上升；约11%的被试在30只股票时的风险高于1只股票时；最后5只股票的添加约40%的时间增加风险。
人类朴素选择系统性差于随机选择：被试组合的标准化方差和边际相关性始终高于匹配的随机组合，超额标准化方差最高可达约25%；超过58%的时间被试新加入股票与现有组合的相关性高于随机基准。
偏差的具体来源是熟悉度偏好与大盘股偏好：202名被试共选6,060只股票却只覆盖1,713只独立股票，最常被选的Exxon Mobil、Wal-Mart、Apple等均为知名大盘股，导致组合内股票同质性高、协方差大。
反转排序和价值加权能显著改善组合属性，提示被试早期选择的股票（最熟悉的）反而是分散化最差的。

Chance_2011_PortfolioSize_Diversification

Experimental Evidence on Portfolio Size and Diversification: Human Biases in Naive Security Selection and Portfolio Construction

基本信息

一句话总结

研究问题

核心贡献

维度1：实验设计分析

研究问题

被试信息

实验任务详细流程

关键设计特征

维度2：理论模型

核心理论基础

指数递减回归模型

标准化方差（Normalized Variance）

维度3：核心发现

发现1：总体平均符合经典模式，但个体差异巨大

发现2：指数回归拟合效果

发现3：添加股票反而增加风险的惊人频率

发现4：被试选择行为的系统性偏差

发现5：被试组合分散化程度低于随机组合

发现6：重新排序的改善效果

发现7：价值加权优于等权重

发现8：性别差异不显著

维度6：与其他文献的关系

所属领域

与经典文献的关系

与行为偏差文献的关系

核心贡献

方法论启示

维度4：变量概览

维度5：局限性

维度7：可拓展的研究方向

标签

关键结论

🔗 链接到这篇笔记