Adaptive behavior leads to under-diversification

Ben Zion, Erev, Haruvy & Shavit (2010), Journal of Economic Psychology

摘要

In a given period, a diversified fund, by virtue of being a weighted average, will perform somewhere in the middle range of its components' respective performances. This means that adaptive investors who look to the past to adjust expectations about future returns will shun diversified funds. That is, adaptive reaction to feedback implies under-diversification when the investor gets complete feedback on the performance of the diversified fund as well as its components in a given period. Three laboratory experiments and one quasi field experiment explore this possibility and its implications. We find that the availability of complete feedback drastically reduces diversification. Under-diversification is observed even when the decision makers receive a complete description of the payoff distributions and when under-diversification lowers expected return.

一句话总结

完整反馈（complete feedback）下投资者根据过去回报"追涨"，但分散化资产作为加权平均永远不会是单期"赢家"，因此追涨策略机械性地导致欠分散化——本文用三个实验室实验和一个准实地实验（Vanguard 基金）证明这一现象稳健存在，即使被试被完整告知收益分布且分散化能提高期望收益。

研究问题

为何投资者普遍表现出欠分散化（under-diversification），违反 Markowitz 投资组合理论？本文提出一个简洁的行为机制：当投资者获得所有备选资产的完整反馈并采用"对过去最佳回应"（best reply to the past）的适应性策略时，分散化资产作为成分资产的加权平均，永远不会在单期内成为最高回报者，因而被适应性学习者系统性地回避。这一机制是否能在不同的反馈结构、信息条件下稳健地复制？

核心贡献

理论机制：将欠分散化与适应性学习（fictitious play、normalized fictitious play）严格联系起来，证明完整反馈+追涨策略的组合机械性地排除分散化资产，因为加权平均永远不可能超过其成分的最大值
反馈结构的关键作用：通过 full vs. limited feedback 的实验对比，定量展示反馈结构如何反转分散化决策——完整反馈下分散化资产被显著低配，受限反馈下因 hot stove effect 反而过配
极端稳健性：实验3 在被试被告知完整收益分布、强调分散化资产严格占优的条件下，欠分散化仍然出现且随经验加剧，说明该效应不依赖于先验不确定性
实地验证：实验4 在为期30天的真实 Vanguard 基金选择中复制了核心模式（Pacific Index Fund 在 full feedback 下需求显著更高）

维度1：实验设计分析

整体设计

四个实验共同构成一个稳健性递进的设计：实验1（U₀, 等期望条件）→ 实验2（U₂, 分散化资产期望最高）→ 实验3（N5, 完整描述+涉及损失）→ 实验4（30天 Vanguard 真实基金准实地实验）。所有实验的核心操纵都是 full feedback vs. limited feedback 的被试间设计。

实验 1：U₀ 条件下的 100 期重复投资

被试与场景

40 名以色列某主要大学的本科自愿被试，已修过至少一门统计学课程
实验在计算机实验室进行，约 30 分钟
平均最终支付：25 NIS（约 $5），兑换率为 200 tokens = 1 NIS

逐步流程（被试视角的完整时间线）

进入实验室与说明：被试拿到书面说明书（Appendix B）。说明告知有 100 轮、每轮投资 100 tokens 于 A、B、M 三个资产之一，资产收益来自未知分布，单轮利润 = 收益率 × 100 tokens
资产结构（被试不知道具体公式，仅知道有三个资产）：
- Asset A 收益 = u（u 服从 U[0, 1]）
- Asset B 收益 = 0.75 - u/2 + ε（ε 服从 U[-0.05, 0.05]）
- Asset M 收益 = (A + B)/2 + c（U₀ 条件下 c = 0）
- A 与 B 期望收益相同且负相关，M 是分散化基金
10 轮练习：在正式实验前进行 10 轮练习（不计入支付）
每一轮的具体操作：
- 屏幕显示三个资产 A、B、C 的按钮（注：原文说明书中用 A/B/C 标签，对应分析时的 A/B/M）
- 被试点击一个资产投入全部 100 tokens（不能拆分到多个资产）
- 系统显示反馈表格，包含：本轮利润 (NIS)、100 tokens 投资的收益、收益率、投资额（详见说明书 Appendix B 表格）
- 完整反馈条件（n=20）：表格显示所有三个资产的本轮收益
- 受限反馈条件（n=20）：表格只显示所选资产的本轮收益
- 显示累计利润后进入下一轮
不能再投资（cannot reinvest）—— 每轮独立 100 tokens
支付：累计 tokens × 1/200 NIS

实验 2：U₂ 条件（分散化资产期望最高）

40 名新被试，与实验1 同样流程，唯一区别是 c = 0.02（M 资产的期望收益严格高于 A 和 B）
这一改动测试：当理性选择应该是 M 时，反馈操纵是否仍然产生欠分散化

实验 3：完整描述 + 损失情境（N5 条件）

被试与变化

30 名新本科被试
关键变化（设计意图：排除信息不对称解释）：
1. 说明书（Appendix B）口头和表格地告知收益分布，强调资产间相关性，并明确指出 M 资产每期收益严格高于 A、B 平均值
2. 允许负收益（损失），可触发损失厌恶
3. 仅运行完整反馈条件（feedback 在描述完整时不提供新信息，理性者应忽略）
4. 随机一轮支付：实验结束后随机抽 1 轮的收益作为支付（外加 30 NIS 出场费），消除累积财富效应
5. 取消练习轮

资产结构（被试明确知道）

每轮系统抽取 X ~ N(0, 300²)，Y ~ N(0, 10²)
Asset A 收益 = 4X
Asset B 收益 = 2Y - 2X
Asset C 收益 = X + Y + 5（说明书显式指出：C = (A+B)/2 + 5 agorot，是 A、B 平均值加上一个 0.05 NIS 溢价）

单轮流程

Step A：被试按钮选择资产
Step B：屏幕显示该轮三个资产的所有收益
不累积（earnings are not cumulative）
进入下一轮，共 100 轮

实验 4：30 天 Vanguard 准实地实验

被试

上层经济学（juniors/seniors）和 MBA 学生，均修过金融与统计课程
完成实验的被试：limited feedback 36 人，full feedback 42 人

资产：5 只 Vanguard 真实基金

Vanguard Total Stock Market Index Fund
Vanguard Total Bond Market Index Fund
Vanguard European Stock Index Fund
Vanguard Pacific Stock Index Fund
Vanguard Target Retirement 2015 Fund（分散化基金，由前四只组成：51.2% Total Stock + 36.0% Total Bond + 7.4% European + 3.4% Pacific + 2.0% other）

逐步流程

被试登录投资网站
30 天内做 30 次投资决策（每天一次）
每次登录看到上一次决策的反馈——基于真实股市当日表现
共同反馈：上次决策的百分比收益、累计收益、剩余轮数
Full feedback 条件：主屏幕显示所有 5 只基金上一访问日的收益
Limited feedback 条件：主屏幕只显示上次所选基金的收益
两个条件下，所有基金都附有 prospectus 和历史业绩链接（信息可用性相同，差异只是可见性）
支付：基于百分比日收益之和（避免规模效应），10 NIS / 1% 收益，平均支付 28.6 NIS，无出场费

附加问卷（可选）：包含投资经验、风险态度问题（Appendix C）—— 40% 曾投资过股票/共同基金，95.6% 在描述性投资组合选择中表现风险厌恶

激励机制汇总

实验	支付方式	平均金额
1, 2	累积 tokens × 1/200 NIS	~25 NIS（$5）
3	随机一轮 + 30 NIS 出场费	30 NIS + 抽样收益
4	百分比收益和 × 10 NIS/%	~28.6 NIS

维度2：理论模型

经典理论基准

Markowitz 投资组合理论：负相关资产应该完全分散化以降低方差
Uppal & Wang (2003)：用对联合分布的 ambiguity 解释欠分散化（替代解释）
Kahneman & Tversky (1979) 损失厌恶：在涉及损失的环境中应偏好低方差（即 M）

行为/适应性模型

本文核心是适应性学习框架，建立在 Thorndike (1898) 的"law of effect"之上：

模型 1：Fictitious Play (FP)
$ $W_k(t+1) = \frac{t-1}{t} W_k(t) + \frac{1}{t} V_k(t) \tag{1}$ $

选择历史加权平均最高的资产
关键蕴含：M 是 A 和 B 加权值的平均，永远不可能成为最大值 → FP 在完整反馈下机械地排斥 M
在受限反馈下，t 仅指观察到该资产的轮数，因而触发 hot stove effect（Denrell & March, 2001）：差结果导致回避，而 M 的中等结果使其反而被偏好

模型 2：Normalized Fictitious Play (NFP)（Ert & Erev, 2007；Erev, 2009）

倾向更新：q_{j,t+1} = (1-w)q_{jt} + w·x_{jt}
选择概率：softmax 形式，含温度参数 λ 和归一化因子 S_t
S_t 在完整反馈下基于"experienced regret"，在受限反馈下基于相邻支付差
用 EE 参数（Ert & Erev 2007 拟合完整反馈）和 EER 参数（Erev 2009 拟合受限反馈）做预测对比

关键假设

投资者根据过去结果更新选择倾向
反馈结构（完整 vs 受限）决定哪些资产的信息被纳入更新
不假设理性更新（投资者不正确折扣 forgone payoffs 的信息）

可检验预测

完整反馈 → M 选择率低（接近 0）
受限反馈 → M 选择率高（hot stove effect）
即使 M 在期望上严格占优（实验2、实验3），完整反馈下仍然欠分散化
单个被试的选择应表现"best reply to the past"特征

维度3：核心发现

实验 1（U₀, 等期望）

M 在 full feedback 下被选 14%，limited feedback 下 39%
t(38) = 4.9, p < 0.01（双尾 t 检验，pooled variance）
55%（full）/ 52%（limited）的个体选择对应"最高近期支付"资产
51% / 47% 对应"最高历史平均"资产 → 显示明显的 best reply 行为

实验 2（U₂, M 期望最高）

M 在 full feedback 下 27.8%，limited feedback 下 43.3%
t(38) = 2.19, p = 0.035 → 完整反馈造成期望收益损失
即使 M 是期望最优选择，完整反馈仍系统性地降低其选择率

实验 3（完整描述 + 损失）

M 总体选择率 23.6%（远低于理性预测的 100%）
第一个 20 期 block：28% → 最后一个 block：21%（经验降低 M 选择）
配对 t 检验：t = 2.38, df = 29, p = 0.024
第一轮 M 选择率 33%（接近 1/3 随机），与损失厌恶预测的强偏好相反 → 反向损失厌恶：本情境下反馈效应支配损失厌恶
关键意义：即使被告知 M 严格占优，经验仍使被试远离 M

实验 4（Vanguard 准实地）

分散化基金（Target Retirement 2015）在 full feedback 下 10%、limited feedback 下 13%（差异不显著，因该基金本身在样本期表现不佳）
关键发现：最高波动率的 Pacific Index Fund 在 full feedback 下 32%、limited feedback 下 16%（t(76) = 2.6, p = 0.01）→ 追涨导致选择高方差资产
问卷相关性（Table 1）：分散化选择与"假设性风险厌恶"（Q6）正相关 0.341（p=0.005），与"自述风险偏好"（Q7）相关 0.388（p=0.001）

模型拟合

Full feedback 下结果接近 NFP-EE 预测
Limited feedback 下结果接近 NFP-EER 预测
两套参数能良好刻画两种反馈结构下的学习曲线

维度4：变量概览

观测变量（Outcome Variables）

核心：分散化资产 M 的选择率（按时间分块）
辅助：累计收益、单期 best-reply 一致率、第一轮 M 选择率（基线）
实验4 加：5 只基金各自的选择比例、Pacific Index Fund 选择率

核心自变量 / Treatment 变量

Feedback 结构：full vs. limited（被试间）—— 决定每轮是否显示所有资产的实现收益
Premium c：U₀ vs. U₂（实验1 vs. 2）—— 控制 M 是否期望严格占优
信息描述：实验3 提供完整收益分布的口头+表格描述
支付方式：累积 vs. 随机一轮（实验3 用以排除财富累积效应）

控制变量

被试本科背景（实验1-3 同一以色列大学），实验4 用商科/经济背景被试
标准化轮数（实验1-3 = 100 轮，实验4 = 30 天）
投资金额恒定（每轮 100 tokens；不能拆分）
实验3 取消练习以排除练习效应

调节/中介变量

调节：被试自述的风险态度（Q6, Q7, Q9）—— 与分散化选择正相关
机制（mediator 推断）：被试的 best-reply 行为模式

维度5：局限性

作者承认

实验4 中分散化基金本身在样本期表现不佳，使主效应在该实验中检验力不足
NFP 模型未在本研究内估计（避免在小样本上过拟合），仅引用前期估计参数
实验4 的"信息可用性"差异较微妙：所有信息都可点击查看，treatment 仅改变主屏可见性

潜在问题

样本规模偏小：每条件 20-30 人，在效应较小时检验力受限
资产数量极少（3-5 个）：现实股票市场资产数量上千，"加权平均永远不是最大"的机制在大量资产下可能弱化（因为单一成分极端值更稀疏）
缺乏价格反馈：所有实验是个人决策，没有市场价格内生形成，因而无法对接 Adam_Marcet_2016_StockMarketVolatility_Learning 类的自指学习模型
横截面异质性未结构化建模：仅做相关性，未估计个体类型混合
未涉及组合（portfolio）选择：被试只能选一个资产，无法回答"追涨者会构造什么组合"的问题
实验3 的反向损失厌恶解释偏弱：作者将其归因为反馈效应支配，但缺乏机制实证

维度6：与其他文献的关系

上游文献基础

适应性学习：Camerer_1999_EWA_Learning（EWA 模型）；Erev & Roth 系列；Thorndike (1898) law of effect
追涨证据：Chevalier & Ellison (1997)、Sirri & Tufano (1998) 共同基金资金流追涨
欠分散化经验事实：Blume & Friend (1975)、Goetzmann & Kumar (2004)、Polkovnichenko (2005)、Statman (1987, 2004)
Hot stove effect：Denrell & March (2001)、Denrell (2007)
替代解释：Uppal & Wang (2003) ambiguity 模型；Asano_2006_PortfolioInertia_Ambiguity 投资组合惯性

同时期相关实验研究

Bregu_2020_Overconfidence_Overtrading_Feedback：反馈对过度交易的影响
Chance_2011_PortfolioSize_Diversification：组合规模与分散化
Bhui_Jiao_2023_AttentionConstraints_CategoryLearning：注意力约束下的类别学习
Attention_2023_Attention_Constraints_Learning_Categories

与本 vault 内信念形成主题的连接

追涨 = 外推预期：AssetPricing_2022_ReturnExtrapolation 在资产定价层面的外推；Adam_Marcet_2016_StockMarketVolatility_Learning 自指学习
过度自信与反馈：Daniel_Hirshleifer_2015_Overconfident_Returns_Trading
行为机制对资产配置的含义：Brunnermeier_2007_OptimalBeliefs_SkewedReturns

后续影响

为"完整反馈反而有害"提供了清晰的因果证据，影响了 fintech 应用界面设计
与 Bregu_2020_Overconfidence_Overtrading_Feedback 等近期反馈实验形成对话
适应性学习—欠分散化机制被纳入行为投资组合模型的微观基础

维度7：可拓展的研究方向

多资产环境：拓展到 50+ 资产（如 ETF 篮子），检验机制在大规模资产空间下的稳健性
动态分散化基金构成：让分散化基金成分本身随时间变化，研究被试如何识别"基金的基金"结构
经验丰富的投资者：以专业基金经理为样本，检验 financial expertise 是否能消除该偏差
改善界面设计：测试"显示长期累计回报"vs"显示单期回报"对分散化的影响 → 可与现实 robo-advisor 的展示设计对接
结合信念测量：在每轮额外引出被试对各资产期望收益的主观信念，结构化估计 best-reply 模型参数
跨文化复制：以色列样本之外的复制（中、美、欧），检验文化对反馈处理的调节
市场层面后果：将单人适应性学习模型嵌入到资产市场实验（如 Bao_2019_Impact_Interest_Rate_Policy 类设计），研究欠分散化在市场层面是否产生定价效应

关键结论

完整反馈机械性地导致欠分散化：因为分散化资产作为加权平均不可能在单期成为"赢家"，对过去最佳回应的策略系统性地排除它——这一机制不依赖任何"非理性"假设，仅需投资者根据观察到的回报更新选择
反馈结构是可设计的政策杠杆：将反馈从"完整"改为"受限于已选资产"可以在不改变信息可用性的前提下增加分散化倾向（实验4 的设计直接对接 robo-advisor 界面），为基金平台界面设计提供了行为学依据
完整描述无法消除偏差：实验3 在被试明确知道 M 严格占优的情况下，经验仍降低 M 选择率，说明追涨偏差不是源于对收益分布的不确定，而是源于反馈本身对适应性更新的驱动

Adaptive_2010_Adaptive_Behavior_Leads_Under