Attention Constraints and Learning in Categories

Bhui and Jiao (2023), Management Science

一句话总结

通过五个预注册的"股票预测游戏"实验（N=783），利用鼠标追踪（mouse tracking）直接测量注意力分配，本文首次在实验室中系统验证了rational inattention理论关于类别层级信息处理的核心预测：被试会根据环境的统计结构（类别方差、类别规模、时间约束）理性地调整对类别信息 vs. 个体信息的关注比例。

研究问题

决策者在面对复杂信息环境时，是否会理性地在类别层级（category level）和个体层级（individual level）之间分配有限的注意力？Peng and Xiong (2006)等influential理论假设投资者会根据信息环境的统计结构适应性地调整类别关注度（category focus），但此前缺乏直接的实验证据。本文问：(1) 类别关注度是否随类别方差、类别规模和时间约束的变化而适应性调整？(2) 被试能否从经验中学习类别的统计结构？(3) 类别关注度如何影响预测的分散度和准确性？

核心贡献

首个直接实验检验：开发了一个信息采样范式（information sampling paradigm），通过鼠标追踪透明地测量注意力在类别因子和个体因子之间的分配，首次在实验室中直接检验rational inattention理论在类别思维中的预测
系统验证三大比较静态：类别关注度随类别方差增大而增加（Exp 1 & 5）、随类别规模增大而增加（Exp 2）、随时间约束收紧而增加（Exp 3），均与Peng and Xiong (2006)理论一致
从经验中学习类别结构：Experiment 5证明即使不明确告知方差参数，被试也能从经验中学习类别的统计结构，并在方差发生隐性转变（latent shift）后调整注意力分配
揭示理论偏差：大类别中被试对突出（salient）的近期信号过度关注，导致预测分散度增加而非理论预测的降低——bottom-up注意力对top-down理性分配的干扰

维度1：实验设计分析

实验平台与类型

类型：online experiment（Amazon Mechanical Turk）+ lab（Experiment 5部分在实验室）
平台：Amazon Mechanical Turk
被试：总计N=783（美国），分布在五个实验中（Exp 1: n=147, Exp 2: n=145, Exp 3: n=146, Exp 4: n=146, Exp 5: n=199）
报酬：$2底薪 + 最多$6绩效奖金（Exp 1-4）；$3底薪 + 最多$6奖金（Exp 5）

所有实验共享的核心任务：股票预测游戏

每期（period）的完整流程（如Figure 1所示）：

阶段一：信息采样阶段（有时间限制）

屏幕展示一个面板，左侧列出所有股票名称（Stock A, Stock B, ...）和一个"INDUSTRY"标签
每只股票的价值由两个因子之和决定：一个共同的行业因子（industry factor, $c$ ）和一个个体特有因子（stock-specific factor, $m_i$ ）。即 $v_A = c + m_A$ , $v_B = c + m_B$ , ...
每个因子的真实值未知，但其先验分布以横向的钟形曲线（sideways bell curve）可视化展示在屏幕上。行业因子 $c \sim \mathcal{N}(0, \sigma_{industry}^2)$ ，个体因子 $m_i \sim \mathcal{N}(0, \sigma_{stock}^2)$
信息获取方式：被试将鼠标光标悬停（hover）在某个因子上方时，该因子的一个含噪声信号每500ms自动呈现一次。信号从 $\mathcal{N}(c, \sigma_{signal}^2)$ 或 $\mathcal{N}(m_i, \sigma_{signal}^2)$ 中抽取，以红色数字和点在钟形曲线上高亮显示
被试同一时间只能关注一个因子——在行业因子和各个体因子之间必须做出时间分配决策
右上角有倒计时计时器，时间耗尽后自动进入预测阶段
被试可以随时在不同因子之间切换（鼠标移动即切换）

阶段二：预测阶段（无时间限制）

屏幕右侧显示每只股票的预测滑条
被试为每只股票提交一个点预测值（即估计 $v_i = c + m_i$ 的总价值）
被试不单独报告行业因子或个体因子的估计
提交后，屏幕显示每只股票的真实价值和预测误差大小（仅作为反馈，不影响未来期次的随机变量）

激励机制：绩效奖金基于所有期次的平均预测均方误差（MSE）。具体公式： $6 - \frac{1}{200} \sum_{t} \frac{1}{n_{stocks}} \sum_{i} (\hat{v}_{i,t} - v_{i,t})^2$ ，最低$0.30，确保支付不会降为零。被试被告知目标是最小化预测误差。

实验结构：每个实验包含2个block × 10期 = 20期。两个block对应两个within-subject处理条件，顺序在被试间平衡。block之间处理参数改变，被试被告知参数变化。

说明与理解检验：

阅读说明后，被试进入2个自主练习期（self-paced，可看到所有因子的真实值，可无限采样）
随后回答2道理解检验题

Experiment 1：Variance（类别方差操纵）

Within-subject处理：

Low category variance： $\sigma_{industry} = 5$ , $\sigma_{stock} = 30$ （个体差异大，行业因子不重要）
High category variance： $\sigma_{industry} = 30$ , $\sigma_{stock} = 10$ （行业因子波动大，个体差异小）
总方差保持恒定： $\sigma_{industry}^2 + \sigma_{stock}^2 = 925$
参数： $n_{stocks} = 5$ , $\sigma_{signal} = 10$ , 时间限制 = 12秒

Experiment 2：Size（类别规模操纵）

Within-subject处理：9

Few category members： $n_{stocks} = 2$
Many category members： $n_{stocks} = 8$
固定参数： $\sigma_{industry} = 30$ , $\sigma_{stock} = 5$ , $\sigma_{signal} = 10$ , 时间 = 12秒

Experiment 3：Time（时间约束操纵）

Within-subject处理：

Long time limit：20秒
Short time limit：8秒
固定参数： $\sigma_{industry} = 30$ , $\sigma_{stock} = 5$ , $\sigma_{signal} = 10$ , $n_{stocks} = 5$

Experiment 4：Memory（认知负荷操纵）

Within-subject处理：

Signals remain：信号持续显示在屏幕上
Signals vanish：信号在下一个信号出现时消失（只能看到最新信号）
目的：检验当信号需要记忆时（增加认知负荷），是否改变注意力分配
固定参数： $\sigma_{industry} = 20$ , $\sigma_{stock} = 20$ , $\sigma_{signal} = 10$ , $n_{stocks} = 5$ , 时间 = 12秒

Experiment 5：Latent（隐性学习 + 结构转变）

Between-subjects + within-subject混合设计：

第一个block（10期）：一半被试经历high relative category variance（ $\sigma_{industry} = 30$ , $\sigma_{stock} = 1$ ），另一半经历low（ $\sigma_{industry} = 1$ , $\sigma_{stock} = 30$ ）
第二个block（10期）：所有被试经历equal variance（ $\sigma_{industry} = 15$ , $\sigma_{stock} = 15$ ）
关键差异：两个block之间没有明确分界标志，被试不被告知参数发生变化，必须从经验中学习
信号消失（vanish）， $\sigma_{signal} = 10$ , $n_{stocks} = 5$ , 时间 = 12.75秒
N = 199（样本量更大，因为between-subjects成分）

Category Focus的测量

定义：category focus = 在行业因子上花费的鼠标悬停时间占比 - 在平均单只股票因子上花费的时间占比。

例如：12秒限制中，7秒悬停在industry、5秒分配给5只股票（平均每只1秒），则 category focus = 7/12 - 1/12 = 0.5。

取值范围： $[-1/n_{stocks}, 1]$ 。若注意力均匀分配，category focus = 0。

维度2：理论模型

Peng and Xiong (2006)模型的简化版本

信息环境：

$n_{stocks}$ 只股票，每只价值 $v_i = c + m_i$
$c \sim \mathcal{N}(0, \sigma_{industry}^2)$ , $m_i \sim \mathcal{N}(0, \sigma_{stock}^2)$ , 互相独立
被试通过采样获取信号，信号精度取决于采样时间

最优注意力分配的定性预测：

方差效应：当 $\sigma_{industry}^2 / \sigma_{stock}^2$ 增大时，类别信息的边际价值增加，最优category focus上升
规模效应：当 $n_{stocks}$ 增大时，行业信号的信息惠及更多股票（规模经济），最优category focus上升
时间效应：当可用时间减少时，注意力更稀缺，应集中在边际价值最高的信息上——在大多数参数下是类别信息，最优category focus上升
U形误差曲线：预测误差与category focus之间应呈U形关系——太多类别关注导致忽视个体差异，太少类别关注则未能利用类别信息的规模经济

信号权重模型（用于拟合个体行为）

被试对股票 $i$ 的预测建模为观测信号的加权平均：

对行业信号的权重 $w_{industry}$
对个体信号的权重 $w_{stock}$
对最近一个信号的额外权重（recency/salience参数）
噪声项（response noise）

通过最大化似然估计个体参数（Online Appendix Section EC.3）。

维度3：核心发现

Category Focus的处理效应（Table 2, Figure 2）

实验	处理	Category Focus变化	$P(\beta > 0)$
Exp 1 (Variance)	Low→High category variance	+0.053	>0.999
Exp 2 (Size)	Few→Many stocks	+0.131	>0.999
Exp 3 (Time)	Long→Short time limit	+0.046	0.956
Exp 4 (Memory)	Remain→Vanish signals	+0.004	0.679
Exp 5 (Latent)	Low→High category variance	+0.028	>0.999

H1（方差）、H2（规模）、H3（时间）均得到支持， $P(\beta > 0) > 0.95$
H4（记忆/认知负荷）不显著：vanish条件不影响category focus。后续分析表明这与实验参数设计有关——当行业和个体方差相等时（ $\sigma_{industry} = \sigma_{stock} = 20$ ），理论预测category focus本身不应改变

预测分散度（Prediction Dispersion, Figure 3）

理论预测：高category focus → 预测分散度（跨股票的标准差）下降
Experiments 1, 3, 4, 5：与理论一致——高category focus时预测更聚集
Experiment 2（many stocks）：违反理论预测——多股票条件下预测反而更分散
- 原因：模型拟合揭示，当股票多时，被试对个体信号的最新信号（recency signal）赋予更高权重（ $P(\beta > 0) = 0.990$ 和 0.996），即bottom-up salience效应——少数突出信号的过度权重抵消了categorical thinking带来的信念聚集

预测误差（Prediction Error, Figure 4）

所有五个实验中，预测误差与category focus之间呈U形关系，与理论预测一致
最优category focus取决于环境参数，但中等水平的category focus总是优于极端值
理论预测的U形曲线形状（包括最优点的位置）与实际数据吻合良好

Experiment 5：从经验中学习（Figure 5, Table 3）

前10期（方差条件不同）：被试在前几期category focus相近（因为还没学到统计结构），之后逐渐分化——high variance条件下category focus上升，low variance条件下下降。交互项 $P(\beta > 0) > 0.999$
后10期（方差统一为equal）：两组的category focus开始收敛。 $P(\beta < 0) = 0.976$
结论：被试能在没有明确告知的情况下，从信号中学习类别的统计结构，并在结构隐性转变后适应性调整注意力分配

维度4：变量概览

观测变量（Outcome Variables）

Category Focus：在行业因子上的鼠标悬停时间占比 - 平均单只股票因子上的时间占比
Prediction Dispersion：每期内被试对各股票预测值的标准差（log-transformed）
Prediction Error：每期内被试预测的均方误差（log-transformed）
Viewing Time：在行业因子和平均个体因子上的鼠标悬停时间（秒）

核心自变量 / Treatment 变量

Relative category variance（Exp 1 & 5）： $\sigma_{industry}^2 / (\sigma_{industry}^2 + \sigma_{stock}^2)$
Category size（Exp 2）： $n_{stocks} \in \{2, 8\}$
Time limit（Exp 3）：可用采样时间（20s vs. 8s）
Signal persistence（Exp 4）：信号持续显示 vs. 消失
Latent shift（Exp 5）：方差结构在期中隐性变化

控制变量

期次（Period）：控制学习效应
Block顺序：在被试间平衡
行业因子在屏幕上的位置：在被试间平衡（但被试内保持不变）

维度5：局限性

抽象任务设计：股票预测游戏的信息结构高度简化（正态分布、独立因子、已知先验），与真实金融市场的复杂信息环境差距较大。理论预测的定量精确性可能在更复杂环境中不成立
鼠标悬停 ≠ 认知注意力：鼠标位置是注意力的代理变量，被试可能在悬停一个因子时心理上处理另一个因子的信息（尤其在信号消失条件下需要记忆）
无选择决策的下游效应：任务仅测量预测/信念形成，未涉及基于预测的投资决策。Peng and Xiong (2006)模型的关键应用场景（如style investing、excess comovement）需要将注意力分配与投资组合选择结合
Experiment 2的异常：大类别中预测分散度增加而非减少，暗示bottom-up salience在复杂环境中可能系统性地削弱rational inattention的效率——这一发现的理论含义尚未充分发展
Experiment 4的null result：认知负荷操纵无效可能源于参数选择（ $\sigma_{industry} = \sigma_{stock}$ ），而非认知负荷真的不影响注意力分配
样本局限：全部在MTurk招募的美国被试，金融素养和认知能力可能不代表一般投资者

维度6：与其他文献的关系

理论基础

直接检验Peng_Xiong_2006_InvestorAttention_Overconfidence_CategoryLearning的核心预测：投资者在有限注意下理性地分配attention到行业 vs. 个体信息
与Kacperczyk et al. (2016, Econometrica)的共同基金注意力理论互补：后者从基金经理的行为推断attention allocation，本文直接测量
与Maćkowiak and Wiederholt (2009, 2015)的rational inattention模型一致：企业和家庭根据信息价值调整注意力

与实验文献的关系

与Caplin and Dean (2014)和Caplin et al. (2020)的rational inattention实验方法互补：后者关注state-dependent stochastic choice，本文通过process tracing直接测量信息获取
扩展了Willemsen and Johnson (2011)和Schulte-Mecklenbeck et al. (2017)的process-tracing方法论：将mouse tracking应用于类别学习的注意力测量

与行为金融的关系

为Barberis and Shleifer (2003)的style investing理论提供微观基础：category focus是style investing的注意力驱动力
与Drake et al. (2017)和Ehrmann and Jansen (2022)的实地证据互补：后者发现投资者分心时stock return comovement增加，本文在实验室中证明了相同机制
bottom-up salience的发现呼应Bordalo et al. (2022)的salience theory

维度7：可拓展的研究方向

整合注意力分配与投资决策：在实验中加入基于预测的投资组合构建阶段，检验category focus如何影响资产配置、excess comovement和style investing
引入top-down vs. bottom-up注意力的交互：系统操纵信号的视觉突出性（salience），量化bottom-up注意力对rational category focus的干扰程度
更复杂的类别结构：引入层级类别（如行业→子行业→个股）或跨类别相关性，检验理论在多层类别结构中的适用性
field validation：将mouse tracking范式应用于真实金融数据终端（如Bloomberg Terminal），测量专业分析师/基金经理在行业 vs. 个股信息上的注意力分配
个体差异的决定因素：结合认知能力（如CRT、working memory）和金融素养测量，分析哪些个体特征预测更理性的注意力分配
dynamic attention allocation：在跨期设置中（如信息环境的统计结构随时间缓慢变化），研究注意力调整的速度和精度

关键结论

人们在类别信息与个体信息之间的注意力分配总体上符合rational inattention的预测：当类别方差大、类别成员多、时间紧时，category focus系统性上升——这为Peng and Xiong (2006)等influential理论的关键假设提供了首个直接实验证据
理性分配存在边界：大类别中bottom-up salience（对突出的近期信号过度关注）会抵消categorical thinking带来的信念聚集效应，且被试能从经验中学习类别结构并适应隐性变化——注意力分配既理性又有限

Attention_2023_Attention_Constraints_Learning_Categories

Attention Constraints and Learning in Categories

一句话总结

研究问题

核心贡献

维度1：实验设计分析

实验平台与类型

所有实验共享的核心任务：股票预测游戏

Experiment 1：Variance（类别方差操纵）

Experiment 2：Size（类别规模操纵）

Experiment 3：Time（时间约束操纵）

Experiment 4：Memory（认知负荷操纵）

Experiment 5：Latent（隐性学习 + 结构转变）

Category Focus的测量

维度2：理论模型

Peng and Xiong (2006)模型的简化版本

信号权重模型（用于拟合个体行为）

维度3：核心发现

Category Focus的处理效应（Table 2, Figure 2）

预测分散度（Prediction Dispersion, Figure 3）

预测误差（Prediction Error, Figure 4）

Experiment 5：从经验中学习（Figure 5, Table 3）

维度4：变量概览

观测变量（Outcome Variables）

核心自变量 / Treatment 变量

控制变量

维度5：局限性

维度6：与其他文献的关系

理论基础

与实验文献的关系

与行为金融的关系

维度7：可拓展的研究方向

关键结论

🔗 链接到这篇笔记