Attention Constraints and Learning in Categories

Authors: Rahul Bhui (MIT Sloan), Peiran Jiao (Maastricht University)
Journal: Management Science, Articles in Advance, 2023
DOI: https://doi.org/10.1287/mnsc.2023.4803
Keywords: categorical thinking, rational inattention, information choice

一句话总结

通过基于鼠标追踪的"股票预测游戏"在线实验范式（5个预注册实验，N=884），首次直接验证了理性疏忽（rational inattention）框架下的类别学习理论：被试在类别层面与个体层面信息之间的注意力分配大体符合理论预测，但同时存在显著性驱动的过度加权偏差。

研究问题

当注意力（信息处理能力）有限时，决策者如何在"类别层面信息"（如行业因子）与"个体层面信息"（如个股特有因子）之间分配注意力？人们的实际注意力分配是否符合理性疏忽理论关于方差、类别规模、时间压力的预测？被试能否从经验中学习类别统计结构并适应性调整注意力？

核心贡献

方法创新：开发了基于鼠标悬停追踪的信息采样实验范式，能够透明、连续地测量注意力分配，同时精确控制信息环境的统计结构（方差、信号精度、类别规模等）。
理论首次直接验证：为 Peng & Xiong (2006) 类别学习理论中的核心假设——类别注意力随类别方差、类别规模、时间约束系统变化——提供了首个系统性实验证据。
5 个预注册实验：在方差（Exp1）、类别规模（Exp2）、时间压力（Exp3）、记忆/认知负荷（Exp4）、潜在结构学习（Exp5）五个维度上检验理论预测，覆盖广度高。
理性 vs 显著性偏差并存的发现：被试整体方向上符合理性疏忽预测，但同时表现出对最近信号、个股信号的过度加权（显著性效应），与理论预测部分矛盾，揭示了"自上而下"理性分配与"自下而上"显著性捕获之间的张力。
经验学习证据：实验5证明即使类别结构未被明确告知且发生潜在变化，被试也能从经验中学习并适应性调整注意力分配。
桥接文献：连接了行为金融的类别思维理论（Barberis & Shleifer 2003; Peng & Xiong 2006; Kacperczyk et al. 2016）与认知科学中关于注意力资源分配的实证研究。

维度1：实验设计分析

实验任务详细流程

本文开发了一个"股票预测游戏"(stock prediction game)实验范式，使用鼠标追踪(mouse tracking)透明地测量注意力分配，同时精确控制信息环境的统计结构。共包含5个预注册实验。

基本范式（适用于所有实验，各实验在参数上有变体）

1. 指导语与练习阶段：

被试阅读指导语，了解任务结构：多只假想股票属于同一行业，每只股票的价值 = 共同行业因子(c) + 个股特有因子(m_i)
两个因子均独立地从零均值高斯分布中生成： $c \sim \mathcal{N}(0, \sigma^2_{industry})$ ， $m_i \sim \mathcal{N}(0, \sigma^2_{stock})$
屏幕上以侧向钟形曲线展示先验分布（被试可直观看到方差大小）
被试完成2个自定步调的练习期（可看到所有因子真实值，无时间限制），然后回答2个理解检测题

2. 信息采集阶段（每期，有时间限制）：

屏幕显示：左侧为因子名称（Industry、Stock A、Stock B...），中间为因子值区域，右侧为预测滑块
屏幕上方显示当前期数（如"Period 2 of 20"）和倒计时计时器
关键操作： 被试将鼠标悬停在某个因子上方时，每500ms会显示一个关于该因子真实值的含噪高斯信号，来自 $\mathcal{N}(c, \sigma^2_{signal})$ 或 $\mathcal{N}(m_i, \sigma^2_{signal})$
被试每次只能获取一个因子的信号，必须在行业因子和各个股特有因子之间做出注意力分配取舍
鼠标悬停时间越长，获得的信号越多 --> 时间作为注意力的代理变量
在实验1-3中，最后一个信号高亮显示其数值并以红色标出；在实验4的vanish条件中，信号在下一个信号出现时消失（增加认知负担）
时间用完后进入预测阶段

3. 预测阶段（无时间限制）：

被试使用滑块为每只股票提交一个点预测（预测总价值 = 行业因子 + 个股因子之和）
注意：被试不需要单独预测行业因子或个股因子

4. 反馈阶段：

提交预测后，显示每只股票的真实价值和预测误差大小
仅作为反馈，不影响后续期的随机变量

5. 激励与支付：

基于每期预测的均方误差(MSE)计算奖金： $\$6 - \frac{1}{200}\sum_{t}\frac{1}{n_t}\sum_i(\hat{v}_{i,t} - v_{i,t})^2$
罚金每期上限为 $6/20 = $0.30，确保支付不低于$0

实验1（Variance, 方差操纵）

被试： n = 147，Amazon Mechanical Turk
设计： 被试内设计，2个block各10期
Treatment： 操纵行业因子相对方差
- Low category variance条件： $\sigma_{industry}=5$ , $\sigma_{stock}=30$
- High category variance条件： $\sigma_{industry}=30$ , $\sigma_{stock}=5$
- 总方差保持恒定
其他参数： $\sigma_{signal}=10$ , $n_{stocks}=5$ , 时间限制=12秒, 信号不消失
预测： 行业因子方差更高时，category focus应更高

实验2（Size, 类别大小操纵）

被试： n = 145
Treatment： 操纵类别中股票数量
- Few category members: $n_{stocks}=2$
- Many category members: $n_{stocks}=8$
其他参数： $\sigma_{industry}=30$ , $\sigma_{stock}=5$ , $\sigma_{signal}=10$ , 时间=12秒
预测： 类别成员越多，category focus应越高（因为行业信息的边际价值更大）

实验3（Time, 时间压力操纵）

被试： n = 146
Treatment： 操纵可用时间
- Long time limit: 20秒
- Short time limit: 8秒
其他参数： $\sigma_{industry}=30$ , $\sigma_{stock}=5$ , $\sigma_{signal}=10$ , $n_{stocks}=5$
预测： 时间更短时，category focus应更高（注意力约束更严格时，应更多关注高信息量的类别层面）

实验4（Memory, 认知负荷操纵）

被试： n = 146
Treatment： 操纵信号是否在屏幕上保留
- Signals remain: 信号保留在屏幕上
- Signals vanish: 信号在下一个信号出现时消失（需靠记忆）
其他参数： $\sigma_{industry}=20$ , $\sigma_{stock}=20$ , $\sigma_{signal}=10$ , $n_{stocks}=5$ , 时间=12秒
预测： 信号消失时category focus更高（认知负荷增加类似注意力约束）
实际结果： 无显著效应，但与理论一致（因为行业和个股先验方差相等，最优category focus对信号精度变化不敏感）

实验5（Latent, 潜在结构学习）

被试： n = 299（样本量加大，因为是被试间设计）
设计： 被试间 + 潜在结构变化
- 前10期：一半被试经历高类别方差（ $\sigma_{industry}=30$ , $\sigma_{stock}=1$ ），一半经历低类别方差（ $\sigma_{industry}=1$ , $\sigma_{stock}=30$ ）
- 后10期：所有被试经历相等方差（ $\sigma_{industry}=15$ , $\sigma_{stock}=15$ ）
- 两个block之间无明显标识，被试不知道会有变化
其他参数： $\sigma_{signal}=10$ , $n_{stocks}=5$ , 时间=12.75秒, 信号消失
关键创新： 先验分布不再明确告知，被试必须从经验中学习统计结构
预测： (1) 被试能从信号中学习类别统计结构并相应调整注意力；(2) 结构发生潜在变化后，注意力分配能适应性调整

其他实验设计要素

要素	内容
实验类型	在线实验（Amazon Mechanical Turk），5个预注册实验
Treatment设计	实验1-4：被试内设计（2 blocks x 10期）；实验5：被试间设计（前半段）+ 被试内变化（后半段）
随机化	Block顺序反平衡；行业因子在屏幕上的位置在被试间反平衡；同一被试内各block位置固定
核心观测变量	(1) Category focus = 行业因子悬停时间比例 - 平均个股因子悬停时间比例；(2) 预测离散度(prediction dispersion)；(3) 预测误差(prediction error/MSE)
因果识别	随机化Treatment + 被试内/间对比
样本量	实验1-4各约145-147人；实验5为299人；总计884人
激励机制	基础报酬$2-3 + 基于MSE的绩效奖金最高$6（二次损失函数）
亮点	(1) 鼠标追踪作为注意力的透明代理，可直接测量信息采集行为；(2) 精确控制信息环境统计结构；(3) 抽象范式可重复；(4) 跨5个实验系统检验理论预测；(5) 实验5引入潜在结构变化，测试从经验中学习的能力
局限	(1) 被试不能灵活塑造信息形式（如选择信号精度），仅能选择采样哪个因子；(2) 仅测量"自上而下"的注意力分配，"自下而上"的显著性效应也存在（如最近信号高亮导致过度加权）；(3) MTurk样本；(4) 未涉及注意力与下游决策（如投资组合选择）的交互

维度2：理论模型

基准理论

基于 Peng and Xiong (2006) 的理性疏忽(rational inattention)框架，核心思想：当注意力（信息处理能力）有限时，决策者应在类别层面信息和个体层面信息之间最优地分配注意力。

信息环境结构

每只股票价值为两个独立因子之和：
$ $v_i = c + m_i$ $

$c \sim \mathcal{N}(0, \sigma^2_{industry})$ ：行业共同因子
$m_i \sim \mathcal{N}(0, \sigma^2_{stock})$ ：个股特有因子

信号结构：悬停在因子上时，每500ms获得一个含噪信号：
$ $s \sim \mathcal{N}(\theta, \sigma^2_{signal})$ $
其中 $\theta$ 为对应因子的真实值。

核心变量：Category Focus

\text{Category Focus} = \frac{t_{industry}}{T} - \frac{1}{n_{stocks}} \cdot \frac{\sum_i t_{stock_i}}{T}

即行业因子时间占比减去平均个股因子时间占比。

关键理论预测

理性疏忽理论产生以下可检验预测：

方差效应： 当 $\sigma^2_{industry} / \sigma^2_{stock}$ 更高时，category focus应更高（行业信息对所有股票都有用）
规模效应： 当 $n_{stocks}$ 更大时，category focus应更高（行业信息的边际价值随成员数增加）
时间压力效应： 当时间预算更紧时，category focus应更高（约束更严时应优先获取高价值信息）
预测离散度： category focus越高，同期内各股票预测应越相似（因为获取的个性化信息更少）
预测误差U型曲线： category focus与预测误差呈U型关系——过高导致忽略个体差异，过低则未有效利用类别信息，中间水平最优

行为偏差的形式化

通过模型拟合(model fitting)发现，被试对信号的加权方式偏离理论最优：

对个股信号的权重参数
对行业信号的权重参数
对最近信号的额外权重（显著性/近因效应）
响应噪声参数

当类别成员较多（实验2 many条件）时，被试对个股信号和最近信号施加更大权重（ $P(\beta>0)=0.990$ 和 $0.996$ ），导致预测更分散——与理论预测的"预测应更集中"方向相反。这反映了显著性(salience)和特异性(idiosyncratic)信息的过度加权。

Structural Estimation

使用贝叶斯随机效应回归(Bayesian random effects regressions)进行主要统计分析，包含被试特定的截距和Treatment效应系数。报告后验均值、95%可信区间和 $P(\beta>0)$ 。

维度3：核心发现

主要结论与Effect Size

1. Category Focus的Treatment效应（Table 2）

实验	Treatment效应	均值	95% CI	$P(\beta>0)$
Exp 1 (Variance)	高类别方差	+0.053	[0.026, 0.079]	>0.999
Exp 2 (Size)	更多成员	+0.131	[0.091, 0.174]	>0.999
Exp 3 (Time)	更短时间	+0.030	[-0.006, 0.066]	0.956
Exp 4 (Memory)	信号消失	+0.004	[-0.013, 0.021]	0.679
Exp 5 (Latent)	高类别方差	+0.028	[0.012, 0.043]	>0.999

预注册标准 $P(\beta>0)>0.95$ 在前三个实验中达到
实验4的零效应与理论一致（因为实验参数下最优category focus对信号精度变化不敏感）

2. 预测离散度

当category focus更高时，预测标准差更低（预测更相似），与理论一致
但实验2（many条件）例外：虽然category focus更高，预测反而更分散。模型拟合揭示原因是被试对个股信号和最近信号过度加权

3. 预测误差的U型关系

各实验中，category focus与预测误差(log MSE)呈U型关系，与理论曲线形状吻合
误差最小化的最优category focus位于中间值，具体位置取决于环境参数

4. 预测表现

预测与真实值的相关性中位数跨实验范围：0.520-0.928

5. 学习动态（实验5）

被试能从经验中学习类别统计结构：前10期内，高/低类别方差条件的category focus逐渐分化（交互项 $P(\beta>0)>0.999$ ）
后半段结构潜在变化后，两个条件的category focus开始收敛（交互项 $P(\beta<0)=0.976$ ）
高类别方差条件的category focus在整个任务中始终较高（ $P(\beta>0)>0.95$ 从第7期开始）

稳健性

5个预注册实验结果一致
使用贝叶斯随机效应回归控制个体差异
串行位置效应分析（online appendix Section EC.6）
注意力轨迹分析（online appendix Section EC.5）
模型拟合分析揭示个体层面信号加权模式

与其他研究的比较

与Peng and Xiong (2006)、Kacperczyk et al. (2016)的理论预测大体一致
与Mackowiak and Wiederholt (2009)关于企业对特异性vs.宏观信息的注意力分配的理论呼应
发现了理论未预测到的"显著性效应"——当任务复杂度增加时，被试倾向过度关注显著信息（如高亮的最近信号），可抵消类别思维带来的预测聚类效应

维度6：与其他文献的关系

领域位置

本文位于 行为金融/行为经济学 与 认知科学 的交叉领域，聚焦于"理性疏忽"(rational inattention)理论在类别化信息处理中的实验验证。是对理性疏忽文献中一个核心但长期缺乏直接证据的假设——人们会理性地调整类别层面vs.个体层面的注意力分配——进行的首个系统性实验检验。

核心对话论文

论文	对话关系
Peng & Xiong (2006) JFE	本文的核心理论基础：投资者注意力、过度自信与类别学习模型
Kacperczyk et al. (2016) Econometrica	共同基金经理注意力分配的理论与实证；本文实验设计的重要动机来源
Mackowiak & Wiederholt (2009, 2015) AER, REStat	最优粘性价格与理性疏忽；企业对宏观vs.微观信息的关注
Sims (2003) JME	理性疏忽理论的信息论基础
Barberis & Shleifer (2003) JFE	风格投资与类别思维的行为金融框架
Bordalo et al. (2022) AREcon	显著性理论——与本文发现的显著性过度加权效应相关
Gabaix (2019) Handbook	行为疏忽综述；本文提供了实验室的直接验证
Caplin et al. (2020) QJE	理性疏忽的实验测量方法

新贡献

方法创新： 开发了一个基于鼠标追踪的信息采样范式，能够透明且精确地测量注意力在类别层面与个体层面之间的分配，并同时控制信息环境的统计结构
首次直接检验： 提供了理性疏忽应用于类别学习的最直接实验证据——此前文献主要依赖市场数据的间接推断
验证与偏差并存： 确认注意力分配大体符合理性原则（方差、规模、时间压力效应），同时发现显著性驱动的偏差（对高亮信息过度加权），揭示了"自上而下"理性分配与"自下而上"显著性捕获之间的张力
经验学习的证据： 实验5证明即使类别结构未明确告知且发生潜在变化，被试也能从经验中学习并适应性地调整注意力分配
搭建桥梁： 连接了行为金融理论（Peng & Xiong, Kacperczyk et al.）与认知科学中关于注意力资源分配的实证研究（如原型集中效应），为跨领域对话提供可重复的实验平台

维度4：变量概览

Outcome变量

变量	定义	测量方式
Category Focus	行业因子悬停时间比例 - 平均个股因子悬停时间比例	鼠标悬停时间（毫秒）
预测离散度（Prediction Dispersion）	同期内各股票预测的标准差	滑块预测值的标准差
预测误差（Prediction Error）	log MSE = $\log(\frac{1}{n}\sum_i(\hat{v}_i - v_i)^2)$	二次损失
预测-真值相关性	$\text{corr}(\hat{v}_{i,t}, v_{i,t})$	Pearson 相关系数
信号采样频率	每期获取的信号总数及各因子信号数分布	鼠标悬停时段计数

Treatment变量

实验	Treatment	操纵方式
Exp 1	类别方差	$\sigma_{industry}$ vs $\sigma_{stock}$ 相对大小（5/30 vs 30/5）
Exp 2	类别规模	股票数量 $n_{stocks}$ （2 vs 8）
Exp 3	时间压力	时间预算（20s vs 8s）
Exp 4	记忆负荷	信号是否保留在屏幕上（remain vs vanish）
Exp 5	潜在结构变化	前10期高/低类别方差 → 后10期均等方差（被试间）

Control变量

信号噪声 $\sigma_{signal} = 10$ （除特殊设计外保持恒定）
Block 顺序反平衡（被试内设计）
行业因子在屏幕上的位置反平衡（被试间）
同一被试内 block 位置固定
总方差 $\sigma_{industry}^2 + \sigma_{stock}^2$ 保持恒定（实验1）

Heterogeneity变量

被试个体随机效应（贝叶斯随机截距 + 随机斜率）
信号加权参数（个股信号权重、行业信号权重、近因/显著性权重、响应噪声）的个体差异
串行位置效应（Online Appendix EC.6）

维度5：局限性

信息形式不可塑造：被试只能选择采样哪个因子，不能调整信号精度（即不能选择"少量高精度信号"vs"大量低精度信号"）；这与真实金融市场中投资者可选择研究深度的情形不符。
仅测"自上而下"注意力：实验范式主要捕捉刻意的注意力分配，"自下而上"的显著性效应（如最近信号高亮）也存在但难以分离。
MTurk 在线样本：被试为 Amazon Mechanical Turk 用户，外部效度（推广至专业基金经理）存疑。
未涉及下游决策：仅测预测误差，未测投资组合选择、风险承担等真实金融决策；注意力分配如何影响真实交易行为仍未知。
被试不需分别预测两类因子：只需提交总价值预测，无法直接观察被试对行业 vs 个股因子的内部信念。
预测时无时间限制：注意力约束仅在信息采集阶段，预测阶段无约束，与真实市场决策环境不符。
抽象化范式：使用假想股票/行业，缺乏真实市场中的情绪、新闻、社交媒体等显著性来源。
样本量局限：Exp 5 N=299，对潜在结构学习的细粒度时间动态分析功效有限。
理论模型简化：使用高斯独立分布，未考虑因子间相关、肥尾、跳跃等更现实的金融市场特征。
未直接测量个体认知能力：未控制被试的工作记忆容量、统计素养等可能影响注意力分配的认知特质。

维度7：可拓展的研究方向

专业投资者样本：将范式推广至基金经理、分析师、对冲基金交易员等专业投资者，检验外部效度。
下游决策整合：将预测任务扩展为投资组合选择任务，研究 category focus 如何影响实际配置决策与收益。
信号精度选择：扩展范式允许被试选择"少量高精度"vs"大量低精度"信号，更全面检验理性疏忽理论。
真实市场数据：用真实股票市场的行业 vs 个股回报数据替换假想股票，检验在真实统计结构下的预测。
眼动追踪：用眼动仪替代鼠标追踪，提高注意力测量精度，检验鼠标行为与真实视觉注意力的一致性。
神经机制：用 fMRI/EEG 研究类别学习的神经基础，识别"自上而下"理性分配与"自下而上"显著性捕获的脑区分离。
个体异质性：测量被试的工作记忆、数学能力、统计训练等，研究哪些个体特质预测更接近理性疏忽的最优分配。
泡沫/危机情境：在高波动/危机情境下检验注意力分配——投资者是否在压力下更依赖类别信息（行业/资产类别）？
社交媒体显著性：引入社交媒体新闻流作为显著性冲击，研究外生显著性如何扭曲理性注意力分配。
多层级类别：扩展为"市场→板块→行业→个股"的多层级类别结构，研究跨层级注意力分配。
学习速率：测量被试从经验中学习类别统计结构的速率，识别快/慢学习者，并分析其与投资表现的关系。
机器辅助决策：研究 AI 推荐/聚合如何影响人类的注意力分配——是替代了类别注意力还是增强了？

关键结论

类别方差效应（Exp1）：当类别（行业）方差占比更高时，被试的 category focus 显著提高（+0.053, $P(\beta>0)>0.999$ ），与理性疏忽预测一致。
类别规模效应（Exp2）：类别成员越多（8 vs 2），category focus 越高（+0.131），效应量在所有实验中最大。
时间压力效应（Exp3）：时间预算更紧时（8s vs 20s），category focus 上升（+0.030），表明被试在约束更严时更依赖高信息量的类别信息。
记忆负荷效应（Exp4）：信号是否消失对 category focus 无显著影响，但与理论一致——在该实验参数下最优 category focus 对信号精度变化不敏感。
经验学习（Exp5）：被试能从经验中学习未告知的类别统计结构，并在结构发生潜在变化后适应性调整注意力分配。
预测离散度：高 category focus 一般对应更低的预测离散度（更相似的预测），但 Exp2 many 条件出现反例——揭示显著性偏差对个股信号过度加权。
U 型预测误差：category focus 与预测误差呈 U 型关系，存在中间最优水平；过度类别化或过度个性化均损害预测准确性。
理性 + 偏差并存：被试整体方向上符合理性疏忽预测，但同时表现出显著的近因/显著性偏差（ $P(\beta>0)=0.990$ for stock signal weight, 0.996 for recency weight in Exp2）。
方法贡献：基于鼠标追踪的"股票预测游戏"为类别学习与注意力分配研究提供了可重复、可控的实验平台。

Bhui_Jiao_2023_AttentionConstraints_CategoryLearning