Overprecision and (Ir)rational Inattention

Ciril Bosch-Rosa, Muhammed Bulutay, Bernhard Kassner (2026), Berlin School of Economics Discussion Paper #86

一句话总结

本文将过度精确（overprecision）嵌入标准 rational inattention 模型，理论推导并实验验证了过度精确通过直接偏置信息感知价值和间接放大注意力成本两个渠道降低信念更新率，揭示了一种由认知偏差而非理性权衡驱动的"非理性不注意"（irrational inattention）现象。

研究问题

过度精确——个体高估自身信念精确度的过度自信形式——如何影响注意力分配和信念更新？具体而言，过度精确是否会导致"非理性的不注意"，即一种由认知偏差而非理性成本-收益权衡驱动的信息忽视？

核心贡献

理论贡献：将 overprecision 嵌入标准 rational inattention 模型，揭示过度精确通过两层机制扭曲信念更新：(a) 直接偏置新信息的感知价值；(b) 间接放大注意力成本的影响
实验贡献：设计新颖的 2x2 被试间实验，独立操纵过度精确和信息处理成本，提供因果证据
方法贡献：使用 Subjective Error Method (SEM) 测量过度精确，避免置信区间法的局限性；使用诱饵词（decoy words）操纵注意力成本

实验设计

基本信息

实验类型：2x2 被试间在线实验，预注册（AsPredicted #154320），激励相容
平台：Bilendi 在线调查平台（德国代表性样本）
被试：N = 1,200（从 1,321 份完成问卷中按预注册标准筛选）
被试特征：平均年龄 44.5 岁，50% 女性，30% 大学学历，中位完成时间 13 分钟
JEL 分类：C83; D91; G41

被试完整经历时间线

阶段 0：指令与激励说明

被试在 Bilendi 平台上开始问卷。系统首先告知被试：随机抽取 5% 的被试可获得 10 欧元奖金，奖金取决于单个随机选中的估计的准确性。具体措辞为（德语）："您对这道随机选中的问题的回答越接近正确答案，获得潜在奖金的概率就越高。因此，尽可能准确地回答每一题符合您的利益。"被试可以点击链接查看正式的支付机制描述。支付使用 binarized scoring rule (Hossain and Okui, 2013)，但评分公式不直接展示。之后被试完成 4 道指令理解测试题。

阶段 1：Block 1 — 建立先验信念 + 测量过度精确（5 张照片）

被试依次观看 5 张历史照片，照片涵盖政治、流行文化、艺术等主题。具体照片为：

1927 年第五次 Solvay 会议（真实平均年龄 45.83 岁）
1984 年 Band Aid 慈善演出（真实平均年龄 27.89 岁）
2009 年 Obama 内阁（真实平均年龄 54.00 岁）
1987 年 Paramount 75 周年纪念（真实平均年龄 52.32 岁）
2023 年中德磋商（真实平均年龄 57.04 岁）

照片呈现顺序在被试层面随机化。对每张照片，被试依次完成两项任务：

步骤 1a — 年龄估计：被试看到照片后，用滑动条（范围 0-100）估计照片中所有人在拍照时的平均年龄。

步骤 1b — 主观误差评估：提交年龄估计后，被试被要求估计自己的估计值与真实平均年龄之间的绝对距离（即"主观误差"，范围 0-100）。例如，如果被试估计平均年龄为 40 岁，真实值为 46 岁，则绝对误差为 6。被试需要预测这个绝对误差的大小。

过度精确的计算：对每张照片 $k$ ， $overprecision_{i,k} = |error_{i,k}| - subjective\_error_{i,k}$ 。如果被试的实际绝对误差大于其预期的主观误差，则该被试是"过度精确的"（overprecise）——他们高估了自身信念的精确度。

阶段 2：反馈干预（过度精确的因果操纵）

Block 1 结束后，被试被随机分配到以下组之一：

Feedback 组（占总样本的 67%，过度抽样以确保统计效力）：被试收到一条校准反馈信息。反馈内容取决于被试在 Block 1 中的实际表现：

如果被试在超过半数照片中实际绝对误差 > 主观误差（即过度精确），则收到 Overprecise 反馈："在刚才的五张图片中，超过一半的情况下，你的答案比你预期的离正确答案更远"
如果被试在超过半数照片中实际绝对误差 < 主观误差（即不够精确），则收到 Underprecise 反馈："在刚才的五张图片中，超过一半的情况下，你的答案比你预期的离正确答案更近"

No-Feedback 组（占总样本的 33%）：不收到任何反馈，直接进入 Block 2（对照组）。

阶段 3：Block 2 — 信念更新 + 注意力成本操纵（5 张新照片）

被试观看 5 张新的历史照片（与 Block 1 不同），同样在被试层面随机排列：

2017 年 G20 峰会（真实平均年龄 60.97 岁）
1950 年 The Irascibles 艺术家群像（真实平均年龄 40.20 岁）
1901 年 Australian Labor Party（真实平均年龄 40.42 岁）
2019 年 Merkel 内阁（真实平均年龄 52.05 岁）
2007 年英国皇室家庭（真实平均年龄 48.65 岁）

对每张照片，被试依次完成以下步骤：

步骤 3a — 先验报告：与 Block 1 相同，先估计平均年龄（prior），再报告主观误差。

步骤 3b — 信息云展示：被试被告知将看到一个包含照片中 15 个人真实年龄的"信息云"（word cloud）。此时被试被随机分配到两个信息条件之一（50/50，被试间设计）：

Easy-Info 条件：信息云仅显示 15 个年龄数据（如"57 Jahre""66 Jahre"等），以不同大小和位置呈现在屏幕上，形成一个视觉上清晰的词云。
Hard-Info 条件：信息云在完全相同的位置展示相同的 15 个年龄数据，但额外添加 85 个无关诱饵词（常见德语名词，如 Baum=树、Buch=书、Tisch=桌子、Spaghetti 等）散布其中。诱饵词增加了信息处理复杂度，但不改变年龄信号本身的精度或内容。

关键设计细节：同一 treatment 条件内的所有被试看到完全相同的随机抽取的年龄和词汇组合。被试被明确告知信息云中包含 15 个对应照片中个体的真实年龄。

步骤 3c — 后验报告：看完信息云后，被试更新并报告新的平均年龄估计（posterior）。

阶段 4：实验后问卷

被试完成人口统计学问题（年龄、性别、教育、地区等）和一道感知任务难度评估："你在我们展示的图片和词云中观看信息有多困难？"（Likert 1-5 量表）。

激励机制

标准 Bilendi 问卷报酬 + 5% 概率获得 10 欧元奖金
奖金取决于单个随机选中估计的准确性
使用 binarized scoring rule：答案越接近正确值，获得奖金的概率越高
评分公式不直接展示给被试，仅告知"越准确获奖概率越高"

数据清洗（预注册标准）

排除未通过注意力检查或指令理解测试（4 题中答对不足 2 题）的被试
排除主观误差超过 $\max(prior, 100-prior)$ 的观测（逻辑不一致）
排除平均年龄估计超出 20-80 岁范围的观测
排除"加速器"（>50% 的先验估计在中位完成时间的 25% 内完成）
保留前 1,200 名合格被试

理论模型

贝叶斯更新 + 过度精确模型

个体 $i$ 对不确定基本面 $ heta$ 持有正态分布先验信念，均值 $\mu_{ heta,i}$ ，方差 $\sigma^2_{ heta,i}$ 。

过度精确参数 $\omega_i \in (0, \infty)$ 使个体感知的先验方差被缩小：
$$ ilde{\sigma}^2_{ heta,i} = \frac{\sigma^2_{ heta,i}}{\omega_i}$$
当 $\omega_i > 1$ 时个体为过度精确（感知先验方差 < 实际方差）， $\omega_i < 1$ 时为不够精确。

个体接收含噪公共信号 $x = heta + \epsilon$ ， $\epsilon \sim N(0, \sigma^2_\epsilon)$ 。个体通过注意力处理信号，添加个人特异性噪声 $\psi_i \sim N(0, \sigma^2_{\psi,i})$ ，感知信号为 $s_i = x + \psi_i$ 。 $\sigma^2_{\psi,i}$ 越大表示注意力越低。

后验信念为先验均值与信号的加权平均，更新率为：
$ $\beta_i = \frac{ ilde{\sigma}^2_{ heta,i}}{ ilde{\sigma}^2_{ heta,i} + \sigma^2_\epsilon + \sigma^2_{\psi,i}}$ $

最优注意力分配

个体通过最大化后验精度减去注意力成本来选择最优注意水平：
$ $\max_{\sigma^{-2}_{\psi,i}} -\phi_i \cdot Var( heta|s_i) - C(\sigma^{-2}_{\psi,i})$ $

注意力成本基于 Shannon 熵减少量：
$ $C(\sigma^{-2}_{\psi,i}) = \frac{\lambda_i}{2} \ln\left(1 + \frac{ ilde{\sigma}^2_{ heta,i} + \sigma^2_\epsilon}{\sigma^2_{\psi,i}}\right)$ $

最优更新率的闭式解：
$ $\beta^*_i = \max\left\{0, \frac{ ilde{\sigma}^2_{ heta,i}}{ ilde{\sigma}^2_{ heta,i} + \sigma^2_\epsilon} - \frac{\lambda_i}{2\phi_i ilde{\sigma}^2_{ heta,i}}\right\}$ $

三个可检验假设

H1（过度精确降低更新率）： $\frac{\partial \beta^*_i}{\partial \omega_i} < 0$ 。过度精确通过两个渠道降低更新：(a) 直接通道——缩小感知先验方差，降低标准 Bayesian 更新率的分子；(b) 间接通道——放大注意力成本项对更新率的削减。这是"非理性不注意"，因为即使提高激励 $\phi_i$ 也无法完全消除。

H2（注意力成本降低更新率）： $\frac{\partial \beta^*_i}{\partial \lambda_i} < 0$ 。这是标准 rational inattention 预测，提高激励可以抵消。

H3（过度精确放大注意力成本效应）： $\frac{\partial}{\partial \omega_i}\left(\frac{\partial \beta^*_i}{\partial \lambda_i}\right) = -\frac{1}{2\phi_i \sigma^2_{ heta,i}} < 0$ 。过度精确机械地放大注意力成本对更新率的负面效应。

模型拓展

多信号拓展：将模型扩展到多阶段信号环境，递归求解后各阶段更新权重 $\beta_t$ 的比较静态性质保持不变
一般成本函数拓展：将 Shannon 熵成本替换为一般的递增凸成本函数（线性、指数、幂函数），三个假设在内部解条件下均保持

核心发现

操纵检验

过度精确操纵有效（DID 分析）：初始过度精确的被试在收到 Overprecise 反馈后，Block 2 中过度精确显著降低；初始不够精确的被试在收到 Underprecise 反馈后变得更加过度精确。效应从 Block 2 第一张照片开始就出现，并在整个 Block 2 中持续。

注意力成本操纵有效：Hard-Info 条件下，被试的信念调整幅度更小（ $\hat{\alpha} = -0.734$ , $p < 0.01$ ）、后验误差更大（ $\hat{\alpha} = 0.497$ , $p < 0.01$ ）、浏览信息云的时间更长（中位数回归： $+1.43$ 秒， $p < 0.01$ ）。

预注册回归结果（Table 3）

预注册回归模型：
$ $posterior_{i,k} - prior_{i,k} = \alpha + (signal_k - prior_{i,k}) \cdot (\beta_0 + \beta_1 \cdot Overprecise + \beta_2 \cdot Underprecise + \beta_3 \cdot Hard ext{-}Info + \beta_4 \cdot Overprecise imes Hard ext{-}Info + \beta_5 \cdot Underprecise imes Hard ext{-}Info) + heta_j \cdot picture_k + \varepsilon_{i,k}$ $

变量	系数	标准误	显著性
$\beta_0$ (基准更新率, No-Feedback + Easy-Info)	0.595	(0.028)	***
$\beta_1$ (Overprecise 反馈效应)	+0.065	(0.037)	**
$\beta_2$ (Underprecise 反馈效应)	-0.012	(0.041)	n.s.
$\beta_3$ (Hard-Info 效应)	-0.138	(0.041)	***
$\beta_4$ (Overprecise x Hard-Info 交互)	-0.011	(0.056)	n.s.
$\beta_5$ (Underprecise x Hard-Info 交互)	+0.080	(0.061)	n.s.

Result 1：降低过度精确（Overprecise 反馈）提高信念更新率 ( $\hat{\beta}_1 = +0.065$ , $p < 0.05$ )，支持 H1。

Result 2：提高信息处理成本（Hard-Info）降低信念更新率 ( $\hat{\beta}_3 = -0.138$ , $p < 0.01$ )，支持 H2。

Result 3：预注册分析未发现过度精确与注意力成本之间的显著交互作用 ( $\hat{\beta}_4 = -0.011$ , n.s.)，不支持 H3。

Result 4：反馈干预具有不对称性——Overprecise 反馈显著降低过度精确并提高更新率，但 Underprecise 反馈对提高过度精确的效果统计上不显著。

探索性分析：更新比率模型（Table 5）

为解释预注册交互效应为零的原因，作者引入更精细的模型。发现反馈同时改变了过度精确和感知任务难度（Table 4：Overprecise 反馈组自报任务难度显著更高，系数 = 0.344, $p < 0.01$ ），形成混淆变量。

使用连续的过度精确度量（ $avg\_op_i$ = Block 2 中 5 张照片的平均过度精确）替代处理组虚拟变量，并控制自报难度，估计 update ratio 模型：
$ $U_{i,k} = \alpha + \gamma_0 \cdot Hard ext{-}Info_i + \gamma_1 \cdot avg\_op_i + \gamma_2 \cdot (avg\_op_i \cdot Hard ext{-}Info_i) + \gamma_3 \cdot difficulty_i + \gamma_4 \cdot (difficulty_i \cdot Hard ext{-}Info_i) + picture_k + \varepsilon_{i,k}$ $

关键发现：过度精确 x Hard-Info 交互项显著为负（OLS: $\gamma_2 = -0.090$ , $p < 0.05$ ; 分位数回归: $-0.017$ , $p < 0.01$ ; Huber robust: $-0.011$ , $p < 0.05$ ）。信息容易处理时，即使过度精确的被试也能响应信号；但信息处理成本高时，过度精确才显著降低响应——支持 H3 的"非理性不注意"机制。

后验误差交互分析（Table 6）

过度精确与 Hard-Info 的交互项对后验绝对误差也有正向显著效应（分位数回归: $0.183$ , $p < 0.01$ ; Huber robust: $0.148$ , $p < 0.01$ ），证实过度精确的被试在信息处理成本高时不仅更新率低，估计准确性也更差。

变量概览

观测变量（Outcome Variables）

信念修正 ( $posterior_{i,k} - prior_{i,k}$ )：后验估计与先验估计之差
更新比率 ( $U_{i,k}$ )： $(posterior_{i,k} - prior_{i,k}) / (signal_k - prior_{i,k})$ ，取值 0-1 表示信号响应程度
后验绝对误差 ( $|correct_k - posterior_{i,k}|$ )：后验估计的准确性
过度精确 ( $overprecision_{i,k}$ )： $|error_{i,k}| - subjective\_error_{i,k}$

核心自变量 / Treatment 变量

Overprecise 反馈（虚拟变量）：是否收到"你的答案比预期更远"的校准反馈
Underprecise 反馈（虚拟变量）：是否收到"你的答案比预期更近"的校准反馈
Hard-Info（虚拟变量）：信息云中是否包含 85 个诱饵词
avg_op（连续变量）：Block 2 中 5 张照片的平均过度精确度

控制变量

照片固定效应（ $picture_k$ ）
人口统计变量（年龄、性别、教育、地区）
自报任务难度（ $difficulty_i$ , Likert 1-5）

局限性

反馈的双重效应：Overprecise 反馈不仅改变过度精确，还同时提高了被试的感知任务难度，引入混淆变量，导致预注册的交互项不显著。这一问题仅在探索性分析中通过连续变量和控制难度来解决。
在线实验的控制力有限：与实验室实验相比，无法完全控制被试的注意力、环境干扰和工具使用（但作者指出无人答对所有 10 张照片的真实平均年龄，降低了搜索引擎��助的可能性）。
任务领域的外部效度：估计照片中人物平均年龄是一个相对特殊的任务，其结果能否推广到金融决策、宏观预期等经济学核心关注领域尚需进一步检验。
单次反馈干预的持续性：反馈仅在 Block 1 和 Block 2 之间提供一次，长期效果不明。
过度精确测量的个体层面噪声：SEM 方法依赖被试对自身误差的元认知判断，可能存在测量噪声。

与其他文献的关系

理性不注意

Sims_2003_RationalInattention - 理性不注意的奠基论文，本文在其框架中嵌入过度精确
Mackowiak_Matejka_Wiederholt_2023_RationalInattention_Review - 理性不注意文献综述，本文回应其呼吁将行为偏差纳入理性不注意框架
Dean_Neligh_2023_ExperimentalTests_RationalInattention - 理性不注意的实验检验

过度自信与过度精确

Moore_2022_Overprecision - 过度精确作为思维系统属性的理论框架
BoschRosa_Kassner_Ahrens_2024_Overconfidence_PoliticalFinancial - 使用 SEM 测量过度精确的方法论来源
Bregu_2020_Overconfidence_Overtrading_Feedback - 过度自信与反馈的实验研究

信念更新

Enke_Graeber_2023_CognitiveUncertainty - 认知不确定性与信念更新
Coutts_2019_GoodNewsBadNews_BeliefUpdating - 好消息/坏消息与信念更新的不对称性
Haaland_Roth_Wohlfart_2023_DesigningInformationExperiments - 信息实验设计方法论

注意力与偏好

Gabaix_2019_BehavioralInattention - 行为不注意的综合框架，本文提供了过度精确作为具体认知扭曲的证据
Pagel_2018_NewsUtility_Inattention - 偏好驱动的不注意，本文提供了信念驱动的对照机制
Bolte_Raymond_2024_EmotionalInattention - 情绪驱动的不注意

动机性信念

Benabou_2015_EconomicsMotivatedBeliefs - 动机性信念的经济学理论

实验方法

Danz_Vesterlund_Wilson_2022_BeliefElicitation_BIC - 信念诱导与激励相容

可拓展的研究方向

金融决策领域的应用：将过度精确-不注意机制应用于投资决策，检验过度精确的投资者是否在面对复杂市场信息时更倾向于忽视新信号、维持原有持仓
长期校准干预：测试反复反馈或元认知训练能否持久降低过度精确，并改善信息处理质量
激励水平的调节作用：模型预测理性不注意可通过提高激励消除，但非理性不注意不行——可设计实验直接检验这一区分
政策信息传播：检验过度精确是否解释了公众对货币政策公告、健康信息等公共信息的低反应性
个体异质性：探索过度精确与认知能力、金融素养等个体特征的交互作用

关键结论

过度精确是一种普遍的认知偏差，它通过直接降低新信息的感知价值和间接放大注意力成本两个渠道，导致"非理性的不注意"——一种由认知偏差而非理性权衡驱动的信息忽视
校准反馈可以有效降低过度精确并提高信念更新率，但效果具有不对称性：告知被试"你过于自信"的效果远强于告知"你不够自信"
标准 rational inattention 可通过提高激励缓解，但过度精确驱动的 irrational inattention 即使在高激励下也持续存在，这对公共信息传播和行为干预的设计具有重要的政策启示

BoschRosa_Overprecision_IrrationalInattention