Amelio_2022_CognitiveUncertainty_Overconfidence

更新于 2026/7/5

Cognitive Uncertainty and Overconfidence

元信息

  • 作者: Andrea Amelio
  • 年份: 2022
  • 期刊/来源: ECONtribute Discussion Paper No. 173, University of Bonn and University of Cologne
  • 关键词: Cognitive Uncertainty, Overconfidence, Overplacement, Cognitive Noise, Experiments
  • JEL: D91, C91, D83
  • DOI/链接: http://hdl.handle.net/10419/262335

一句话总结

通过在balls-and-urns信念更新任务中引入compound choices外生操纵认知不确定性(CU),本文证明CU是overplacement(高估自己相对他人的表现)的一个重要非动机性来源:CU越高,被试越倾向于认为自己比他人表现更好。

研究问题

Overplacement(过度自信的一种形式——高估自己在人群中的相对位置)为何如此普遍且持久?除了传统的动机性解释(ego utility)外,认知不确定性——即个体对自己最优答案的不确定程度——是否构成overplacement的一个独立来源?如果是,其因果机制是什么?

核心贡献

  1. 理论贡献:基于Enke and Graeber (2021)的CU框架,首次形式化地推导出CU→overplacement的理论预测——当被试对自己的表现不确定时,会将后验信念压缩向先验(50%),而这种压缩对自己和他人的程度不同
  2. 因果识别:通过compound choices(将信号诊断力参数以随机变量而非确定数字呈现)外生地提高CU约17%,建立CU→overplacement的因果关系
  3. 非动机性解释:提供了overplacement的认知噪声解释,与传统的belief-based utility解释互补

维度1:实验设计分析

实验任务详细流程

整体架构: 实验由一组信念更新任务(belief updating tasks)和最终问卷组成。每位被试完成6轮任务(sessions),前3轮为基准任务(baseline),后3轮为复合选择任务(compound choices)。

单轮任务的完整时间线(8步):

  1. 任务呈现(参数揭示与信号抽取): 被试面对经典"球与瓮"(balls-and-urns)任务。屏幕显示两个假想的瓮(Urn A 和 Urn B),每个瓮包含不同比例的蓝球和红球。被试被告知:(a) 100张牌的牌组中有A张牌标记为Urn A(A = 100 * P(A)),A 属于 {30, 50, 70};(b) Urn A中蓝球数量为B(B = 100 * P(blue|A)),B 属于 {70, 90},Urn B中蓝球数量为100-B。电脑从牌组中随机抽一张牌确定选中的瓮,然后从该瓮中抽取1或2个球作为信号(可能的信号组合: blue, red, blue-blue, red-red, blue-red, red-blue),单球抽取概率设为50%。

  2. 概率猜测(Probability Guess): 被试根据观察到的球的颜色,给出其对每个瓮被选中概率的最佳猜测(0-100之间,两个概率之和须等于100)。

  3. 排名预期(Rank Elicitation): 在同一页面上,被试被要求猜测自己在该特定任务中的整体排名(1-100之间,1为最佳)。这是一个绝对排位测度(absolute placement measure)。

  4. 认知不确定性引出(CU Elicitation): 被试被问"你有多确定你的最优猜测恰好是X%?"——屏幕上显示一个滑块,从"非常确定"(Very Certain)到"非常不确定"(Very Uncertain)。被试点击滑块后,系统会动态显示其认为最优答案所在的区间范围(如"你确信最优猜测在11%到29%之间")。该操作化方法直接沿用Enke和Graeber (2021)的设计。

  5. 观察他人答案(Other Participant's Answer Shown): 被试看到另一位参与者对同一任务的答案(该答案来自前期预研究中收集的答案池,条件匹配于相同的参数设定和信号实现)。

  6. 相对排位信念(Relative Placement Belief): 被试被问"你是否比另一位参与者表现更好?",要求给出0-100之间的概率判断(100=确信自己更好,0=确信对方更好)。这是核心的overplacement测度。

  7. 答案调整机会(Chance to Change Probability Guess): 被试可以选择修改或保持自己最初的概率猜测。

  8. 对他人CU的预期(Expectations about Other Participant's CU): 被试评估另一位参与者在给出答案时的认知不确定性水平。

复合选择条件(Compound Choices, 后3轮): 在后3轮中,信号诊断力参数B不再以确定数字呈现,而是以随机变量的期望值呈现。这引入了模糊性(ambiguity),旨在外生地提高被试的认知不确定性。在步骤5中,被试看到的是来自等价的非复合(reduced)问题的另一被试答案,且明确告知两个问题的正确答案相同。

其他实验设计要素

要素 内容
实验类型 在线实验(Amazon Mechanical Turk),被试内设计(within-subject)
Treatment设计 2个条件:基准任务(前3轮,参数确定)vs. 复合选择任务(后3轮,参数以随机变量呈现)。6种参数组合(3种A值 x 2种B值)跨6轮呈现
随机化 参数组合在6轮间随机分配;复合选择始终在后3轮(非完全随机化);观察到的他人答案从预研究答案池中随机抽取
核心观测变量 (1) Placement: 相对排位信念(0-100概率); (2) Rank: 绝对排名预期(1-100); (3) CU: 认知不确定性(滑块测度); (4) Answer Adjustment: 答案调整幅度
因果识别策略 复合选择作为CU的外生操纵工具——引入模糊性使CU平均提高17%;比较compound vs. baseline条件下的overplacement差异
样本量 主实验: 422人招募,198人因理解力测试不合格被筛除,最终N=224(1224观测值=224人x约5.5轮有效数据); 预研究: 176人招募,105人通过筛选,用于构建答案池
激励机制 基础报酬0.5 USD(接受任务)+ 4.5 USD(完成实验)+ 最高3 USD绩效奖金(基于概率猜测准确性的激励相容机制); 平均总报酬6.62 USD; 平均耗时23分钟
亮点 (1) 首次将认知不确定性框架与overplacement现象建立理论和实证联系; (2) 通过compound choices外生操纵CU以建立因果关系; (3) 同时测量绝对排名和相对排位两种placement指标; (4) 发现overplacement与概率加权(probability weighting)的初步关联
局限 (1) compound choices始终在后3轮,存在顺序效应风险; (2) MTurk样本代表性有限; (3) balls-and-urns任务的生态效度较低; (4) CU的滑块测度可能存在需求效应; (5) R^2值较低(0.05-0.21),说明CU只解释了overplacement变异的一小部分; (6) 仅关注overplacement,对overestimation和overprecision的分析有限

维度2:理论模型

基准理论

模型建立在 Enke and Graeber (2021) 的认知不确定性(CU)框架之上,并扩展至overplacement领域。同时将Moore and Healy (2008) 的过度自信基准模型纳入比较。

核心建模框架

效用函数与信号提取:

  • 二次效用: u(a,x) = -\frac{1}{2}(a - Bx)^2
  • 最优行动: a^* = Bx
  • 认知噪声: 代理人不直接观察状态变量x,而是通过含噪信号 s = x + \varepsilon 观察,其中 \varepsilon \sim \mathcal{N}(0, \sigma_\varepsilon^2)
  • 先验: x \sim \mathcal{N}(x_0, \sigma_x^2)

认知不确定性的定义:
$a^*(x \mid s) \sim \mathcal{N}(B\lambda s + B(1-\lambda)x_0, \; B^2(1-\lambda)\sigma_x^2)$
其中 \lambda = \frac{\sigma_x^2}{\sigma_x^2 + \sigma_\varepsilon^2}

认知不确定性 \sigma_{CU} 定义为上述分布的标准差,即代理人对自身最优行动的不确定性程度。

简化模型(用于overplacement分析):
$u(a,x) = -\frac{1}{2}(x - a)^2 \quad \Rightarrow \quad a^* = x$

关键定义与命题

Definition 1 (Placement): 代理人i相对于代理人j的placement为:
$Placement_i(a_i^*, a_j^*) = P(u(a_j^*, x) < u(a_i^*, x))$

Definition 2 (Rank): 代理人i的期望排名为:
$Rank_i(a_i^*) = \mathbb{E}_{G_i}[Placement_i(a_i^*, a_j^*)]$

Proposition 1: 对于信念 a^* \sim \mathcal{N}(a_i^*, \sigma_{CU}^2) 的代理人i:

  • (i) Placement_i(a_i^*, a_j^*) = \begin{cases} 1 - F_{a_i^*}\left(\frac{a_i^* + a_j^*}{2}\right) & \text{if } a_j^* < a_i^* \\ F_{a_i^*}\left(\frac{a_i^* + a_j^*}{2}\right) & \text{if } a_j^* \geq a_i^* \end{cases}
  • (ii) Placement关于认知不确定性递减
  • (iii) Rank关于认知不确定性递减

信念更新(动态模型):
$a^* \sim \mathcal{N}\left(\frac{\sigma_{-i}^2}{\sigma_{-i}^2 + \sigma_{CU}^2}a_i^* + \frac{\sigma_{CU}^2}{\sigma_{-i}^2 + \sigma_{CU}^2}a_j^*, \; \frac{\sigma_{CU}^2 \sigma_{-i}^2}{\sigma_{-i}^2 + \sigma_{CU}^2}\right)$

Proposition 2: 对他人CU评估更高(\sigma_{-i,H} > \sigma_{-i,L})的代理人,更新后的placement更高,即更容易产生persistent overplacement。

可检验预测(Hypotheses)

  1. H1: Placement关于自身CU (\sigma_{CU}) 递减,关于对他人CU的评估 (\sigma_{-i}) 递增
  2. H2: Rank关于CU递减(CU越高,自我排名越低/越差)
  3. H3: 对他人信息的反应(答案调整)关于CU递增,关于 \sigma_{-i} 递减

维度3:核心发现

主要结论

发现1: CU与Placement负相关(支持H1)

  • CU对placement的系数: -0.915* (SE=0.176, p<0.01)(全模型,Table 1 Col.6)
  • Compound choice虚拟变量系数: -9.487* (SE=1.411, p<0.01)
  • \sigma_{-i} 的模型中: CU系数 -1.333* (SE=0.157), \sigma_{-i} 系数 +1.045* (SE=0.143)(Table 2 Col.6)
  • compound choices使CU平均提高17%,支持因果解释
  • R^2从0.097(不含 \sigma_{-i})提升至0.211(含 \sigma_{-i}),说明两个变量联合解释力显著增强

发现2: CU与Rank正相关(支持H2,注意编码方向)

  • CU对rank的系数: +0.754* (SE=0.219, p<0.01)(Table 3 Col.5-6)
  • Compound choice系数: +2.711* (SE=1.036, p<0.01)
  • CU越高的被试自我排名数值越大(=排名越靠后/越差)

发现3: CU与答案调整正相关(支持H3)

  • OLS: CU系数 +0.195* (SE=0.035), \sigma_{-i} 系数 -0.243* (SE=0.048)(Table 4 Col.4)
  • Probit(调整概率): CU系数 +0.038* (SE=0.007), \sigma_{-i} 系数 -0.062* (SE=0.008)(Table 5 Col.4)
  • 仅243/1224观测值(19.9%)存在非零答案调整

发现4: CU与Overplacement(直接测度)

  • Probit(overplacement概率): CU系数 -0.031* (SE=0.007)(Table 6 Col.4)
  • 加权overplacement(OLS): CU系数 -0.459* (SE=0.113), \sigma_{-i} 系数 +0.378* (SE=0.106)(Table 7 Col.4)

发现5: Overplacement与后验概率压缩(Posterior Compression)的关联

  • 自我排名较高(数值小)的被试展现更明显的反S型概率加权模式
  • 自我排名较低的被试后验概率更接近贝叶斯基准(45度线)
  • 初步证据,作者强调此发现不够稳健

稳健性

  • 结果在多种模型设定下稳健(有/无控制变量、有/无session固定效应、有/无人口统计学控制)
  • CU与compound choice的效应在加入 \sigma_{-i} 后仍然显著,但compound choice系数有所下降
  • |a_i^* - a_j^*|(答案距离)的系数始终显著为正,与理论预测一致
  • R^2整体偏低(最高0.211),说明模型解释力有限
  • Overplacement与posterior compression的关联仅在rank分组下成立,placement分组下不成立

维度6:与其他文献的关系

在信念与认知偏差研究中的位置

本文处于认知不确定性/噪声过度自信两支文献的交叉点:

认知噪声/不精确性                    过度自信
Woodford (2020)                   Moore & Healy (2008)
Khaw, Li, Woodford (2017)        Malmendier & Tate (2005)
Gabaix (2019)                    Barber & Odean (2001)
        |                               |
        v                               v
  Enke & Graeber (2021)    <--本文-->   Overplacement
  (认知不确定性框架)           桥接       (相对表现评估偏差)
        |                               |
        v                               v
  概率加权/后验压缩              动机性信念
  (inverse S-shape)           Benabou & Tirole (2002)

核心对话文献

  • Enke & Graeber (2021): 本文直接继承其CU框架和实验范式(balls-and-urns + CU滑块测度 + compound choices操纵),扩展至overplacement领域
  • Moore & Healy (2008): 本文在附录中展示CU模型可以复现MH模型的主要预测(hard-easy effect等),且CU框架额外提供了对overprecision的解释方向
  • Benjamin (2019): 实验任务设计的参考基准(balls-and-urns范式的标准化)

独特贡献

  1. 首次在理论上将认知不确定性与overplacement形式化联系
  2. 提供overplacement持久性(persistence)的非动机性解释:高 \sigma_{-i} 导致更保守的信念更新
  3. 首次记录overplacement测度与概率加权形状之间的经验关联

研究主题标签

#cognitive_uncertainty #overconfidence #overplacement #belief_updating #cognitive_noise #balls_and_urns #compound_choices #probability_weighting

维度4:变量概览

观测变量(Outcome Variables)

  • Placement:相对排位信念(0-100概率),核心overplacement测度——被试认为自己比随机对手表现更好的主观概率
  • Rank:绝对排名预期(1-100),overestimation的测度
  • Answer Adjustment:看到他人答案后的概率猜测调整幅度

核心自变量 / Treatment 变量

  • CU(认知不确定性):滑块测度,被试对自己最优答案的不确定程度
  • Compound Choice条件:是否在compound choice轮次中(CU的外生操纵工具)

控制变量

  • 先验概率 P(A) \in \{0.3, 0.5, 0.7\}
  • 信号诊断力 P(blue|A) \in \{0.7, 0.9\}
  • 信号实现(球的颜色组合)
  • 概率猜测误差绝对值(控制能力差异)

维度5:局限性

  • 顺序效应:compound choice始终在后3轮,无法完全排除学习/疲劳效应与CU操纵的混淆
  • 样本筛选率高:422人中198人(47%)因理解力测试不合格被排除,最终分析样本可能偏向高认知能力群体,限制外部效度
  • R^2值较低(0.05-0.21):CU只解释了overplacement变异的一小部分,大量变异来自其他未测量的因素
  • CU测度的需求效应:滑块测度可能引导被试报告更高的不确定性
  • balls-and-urns任务的生态效度:人们在日常生活中的overplacement(如驾驶能力、工作表现)可能受完全不同的心理过程驱动
  • 仅关注overplacement:对overestimation和overprecision的分析有限

维度7:可拓展的研究方向

  • 将CU框架推广到更自然的overconfidence情境:如学业成绩预测、投资能力自评,检验CU在ego-relevant领域是否仍是独立于motivated reasoning的解释因素
  • CU与motivated beliefs的交互:在同一实验中同时操纵CU和信念效用激活,分解两者对overplacement的相对贡献
  • 概率加权与overplacement的因果关系:本文发现了相关性,但概率加权形状是否因果地影响相对排位信念有待进一步检验
  • 动态设置中的CU演化:在多轮反馈环境中,CU是否随经验下降?overplacement是否相应减少?
  • Eil_Rao_2011_GoodNewsBadNews_AsymmetricProcessing的对接:Eil and Rao的good news-bad news effect是否部分由CU中介——对坏消息的更新更嘈杂是否反映了更高的认知不确定性?

关键结论

  1. 认知不确定性(CU)是overplacement的一个独立的非动机性来源:通过compound choices外生提高CU约17%后,被试的overplacement显著增加——即使没有ego utility动机,认知噪声本身就能产生系统性的自我高估
  2. 被试对他人的CU估计系统性偏高,导致他们认为自己的判断相对更精确——这种"信息不对称错觉"是overplacement持久性的重要机制