Wittrock_Strobel_2023_BeliefUpdating_Misinformation

更新于 2026/7/5

Belief Updating with Misinformation

Authors: Lars Wittrock, Martin Strobel, Elias Tsakas
Year: 2023 (Working Paper, August 1, 2023)
Affiliation: Department of Micro and Public Economics, Maastricht University
JEL: D83, D91, C91
Keywords: Belief Updating, Information Uncertainty, Misinformation, Fact-checking, Retractions, Confirmations


一句话总结

通过将信息不确定性嵌入经典 ball-and-urn 范式,证明被试对"信息关于信息"(撤回与确认)的反应平均无偏但个体高度异质,且系统性地由初始反应所预测——过度反应者表现出 continued influence effect,反应不足者表现出 reverse effect,从而调和了 misinformation 文献的争议。

研究问题

  • 当一条之前的不确定信号被事后核查(撤回 retraction 或确认 confirmation)后,被试如何更新其信念?是否符合贝叶斯基准?
  • 既然 retraction 在抽象环境(无叙事、无动机推理)下也未能让信念回到先验,那么个体层面的偏差是系统性的还是随机的?能否被初始反应预测?
  • 事前(ex-ante)同时获得信号颜色与其信息性,与事后(ex-post)核查相比,是否能减少信念误差?
  • 反复 retraction 是否会通过增加信念方差而成为信念极化的潜在驱动机制?

核心贡献

  1. 方法创新:首次将"信息不确定性"嵌入 Grether-Benjamin 经典 ball-and-urn 范式(informative + uninformative 球混合于黑盒),使得实验者能够在无歧义、无动机推理污染的条件下撤回或确认之前的不确定信号。
  2. 解决文献争议:发现 retraction 后的平均信念差异不显著(与 Goncalves, Libgober & Willis 2022 的平均 continued influence 不一致),但个体异质性可由初始反应方向系统性预测(核心系数 \beta_1 = 0.614R^2 = 0.309),从而提供统一框架解释为何不同研究结论冲突。
  3. 同时研究 retraction 与 confirmation:揭示对 confirmation 的系统性反应不足(仅 8 pp 的额外更新,远低于贝叶斯基准),且初始反应同样预测 confirmation 后的偏差。
  4. 信念分散化机制:证明多次 retraction 后信念方差(7.1 pp)远大于等价的 uninformative 信号(4.4 pp),暗示 misinformation 的存在本身可能是信念极化的潜在驱动力。
  5. 过度推断的新证据:在引入信号不确定性后,发现 c = 1.530 > 1(过度推断),与 Benjamin (2019) meta 分析中的 under-inference 形成对比,呼应 Thaler (2021) 关于弱信号过度推断的发现。

维度1:实验设计分析

实验任务详细流程

本文包含两个在线实验(Experiment 1 和 Experiment 2),均使用经典球与罐范式(ball-and-urn framework)的创新修改版本。实验刻意采用抽象框架以排除动机推理(motivated reasoning)等混杂因素。

共同设定

  • 基本结构: 有两个罐子(Red urn 和 Blue urn),各含4个球。Red urn含3红1蓝,Blue urn含3蓝1红。实验开始时随机等概率选择一个罐子,整个实验过程中保持不变。
  • 信息不确定性的引入: 被选中罐子的4个球(标记为"I",informative)被放入一个黑盒中,同时加入6个无信息球(标记为"U",uninformative;3红3蓝)。黑盒共含10个球。
  • 被试任务: 估计被随机选中的罐子是 Red urn 的概率。

Experiment 1:Ex-post Information Checks(基线实验)

时间线(12轮):

  1. 指导语阶段:

    • 被试首先看到两个罐子的图示(Red urn: 3红1蓝; Blue urn: 3蓝1红)
    • 翻页后解释黑盒机制:4个informative球(来自选中罐子)+ 6个uninformative球(3红3蓝,不来自罐子)
    • 解释激励机制(二次评分规则 quadratic scoring rule),详细数字隐藏在按钮后
    • 被试需正确回答5/6道理解测试题方可进入正式实验
  2. 每轮操作(共12轮,其中9轮抽球 + 3轮信息核查):

    • 抽球轮(9轮): 从黑盒中随机抽取一个球(有放回),告知被试球的颜色,但不告知是I球还是U球。被试随后报告其对Red urn被选中概率的信念(0-100%)。
    • 信息核查轮(3轮): 不抽新球,而是告知被试上一轮所见的球来自哪组(informative还是uninformative)。这构成了:
      • Retraction(撤回): 告知上一轮的球是uninformative的(即无信息量)
      • Confirmation(确认): 告知上一轮的球是informative的(即确实来自罐子)
    • 核查轮在不同被试间系统性变化位置,但总是连续三轮核查
  3. 信息展示:

    • Treatment 1(基线): 显示全部信号历史和上一轮报告的信念
    • Treatment 2(No previous belief): 不显示上一轮报告的信念
    • Treatment 3(No history): 隐藏信号历史,仅显示最近信号(核查轮也显示被核查的初始信号)
  4. 实验结束后: 策略问卷 + 人口统计学问题

Experiment 2:Ex-ante Information Verification(Combined Signal Treatment)

时间线(9轮):

  1. 指导语阶段: 与Experiment 1类似,但说明信号展示方式不同

  2. 每轮操作(共9轮):

    • 每轮从黑盒抽取一个球(有放回)
    • 6轮为uncertain signal: 仅告知球的颜色,不告知是I还是U
    • 3轮为combined signal: 同时告知球的颜色和其类型(informative或uninformative)——即ex-ante验证
    • 被试每轮报告信念
  3. 关键区别: 这里是事前(ex-ante)同时展示信号颜色和信息性,而非像Experiment 1那样事后(ex-post)核查

其他实验设计要素

要素 内容
实验类型 在线实验(Prolific招募),使用oTree平台
Treatment设计 Experiment 1: 3个treatment(基线/不显示前信念/不显示历史) x 信息核查位置变化;Experiment 2: combined signal treatment,同样有3个信息展示treatment
随机化 罐子随机选择;球抽取随机(有放回);信息核查轮位置在被试间系统变化
观测变量 每轮报告的信念(0-100%概率);与贝叶斯后验的偏差;信念变化方向与幅度
因果识别 抽象框架排除内容依赖性;within-subject比较(同一被试在不同轮次的信念);between-subject比较(不同信号历史的被试);压缩历史固定效应控制信号序列
样本量 两个实验共849名被试完成,剔除96名后753名有效。Experiment 1报告12个信念,Experiment 2报告9个信念,共8,397个观测值。985个retraction观测,635个confirmation观测
激励机制 固定参与费2.50欧元 + 基于二次评分规则(QSR)的奖金最高3.00欧元。随机选取一轮计算奖金,公式:3 - 3 * error^2。平均报酬4.80欧元,中位时间17分钟
亮点 (1) 创新性地将信息不确定性引入经典ball-and-urn范式;(2) 可以无歧义地撤回或确认之前的不确定信息;(3) 同时研究retraction和confirmation;(4) 排除动机推理和叙事因果结构的影响
局限 (1) 抽象框架可能低估现实中动机推理的放大效应;(2) 3轮信息核查样本量有限;(3) 在线实验可能存在注意力问题(虽已通过理解测试和剔除标准控制);(4) 无法完全区分个体层面的持续偏差类型(每个被试的retraction数据太少)

维度2:理论模型

基准理论

贝叶斯更新作为理性基准。 框架建立在二元状态空间 Theta = {Blue (B), Red (R)} 上,先验 p = 0.5。

三种信号类型:

  1. Informative signal (pi_I):以概率 1 - epsilon 揭示真实状态
    $\pi_I(b|B) = \pi_I(r|R) = 1 - \varepsilon = 0.75$

  2. Uninformative signal (pi_U):不含任何关于状态的信息
    $\pi_U(b|B) = \pi_U(b|R) = \beta = 0.5$

  3. Uncertain signal:两种信号的混合,alpha = 0.4 为informative的概率
    $\pi(b|\theta) = \alpha \pi_I(b|\theta) + (1-\alpha)\beta$
    实验参数下:pi(r|R) = pi(b|B) = 0.6

行为偏差的形式化

Grether-Benjamin 模型(Equation 2):
$b(R|\mathbf{s}) = \frac{\pi(\mathbf{s}|R)^c \cdot p(R)^d}{\pi(\mathbf{s}|R)^c \cdot p(R)^d + \pi(\mathbf{s}|B)^c \cdot p(B)^d}$

  • c = 推断参数(inference),c > 1 为过度推断,c < 1 为推断不足
  • d = 基率使用参数(base-rate use),d < 1 为基率忽视
  • 贝叶斯更新的特殊情况:c = d = 1

Retraction的理性基准(Equation 6中的回归模型):
$b_t(R|\mathbf{s_{t-1}}, \mathbf{r_t}) - p_{t-1}(R) = \alpha + \beta_1 \cdot (b_{t-1}(R|\mathbf{s_{t-1}}) - p_{t-1}(R|\mathbf{s_{t-1}})) + \epsilon_t$

  • 理性预测:alpha = 0, beta_1 = 0(retraction后信念应回到先验,不受初始反应影响)
  • 实际发现:beta_1 = 0.614***,初始偏差强烈预测retraction后的偏差

Confirmation的理性后验(Equation 3):
$p_t(R|\mathbf{s_{t-1}}, \mathbf{c_t}) = \frac{p_{t-1}(R) \cdot \pi_I(\mathbf{s_{t-1}}|R)}{p_{t-1}(B) \cdot \pi_I(\mathbf{s_{t-1}}|B) + p_{t-1}(R) \cdot \pi_I(\mathbf{s_{t-1}}|R)}$

关键假设

  1. 被试进行序贯更新(sequential updating):上一轮报告的信念作为下一轮的先验
  2. 理性被试在retraction后应"遗忘"被撤回的信号,回到之前的先验
  3. 理性被试在confirmation后应基于初始先验和informative signal进行更新(而非基于已报告的信念)

可检验预测

  • Q1: Retraction后信念应回到先验(无continued influence effect)
  • Q2: Confirmation后初始更新不应影响最终信念
  • Q3: Ex-ante验证(combined signal)应比ex-post核查产生更准确的信念
  • Q4: 过去的信息核查不应影响未来对新不确定信息的反应

维度3:核心发现

Result 1: 显著的过度推断和基率忽视

  • 推断参数 beta_1 (c) = 1.530***(SE = 0.051),显著大于1 --> 过度推断
  • 基率使用参数 beta_2 (d) = 0.697***(SE = 0.027),显著小于1 --> 基率忽视
  • 与Benjamin (2019) meta分析一致的基率忽视,但过度推断与其发现不同(可能因为信号不确定性的引入)

Result 2: 对retraction的反应高度异质

  • 32% 的情况被试正确回到先验
  • 34% 的情况被试反应不足(continued influence of retracted information)
  • 34% 的情况被试反应过度(reverse effect)
  • 平均信念差异为 0.009(SE = 0.007),不显著异于零 --> 平均无偏,但个体层面严重偏差
  • 这与 Goncalves et al. (2022) 发现的平均continued influence effect相矛盾

Result 3: 初始反应预测retraction后的信念偏差

  • 核心回归:beta_1 = 0.614*(SE = 0.052),R-squared = 0.309(Table 4)
  • 初始贝叶斯更新 --> retraction后无偏
  • 初始过度反应 --> retraction后continued influence(信念仍偏向被撤回信号方向)
  • 初始反应不足 --> retraction后reverse effect(信念低于先验)
  • 被试大约只纠正初始错误的 40%(即beta_1在0和1之间)
  • 举例:先验50%,看到红球后报告80%(贝叶斯为60%,过度反应20pp),retraction后平均报告约62%(而非回到50%)

Result 4: Retraction与对立新信息的反应不同

  • 被试对对立颜色新球的反应显著强于retraction(过度反应至偏离初始先验)
  • Retraction交互项系数 = 0.056***(SE = 0.013),Table 10

Result 5: 被试系统性地对confirmation反应不足

  • 初始信号的平均信念变化约 10个百分点,confirmation后额外变化仅约 8个百分点
  • 理性情况下应为相反模式(confirmation后应有更大更新,因为informative signal的信息量大于uncertain signal)
  • 回归中 beta > 0(Table 11),初始偏差同样预测confirmation后的偏差
  • 即使初始贝叶斯反应的被试也在confirmation后under-react

Result 6: 过去的信息核查对未来更新无显著影响

  • 过去retraction/confirmation的数量、颜色等对未来uncertain signal的反应无显著系统影响
  • Table 14-15中部分系数虽显著,但缺乏直觉解释且不稳健

关于ex-ante vs ex-post验证

  • 单次retraction的信念与单次uninformative signal的信念在平均水平上无显著差异
  • 但经过多次连续retraction后,信念方差显著更大(3次retraction后方差 7.1%pts vs uninformative signal的 4.4%pts)
  • 正确回到先验的人数:retraction后始终低于uninformative signal

稳健性

  • 结果对信息展示方式的变化稳健(隐藏历史/隐藏前信念的treatment无显著影响,Table 8 column 2)
  • 控制被试类型(average over-report, inference, base-rate use)后初始更新仍是最强预测因子(Table 7)
  • 控制前一轮(t-2)的错误后结果不变(Table 8 column 1)
  • 使用Goncalves et al. (2022)的压缩历史方法复制,结果一致(Table 5)

维度6:与其他文献的关系

领域位置

本文处于实验经济学中信念更新(belief updating)文献与心理学/政治学中虚假信息(misinformation)文献的交叉点。核心贡献是将信息关于信息(information about information)的处理方式引入经典belief updating范式进行严格研究。

核心对话论文

论文 关系
Goncalves, Libgober & Willis (2022) 最直接的前序工作。同样修改ball-and-urn研究retraction,发现平均continued influence effect。本文发现平均无偏但个体异质,并提供基于初始反应的预测机制解释差异。本文还额外研究confirmation
Benjamin (2019) 信念更新meta分析的基准框架(Grether模型)。本文发现基率忽视一致但过度推断不同
Ecker et al. (2022) 心理学continued influence effect综述。本文用抽象框架排除了叙事因果结构和动机推理等混杂因素
Grether (1980) 提出reduced-form模型分解inference和base-rate use
Thaler (2021) 弱信号过度推断。本文的uncertain signal设定支持此发现
Johnson & Seifert (1994) 心理学中continued influence effect的经典论文
Danz, Vesterlund & Wilson (2020) 二次评分规则的激励信息隐藏方法
Liang (2020) 信息不确定性下的信念更新,发现under-inference
Nieminen & Rapeli (2018); Walter et al. (2020) fact-checking文献综述

新贡献

  1. 新的更新偏差类型: 首次揭示对"信息关于信息"(retractions和confirmations)的处理存在系统性偏差,且该偏差可由初始反应预测
  2. 解决文献争议: 解释了为何不同研究关于continued influence effect的发现不一致——平均来看无偏,但个体根据初始反应方向系统性偏差
  3. 信念分散化机制: 证明多次retraction导致信念方差远大于等价的uninformative signal,揭示misinformation是信念极化的潜在驱动因素
  4. Confirmation的under-reaction: 首次在实验中研究对prior uncertain information的confirmation效应
  5. 方法创新: 将信息不确定性嵌入ball-and-urn范式的新实验设计,可无歧义地retract/confirm之前的不确定信息

维度4:变量概览

变量 类型 定义 用途
报告信念 b_t(R | s) 因变量(连续, 0-100%) 被试每轮报告"罐子为 Red urn"的主观概率 主分析的核心输出
贝叶斯后验 p_t(R | s) 基准(连续, 0-1) 给定信号历史的理性后验 与报告信念比较以测量偏差
信念变化 \Delta b_t 连续 b_t - b_{t-1} 测量信号反应幅度
信号类型 分类(I / U / uncertain / combined) 球的实际信息性,被试可能知或不知 Treatment 变量
核查类型 分类(retraction / confirmation) 上一轮信号被事后核查的结果 主要 treatment
初始更新偏差 连续 b_{t-1}(R|s) - p_{t-1}(R|s) Equation 6 中关键自变量
推断参数 c 估计参数 Grether 模型中信号权重 量化过度推断
基率使用参数 d 估计参数 Grether 模型中先验权重 量化基率忽视
信息展示 treatment 分类(基线 / 无前信念 / 无历史) 屏幕显示内容差异 稳健性检验
核查轮位置 分类 3 轮核查在 12 轮中的位置(被试间变化) 控制位置效应
理解测试得分 控制变量 6 题中正确数 剔除 < 5 的被试
人口统计 控制变量 性别、年龄、教育等 异质性分析

维度5:局限性

  1. 抽象框架的外部效度:刻意排除动机推理与叙事因果结构,可能低估现实中 misinformation 在政治/健康议题上的真实影响(继续影响效应可能在有动机推理下更大)。
  2. 信号参数特定:实验仅在 \alpha = 0.4(informative 概率)、\varepsilon = 0.25(informative 信号噪声)的特定参数下展开,结果是否对其他不确定性水平稳健有待检验。
  3. 核查样本量有限:每个被试最多观察 3 次 retraction,难以在个体层面精确估计持续性偏差类型。
  4. 在线实验注意力问题:尽管已通过理解测试和剔除标准控制,但在线被试相比实验室被试仍可能存在更大的注意力波动。
  5. 缺乏机制识别:发现"初始反应预测后续偏差",但未能直接区分背后机制(锚定 anchoring、保守主义 conservatism、记忆偏差 memory bias 等)。
  6. 未与现实 misinformation 干预对比:未检验研究结论对 fact-checking 政策(如 Twitter/Facebook 标签)的直接政策含义。
  7. 样本主要为大学生与 Prolific 用户:年轻、受教育程度较高,可能与一般人群在信念更新模式上存在系统差异。

维度7:可拓展的研究方向

  1. 引入动机推理与叙事:在政治、健康、气候等真实议题中重复设计,测试初始反应预测假说是否依然成立,并量化动机推理放大效应。
  2. 机制识别实验:通过加入记忆任务、注意力探测、再认测试等区分 retraction 失效是源于"未能从工作记忆中删除"还是"未能根据新信息重新计算"。
  3. 结构估计:将 Grether-Benjamin 框架扩展到允许 retraction-specific 参数(c_Rd_R),并结构性估计 retraction 处理的认知成本。
  4. 市场层面后果:将本范式嵌入实验金融市场,研究 misinformation 的撤回如何影响价格发现、波动率与极化。
  5. 信念极化与社会传染:通过多轮 retraction 与社会信息(peer beliefs)交互,测试 misinformation 是否通过分散化机制驱动群体极化。
  6. 干预设计:测试不同 retraction 呈现方式(强调原信号无效 vs. 提供更正信号)、时机(即时 vs. 延迟)、来源可信度对纠偏效果的影响。
  7. 联系金融决策:将信念测量与投资组合选择/交易行为联系,检验 misinformation 处理偏差是否预测真实金融决策中的过度反应或滞后调整。
  8. 跨文化比较:在不同信任水平、媒体环境的国家重复实验,检验 retraction 反应模式的普遍性。

元数据

字段 内容
来源 Working Paper (Maastricht University)
实验时间 Experiment 1: 2022年1月; Experiment 2: 2023年1月
平台 oTree + Prolific
预注册 有(分析方法相对预注册有微调)
数据可得性 未提及

关键结论

  1. Retraction 不是"重置"而是"部分纠正":在排除动机推理的抽象环境中,被试平均仅纠正初始更新偏差的约 40%,且纠正方向由初始反应符号决定——过度反应者最终保留 continued influence,反应不足者最终出现 reverse effect。这一发现统一了此前关于 continued influence effect 是否真实存在的文献分歧。
  2. Misinformation 是信念分散化(而非平均偏移)的来源:多次 retraction 显著扩大信念方差但不改变均值,意味着信息生态中的 misinformation 即使被完全撤回,也会通过认知处理异质性产生群体内信念极化,对民主审议和金融市场流动性具有重要含义。相关链接:Augenblick_Lazarus_Thaler_2025_Overinference_UnderinferenceBenjamin_2019_BaseRateNeglect_FoundationsCoutts_2019_GoodNewsBadNews_BeliefUpdatingThaler_GoodNews_MotivatedReasoningEnke_Zimmermann_2019_CorrelationNeglect_BeliefFormationCharness_2017_ConfirmationBias_MotivatedBeliefsHossain_2020_BeliefFormation_SignalCorrelation