Belief Updating with Misinformation

Authors: Lars Wittrock, Martin Strobel, Elias Tsakas
Year: 2023 (Working Paper, August 1, 2023)
Affiliation: Department of Micro and Public Economics, Maastricht University
JEL: D83, D91, C91
Keywords: Belief Updating, Information Uncertainty, Misinformation, Fact-checking, Retractions, Confirmations

一句话总结

通过将信息不确定性嵌入经典 ball-and-urn 范式，证明被试对"信息关于信息"（撤回与确认）的反应平均无偏但个体高度异质，且系统性地由初始反应所预测——过度反应者表现出 continued influence effect，反应不足者表现出 reverse effect，从而调和了 misinformation 文献的争议。

研究问题

当一条之前的不确定信号被事后核查（撤回 retraction 或确认 confirmation）后，被试如何更新其信念？是否符合贝叶斯基准？
既然 retraction 在抽象环境（无叙事、无动机推理）下也未能让信念回到先验，那么个体层面的偏差是系统性的还是随机的？能否被初始反应预测？
事前（ex-ante）同时获得信号颜色与其信息性，与事后（ex-post）核查相比，是否能减少信念误差？
反复 retraction 是否会通过增加信念方差而成为信念极化的潜在驱动机制？

核心贡献

方法创新：首次将"信息不确定性"嵌入 Grether-Benjamin 经典 ball-and-urn 范式（informative + uninformative 球混合于黑盒），使得实验者能够在无歧义、无动机推理污染的条件下撤回或确认之前的不确定信号。
解决文献争议：发现 retraction 后的平均信念差异不显著（与 Goncalves, Libgober & Willis 2022 的平均 continued influence 不一致），但个体异质性可由初始反应方向系统性预测（核心系数 $\beta_1 = 0.614$ ， $R^2 = 0.309$ ），从而提供统一框架解释为何不同研究结论冲突。
同时研究 retraction 与 confirmation：揭示对 confirmation 的系统性反应不足（仅 8 pp 的额外更新，远低于贝叶斯基准），且初始反应同样预测 confirmation 后的偏差。
信念分散化机制：证明多次 retraction 后信念方差（7.1 pp）远大于等价的 uninformative 信号（4.4 pp），暗示 misinformation 的存在本身可能是信念极化的潜在驱动力。
过度推断的新证据：在引入信号不确定性后，发现 $c = 1.530 > 1$ （过度推断），与 Benjamin (2019) meta 分析中的 under-inference 形成对比，呼应 Thaler (2021) 关于弱信号过度推断的发现。

维度1：实验设计分析

实验任务详细流程

本文包含两个在线实验（Experiment 1 和 Experiment 2），均使用经典球与罐范式（ball-and-urn framework）的创新修改版本。实验刻意采用抽象框架以排除动机推理（motivated reasoning）等混杂因素。

共同设定

基本结构： 有两个罐子（Red urn 和 Blue urn），各含4个球。Red urn含3红1蓝，Blue urn含3蓝1红。实验开始时随机等概率选择一个罐子，整个实验过程中保持不变。
信息不确定性的引入： 被选中罐子的4个球（标记为"I"，informative）被放入一个黑盒中，同时加入6个无信息球（标记为"U"，uninformative；3红3蓝）。黑盒共含10个球。
被试任务： 估计被随机选中的罐子是 Red urn 的概率。

Experiment 1：Ex-post Information Checks（基线实验）

时间线（12轮）：

指导语阶段：
- 被试首先看到两个罐子的图示（Red urn: 3红1蓝; Blue urn: 3蓝1红）
- 翻页后解释黑盒机制：4个informative球（来自选中罐子）+ 6个uninformative球（3红3蓝，不来自罐子）
- 解释激励机制（二次评分规则 quadratic scoring rule），详细数字隐藏在按钮后
- 被试需正确回答5/6道理解测试题方可进入正式实验
每轮操作（共12轮，其中9轮抽球 + 3轮信息核查）：
- 抽球轮（9轮）： 从黑盒中随机抽取一个球（有放回），告知被试球的颜色，但不告知是I球还是U球。被试随后报告其对Red urn被选中概率的信念（0-100%）。
- 信息核查轮（3轮）： 不抽新球，而是告知被试上一轮所见的球来自哪组（informative还是uninformative）。这构成了：
  - Retraction（撤回）： 告知上一轮的球是uninformative的（即无信息量）
  - Confirmation（确认）： 告知上一轮的球是informative的（即确实来自罐子）
- 核查轮在不同被试间系统性变化位置，但总是连续三轮核查
信息展示：
- Treatment 1（基线）： 显示全部信号历史和上一轮报告的信念
- Treatment 2（No previous belief）： 不显示上一轮报告的信念
- Treatment 3（No history）： 隐藏信号历史，仅显示最近信号（核查轮也显示被核查的初始信号）
实验结束后： 策略问卷 + 人口统计学问题

Experiment 2：Ex-ante Information Verification（Combined Signal Treatment）

时间线（9轮）：

指导语阶段： 与Experiment 1类似，但说明信号展示方式不同
每轮操作（共9轮）：
- 每轮从黑盒抽取一个球（有放回）
- 6轮为uncertain signal： 仅告知球的颜色，不告知是I还是U
- 3轮为combined signal： 同时告知球的颜色和其类型（informative或uninformative）——即ex-ante验证
- 被试每轮报告信念
关键区别： 这里是事前（ex-ante）同时展示信号颜色和信息性，而非像Experiment 1那样事后（ex-post）核查

其他实验设计要素

要素	内容
实验类型	在线实验（Prolific招募），使用oTree平台
Treatment设计	Experiment 1: 3个treatment（基线/不显示前信念/不显示历史） x 信息核查位置变化；Experiment 2: combined signal treatment，同样有3个信息展示treatment
随机化	罐子随机选择；球抽取随机（有放回）；信息核查轮位置在被试间系统变化
观测变量	每轮报告的信念（0-100%概率）；与贝叶斯后验的偏差；信念变化方向与幅度
因果识别	抽象框架排除内容依赖性；within-subject比较（同一被试在不同轮次的信念）；between-subject比较（不同信号历史的被试）；压缩历史固定效应控制信号序列
样本量	两个实验共849名被试完成，剔除96名后753名有效。Experiment 1报告12个信念，Experiment 2报告9个信念，共8,397个观测值。985个retraction观测，635个confirmation观测
激励机制	固定参与费2.50欧元 + 基于二次评分规则（QSR）的奖金最高3.00欧元。随机选取一轮计算奖金，公式：3 - 3 * error^2。平均报酬4.80欧元，中位时间17分钟
亮点	(1) 创新性地将信息不确定性引入经典ball-and-urn范式；(2) 可以无歧义地撤回或确认之前的不确定信息；(3) 同时研究retraction和confirmation；(4) 排除动机推理和叙事因果结构的影响
局限	(1) 抽象框架可能低估现实中动机推理的放大效应；(2) 3轮信息核查样本量有限；(3) 在线实验可能存在注意力问题（虽已通过理解测试和剔除标准控制）；(4) 无法完全区分个体层面的持续偏差类型（每个被试的retraction数据太少）

维度2：理论模型

基准理论

贝叶斯更新作为理性基准。 框架建立在二元状态空间 Theta = {Blue (B), Red (R)} 上，先验 p = 0.5。

三种信号类型：

Informative signal (pi_I)：以概率 1 - epsilon 揭示真实状态
$ $\pi_I(b|B) = \pi_I(r|R) = 1 - \varepsilon = 0.75$ $
Uninformative signal (pi_U)：不含任何关于状态的信息
$ $\pi_U(b|B) = \pi_U(b|R) = \beta = 0.5$ $
Uncertain signal：两种信号的混合，alpha = 0.4 为informative的概率
$ $\pi(b|\theta) = \alpha \pi_I(b|\theta) + (1-\alpha)\beta$ $
实验参数下：pi(r|R) = pi(b|B) = 0.6

行为偏差的形式化

Grether-Benjamin 模型（Equation 2）：
$ $b(R|\mathbf{s}) = \frac{\pi(\mathbf{s}|R)^c \cdot p(R)^d}{\pi(\mathbf{s}|R)^c \cdot p(R)^d + \pi(\mathbf{s}|B)^c \cdot p(B)^d}$ $

c = 推断参数（inference），c > 1 为过度推断，c < 1 为推断不足
d = 基率使用参数（base-rate use），d < 1 为基率忽视
贝叶斯更新的特殊情况：c = d = 1

Retraction的理性基准（Equation 6中的回归模型）：
$ $b_t(R|\mathbf{s_{t-1}}, \mathbf{r_t}) - p_{t-1}(R) = \alpha + \beta_1 \cdot (b_{t-1}(R|\mathbf{s_{t-1}}) - p_{t-1}(R|\mathbf{s_{t-1}})) + \epsilon_t$ $

理性预测：alpha = 0, beta_1 = 0（retraction后信念应回到先验，不受初始反应影响）
实际发现：beta_1 = 0.614***，初始偏差强烈预测retraction后的偏差

Confirmation的理性后验（Equation 3）：
$ $p_t(R|\mathbf{s_{t-1}}, \mathbf{c_t}) = \frac{p_{t-1}(R) \cdot \pi_I(\mathbf{s_{t-1}}|R)}{p_{t-1}(B) \cdot \pi_I(\mathbf{s_{t-1}}|B) + p_{t-1}(R) \cdot \pi_I(\mathbf{s_{t-1}}|R)}$ $

关键假设

被试进行序贯更新（sequential updating）：上一轮报告的信念作为下一轮的先验
理性被试在retraction后应"遗忘"被撤回的信号，回到之前的先验
理性被试在confirmation后应基于初始先验和informative signal进行更新（而非基于已报告的信念）

可检验预测

Q1: Retraction后信念应回到先验（无continued influence effect）
Q2: Confirmation后初始更新不应影响最终信念
Q3: Ex-ante验证（combined signal）应比ex-post核查产生更准确的信念
Q4: 过去的信息核查不应影响未来对新不确定信息的反应

维度3：核心发现

Result 1: 显著的过度推断和基率忽视

推断参数 beta_1 (c) = 1.530***（SE = 0.051），显著大于1 --> 过度推断
基率使用参数 beta_2 (d) = 0.697***（SE = 0.027），显著小于1 --> 基率忽视
与Benjamin (2019) meta分析一致的基率忽视，但过度推断与其发现不同（可能因为信号不确定性的引入）

Result 2: 对retraction的反应高度异质

仅 32% 的情况被试正确回到先验
34% 的情况被试反应不足（continued influence of retracted information）
34% 的情况被试反应过度（reverse effect）
平均信念差异为 0.009（SE = 0.007），不显著异于零 --> 平均无偏，但个体层面严重偏差
这与 Goncalves et al. (2022) 发现的平均continued influence effect相矛盾

Result 3: 初始反应预测retraction后的信念偏差

核心回归：beta_1 = 0.614*（SE = 0.052），R-squared = 0.309（Table 4）
初始贝叶斯更新 --> retraction后无偏
初始过度反应 --> retraction后continued influence（信念仍偏向被撤回信号方向）
初始反应不足 --> retraction后reverse effect（信念低于先验）
被试大约只纠正初始错误的 40%（即beta_1在0和1之间）
举例：先验50%，看到红球后报告80%（贝叶斯为60%，过度反应20pp），retraction后平均报告约62%（而非回到50%）

Result 4: Retraction与对立新信息的反应不同

被试对对立颜色新球的反应显著强于retraction（过度反应至偏离初始先验）
Retraction交互项系数 = 0.056***（SE = 0.013），Table 10

Result 5: 被试系统性地对confirmation反应不足

初始信号的平均信念变化约 10个百分点，confirmation后额外变化仅约 8个百分点
理性情况下应为相反模式（confirmation后应有更大更新，因为informative signal的信息量大于uncertain signal）
回归中 beta > 0（Table 11），初始偏差同样预测confirmation后的偏差
即使初始贝叶斯反应的被试也在confirmation后under-react

Result 6: 过去的信息核查对未来更新无显著影响

过去retraction/confirmation的数量、颜色等对未来uncertain signal的反应无显著系统影响
Table 14-15中部分系数虽显著，但缺乏直觉解释且不稳健

关于ex-ante vs ex-post验证

单次retraction的信念与单次uninformative signal的信念在平均水平上无显著差异
但经过多次连续retraction后，信念方差显著更大（3次retraction后方差 7.1%pts vs uninformative signal的 4.4%pts）
正确回到先验的人数：retraction后始终低于uninformative signal

稳健性

结果对信息展示方式的变化稳健（隐藏历史/隐藏前信念的treatment无显著影响，Table 8 column 2）
控制被试类型（average over-report, inference, base-rate use）后初始更新仍是最强预测因子（Table 7）
控制前一轮（t-2）的错误后结果不变（Table 8 column 1）
使用Goncalves et al. (2022)的压缩历史方法复制，结果一致（Table 5）

维度6：与其他文献的关系

领域位置

本文处于实验经济学中信念更新（belief updating）文献与心理学/政治学中虚假信息（misinformation）文献的交叉点。核心贡献是将信息关于信息（information about information）的处理方式引入经典belief updating范式进行严格研究。

核心对话论文

论文	关系
Goncalves, Libgober & Willis (2022)	最直接的前序工作。同样修改ball-and-urn研究retraction，发现平均continued influence effect。本文发现平均无偏但个体异质，并提供基于初始反应的预测机制解释差异。本文还额外研究confirmation
Benjamin (2019)	信念更新meta分析的基准框架（Grether模型）。本文发现基率忽视一致但过度推断不同
Ecker et al. (2022)	心理学continued influence effect综述。本文用抽象框架排除了叙事因果结构和动机推理等混杂因素
Grether (1980)	提出reduced-form模型分解inference和base-rate use
Thaler (2021)	弱信号过度推断。本文的uncertain signal设定支持此发现
Johnson & Seifert (1994)	心理学中continued influence effect的经典论文
Danz, Vesterlund & Wilson (2020)	二次评分规则的激励信息隐藏方法
Liang (2020)	信息不确定性下的信念更新，发现under-inference
Nieminen & Rapeli (2018); Walter et al. (2020)	fact-checking文献综述

新贡献

新的更新偏差类型： 首次揭示对"信息关于信息"（retractions和confirmations）的处理存在系统性偏差，且该偏差可由初始反应预测
解决文献争议： 解释了为何不同研究关于continued influence effect的发现不一致——平均来看无偏，但个体根据初始反应方向系统性偏差
信念分散化机制： 证明多次retraction导致信念方差远大于等价的uninformative signal，揭示misinformation是信念极化的潜在驱动因素
Confirmation的under-reaction： 首次在实验中研究对prior uncertain information的confirmation效应
方法创新： 将信息不确定性嵌入ball-and-urn范式的新实验设计，可无歧义地retract/confirm之前的不确定信息

维度4：变量概览

变量	类型	定义	用途
报告信念 $b_t(R \| s)$	因变量（连续, 0-100%）	被试每轮报告"罐子为 Red urn"的主观概率	主分析的核心输出
贝叶斯后验 $p_t(R \| s)$	基准（连续, 0-1）	给定信号历史的理性后验	与报告信念比较以测量偏差
信念变化 $\Delta b_t$	连续	$b_t - b_{t-1}$	测量信号反应幅度
信号类型	分类（I / U / uncertain / combined）	球的实际信息性，被试可能知或不知	Treatment 变量
核查类型	分类（retraction / confirmation）	上一轮信号被事后核查的结果	主要 treatment
初始更新偏差	连续	$b_{t-1}(R\|s) - p_{t-1}(R\|s)$	Equation 6 中关键自变量
推断参数 $c$	估计参数	Grether 模型中信号权重	量化过度推断
基率使用参数 $d$	估计参数	Grether 模型中先验权重	量化基率忽视
信息展示 treatment	分类（基线 / 无前信念 / 无历史）	屏幕显示内容差异	稳健性检验
核查轮位置	分类	3 轮核查在 12 轮中的位置（被试间变化）	控制位置效应
理解测试得分	控制变量	6 题中正确数	剔除 < 5 的被试
人口统计	控制变量	性别、年龄、教育等	异质性分析

维度5：局限性

抽象框架的外部效度：刻意排除动机推理与叙事因果结构，可能低估现实中 misinformation 在政治/健康议题上的真实影响（继续影响效应可能在有动机推理下更大）。
信号参数特定：实验仅在 $\alpha = 0.4$ （informative 概率）、 $\varepsilon = 0.25$ （informative 信号噪声）的特定参数下展开，结果是否对其他不确定性水平稳健有待检验。
核查样本量有限：每个被试最多观察 3 次 retraction，难以在个体层面精确估计持续性偏差类型。
在线实验注意力问题：尽管已通过理解测试和剔除标准控制，但在线被试相比实验室被试仍可能存在更大的注意力波动。
缺乏机制识别：发现"初始反应预测后续偏差"，但未能直接区分背后机制（锚定 anchoring、保守主义 conservatism、记忆偏差 memory bias 等）。
未与现实 misinformation 干预对比：未检验研究结论对 fact-checking 政策（如 Twitter/Facebook 标签）的直接政策含义。
样本主要为大学生与 Prolific 用户：年轻、受教育程度较高，可能与一般人群在信念更新模式上存在系统差异。

维度7：可拓展的研究方向

引入动机推理与叙事：在政治、健康、气候等真实议题中重复设计，测试初始反应预测假说是否依然成立，并量化动机推理放大效应。
机制识别实验：通过加入记忆任务、注意力探测、再认测试等区分 retraction 失效是源于"未能从工作记忆中删除"还是"未能根据新信息重新计算"。
结构估计：将 Grether-Benjamin 框架扩展到允许 retraction-specific 参数（ $c_R$ 、 $d_R$ ），并结构性估计 retraction 处理的认知成本。
市场层面后果：将本范式嵌入实验金融市场，研究 misinformation 的撤回如何影响价格发现、波动率与极化。
信念极化与社会传染：通过多轮 retraction 与社会信息（peer beliefs）交互，测试 misinformation 是否通过分散化机制驱动群体极化。
干预设计：测试不同 retraction 呈现方式（强调原信号无效 vs. 提供更正信号）、时机（即时 vs. 延迟）、来源可信度对纠偏效果的影响。
联系金融决策：将信念测量与投资组合选择/交易行为联系，检验 misinformation 处理偏差是否预测真实金融决策中的过度反应或滞后调整。
跨文化比较：在不同信任水平、媒体环境的国家重复实验，检验 retraction 反应模式的普遍性。

元数据

字段	内容
来源	Working Paper (Maastricht University)
实验时间	Experiment 1: 2022年1月; Experiment 2: 2023年1月
平台	oTree + Prolific
预注册	有（分析方法相对预注册有微调）
数据可得性	未提及

关键结论

Retraction 不是"重置"而是"部分纠正"：在排除动机推理的抽象环境中，被试平均仅纠正初始更新偏差的约 40%，且纠正方向由初始反应符号决定——过度反应者最终保留 continued influence，反应不足者最终出现 reverse effect。这一发现统一了此前关于 continued influence effect 是否真实存在的文献分歧。
Misinformation 是信念分散化（而非平均偏移）的来源：多次 retraction 显著扩大信念方差但不改变均值，意味着信息生态中的 misinformation 即使被完全撤回，也会通过认知处理异质性产生群体内信念极化，对民主审议和金融市场流动性具有重要含义。相关链接：Augenblick_Lazarus_Thaler_2025_Overinference_Underinference、Benjamin_2019_BaseRateNeglect_Foundations、Coutts_2019_GoodNewsBadNews_BeliefUpdating、Thaler_GoodNews_MotivatedReasoning、Enke_Zimmermann_2019_CorrelationNeglect_BeliefFormation、Charness_2017_ConfirmationBias_MotivatedBeliefs、Hossain_2020_BeliefFormation_SignalCorrelation。

Wittrock_Strobel_2023_BeliefUpdating_Misinformation