Thaler_SupplyMotivatedBeliefs
The Supply of Motivated Beliefs
一句话总结
通过两个预注册实验(实验1: 750名党派均衡的Sender-Receiver博弈;实验2: 550人引入"计算机消息"分离动机性推理),证明当发送者被"被认为可信"激励时,会系统性地向接收者党派一致的方向多发送 7.1-14.5 pp 的虚假信息,揭示动机性信念的"供给侧"放大机制。
研究问题
- 当接收者持有动机性信念时,发送者如何策略性地调整其虚假信息供给行为?
- "被认为真实"的激励机制(如社交媒体评分)是否会反向放大虚假信息?
- 发送者关于接收者动机性推理的高阶信念是否准确?是否存在偏见盲点(bias blind spots)?
- 接收者能否识别并抵御被激励发送者的策略性虚假信息?
- 给发送者获取受众党派信息的渠道是否会增加虚假信息供给?
核心贡献
- 首次实验研究动机性信念的供给侧: 现有文献聚焦需求侧(接收者如何选择性接收信息),本文将动机性信念框架扩展到供给侧(发送者如何利用接收者偏差)。
- 激励机制的反向效应: 证明"被认为可信"的激励(如社交媒体的评分系统)反而增加虚假信息供给(+7.3 pp,相对增幅34%),为平台设计提供了反直觉的政策警示。
- 偏见盲点的实验证据: 发送者预测接收者党派偏差为 30 pp,实际仅 2 pp——人们高估他人的动机性推理。这是关于"动机性推理盲点"的首个实验证据。
- 方法论创新(实验2): 通过引入"计算机发送者"打破战略互动,干净识别动机性推理的供给效应(不混淆于战略博弈)。
- 信息需求的因果证据: 55.6-63.1% 的发送者愿意付费获取受众党派信息;随机获取党派信息的被激励发送者多发送 6.5 pp 的虚假消息。
- 接收者天真性: 接收者的评估不随发送者激励状态变化,未能预见激励对发送者行为的影响——为"接收者去偏差化"提供了政策切入点。
- 整合 Sender-Receiver 博弈与动机性推理: 在标准战略沟通框架中嵌入动机性推理参数 \lambda,建立一个统一的"信念供给侧"理论。
维度1:实验设计分析
基本信息
- 作者: Michael Thaler (Princeton University)
- 日期: 2022年1月
- 期刊/状态: Working Paper (预注册实验)
- JEL分类: C91; D83; D91
- 关键词: motivated beliefs, sender-receiver game, disinformation, fake news, motivated reasoning, higher-order beliefs, political polarization
一、核心研究问题与动机
研究问题
当信息接收者(receivers)持有动机性信念(motivated beliefs)时,信息发送者(senders)如何策略性地调整其信息传递行为?即**动机性信念的"供给侧"**问题。
研究动机
- 现有文献大量关注动机性信念对信息需求端的影响(如人们选择性地接收符合自身偏好的信息),但对供给端的研究很少——即发送者如何利用接收者的动机性信念来传播虚假信息。
- 社交媒体平台(如Facebook)的评分和可信度评估机制可能适得其反:当用户被激励追求"被认为是真实的",他们可能反而发送更多迎合接收者动机性信念的虚假信息。
- 理解虚假信息的根源对改善新闻传播、增强信任、减少政治极化具有重要的社会意义。
核心贡献
- 首次实验性地研究关于他人动机性推理(motivated reasoning)的信念如何影响信息传递行为
- 揭示激励机制(incentives)与动机性信念(motivated beliefs)两个因素在增加虚假信息方面的交互作用
- 提供偏见盲点(bias blind spots)的实验证据——人们高估他人的动机性推理程度
二、理论框架与实验设计
理论模型: Sender-Receiver 信号博弈
基本设定:
- 一个发送者(S)和一个接收者(R)
- 世界状态为高(theta_H)或低(theta_L),发送者观察到真实状态
- 发送者选择发送 x_H 或 x_L 消息;接收者评估消息的真实性概率 a
- 发送者效用有两部分: 诚实偏好(tau > 0)+ 被认为真实的激励(gamma >= 0)
- 接收者效用取决于评估准确性
动机性推理的引入:
- 参数 lambda 衡量接收者的动机性推理程度
- 动机性推理者对"好消息"赋予更高的真实性评估,对"坏消息"赋予更低评估
- 贝叶斯更新公式在此基础上加入 lambda 偏移项
高阶信念(Higher-order beliefs):
- 发送者对接收者偏差的信念 lambda_S 可能不同于接收者的真实偏差 lambda
- 接收者对自身偏差的信念 lambda_R 可能低于 lambda_S(偏见盲点假设)
- 接收者将自己"无偏"的认知投射到对发送者策略的预期上
核心理论预测:
- 假说1: 当发送者被激励(gamma > 0)时,存在动机性均衡,发送者向接收者偏好方向发送更多虚假信息
- 假说2: 当发送者无激励(gamma = 0)时,不会根据接收者的动机性信念调整行为
- 假说3: 增加激励导致在"坏状态"下发送更少真实信息,但不改变接收者行为
实验设计
实验1: 完整 Sender-Receiver 博弈
- 被试: 750名美国社交媒体用户(Prolific平台,2021年9月),民主党和共和党各半
- 角色: 随机分配为发送者(375人)或接收者(375人)
- 问题: 12个涉及政治动机的事实性问题(如移民犯罪率、COVID限制效果等)+中性问题
- 策略方法(Strategy method): 发送者对接收者每个可能的先验(0%-100%,步长10%)分别选择发送真实或虚假信息(每题11个选择)
- 处理组:
- 话题组(被试内): 政治话题 vs. 中性话题
- 信息组(被试内): 知道接收者党派(党派与真实一致/与虚假一致) vs. 不知道
- 激励组(被试间): 发送者被激励(报酬取决于接收者评估) vs. 无激励
实验2: 分离动机性推理效应
- 被试: 550人(Prolific平台,2021年5-6月),500名发送者+50名接收者
- 关键创新: 接收者评估来自计算机的消息(非人类发送者),发送者选择计算机消息但不直接影响接收者
- 这打破了发送者与接收者之间的战略互动,从而分离动机性推理效应
- 接收者任务: 报告中位数信念,然后评估两条计算机消息(一真一假)哪条更可能为真
- 额外环节: 发送者的信息需求——是否愿意付费获取接收者的党派信息
三、核心实验结果
实验1主要发现
1. 激励+党派对齐效应(发送者行为):
- 被激励的发送者在接收者党派与虚假消息一致时,发送虚假消息的概率高出7.1个百分点(s.e. 3.2 pp),相比于党派与真实消息一致的条件
- 这相当于接收者先验变化29个百分点的效果
- 未被激励的发送者不受此方向性影响
2. 激励的总体负面效应:
- 被激励的发送者比未被激励的发送者多发送7.3个百分点(s.e. 2.5 pp)的虚假消息,增幅达34%
- 当接收者党派与真相不一致时,激励效应尤为显著
3. 接收者行为——天真性(naivete):
- 接收者对亲党派新闻评估为真的概率为58.4%,反党派新闻为51.3%,差异7.1 pp (p < 0.001)
- 但接收者的评估不受发送者激励条件的影响——无论发送者是否被激励,接收者给出几乎相同的评估
- 这表明接收者未能预见激励对发送者行为的不利影响
4. 高阶信念偏差:
- 发送者预测接收者在先验为50%时,亲党派与反党派消息的评估差距为30 pp
- 而实际差距仅约2 pp(控制先验后接近零)
- 发送者显著高估了接收者基于党派的推理偏差
5. 无激励发送者的表现性偏好:
- 约21%的无激励发送者也发送虚假消息
- 无激励发送者在虚假消息与自己党派一致时更频繁地发送,体现表现性偏好(expressive preferences)
实验2主要发现
1. 复制并强化实验1结果:
- 被激励的发送者在党派与虚假消息一致时,选择虚假计算机消息的概率高出14.5个百分点(s.e. 4.5 pp)
- 激励总体增加虚假消息选择8.5 pp(s.e. 2.3 pp),同样增幅约34%
- 未被激励的发送者不受方向性影响
2. 信息需求(Demand for information):
- 在政治话题上,**55.6%-63.1%**的发送者愿意付费获取接收者的党派信息
- 在中性话题上,不到一半的发送者愿意付费
- 政治与中性话题的信息需求差距为17.7 pp (p < 0.001)
- 高需求信息的发送者发送虚假消息的比例为40.6%,低需求者为30.1%,差异10.5 pp (p < 0.001)
- 因果证据: 随机获得接收者党派信息的被激励发送者比未获得信息者多选择6.5 pp的虚假消息 (p = 0.026)
3. 接收者的动机性推理:
- 接收者评估亲党派消息为真的概率为38.4%,反党派为29.2%,差异9.2 pp (p = 0.036)
- 发送者预测差距为12.5 pp,方向正确但幅度略有高估
四、局限性与未来方向
局限性
- 策略方法的代表性: 策略方法可能不完全反映真实场景中的信息传递行为,存在选择过载(choice overload)问题
- 实验室vs.现场: 实验在线上实验室进行,与真实社交媒体环境存在差异(如重复互动、声誉积累等)
- 样本局限: 仅限美国社交媒体用户,结果的跨文化适用性需进一步验证
- 实验1中动机性推理的识别: Sender-Receiver博弈中的战略考量使得难以完全分离动机性推理效应(实验2部分解决了此问题)
- 先验报告的噪声: 发送者可能认为接收者系统性地误报先验或带有党派噪声,这可能影响party效应的估计
- 竞争激励: 竞争型激励(两个发送者比较)的效果未达统计显著性,但不能排除温和效果
政策启示
- 改变新闻供应者的激励结构: 社交媒体平台的评分和可信度系统可能适得其反,需要重新设计
- 去偏差化干预: 改变接收者的动机性推理可以间接减少虚假信息的供给;对接收者进行去偏差处理可能比改变发送者激励更具可操作性
- 信息获取的双刃剑: 给新闻提供者获取受众政治偏好信息的渠道可能增加虚假信息
未来研究方向
- 将实验设计推广到其他领域(非政治场景)
- 在社交媒体的田野实验中验证这些效应
- 研究发送者是否会因不同议题而非对称地发送虚假信息
- 进一步探索高阶信念的形成机制及其对均衡结果的影响
与相关文献的联系
| 文献 | 关系 |
|---|---|
| Benabou & Tirole (2002, 2011, 2016) | 动机性推理的经济学理论基础,本文将其扩展到信息传递的供给侧 |
| Kunda (1990) | 动机性推理的心理学经典定义,本文在博弈论框架中操作化 |
| Allcott & Gentzkow (2017) | 假新闻的定义和社会成本,本文提供微观机制解释 |
| Gentzkow & Shapiro (2006, 2010) | 媒体偏向受众信念的理论,本文用实验方法验证并区分当前信念vs.动机性信念 |
| Pronin et al. (2002, 2004) | 偏见盲点文献,本文提供关于动机性推理盲点的首个实验证据 |
| Thaler (2021a) | 作者关于识别动机性推理的方法论论文,本文在实验2中应用该设计 |
| Abeler, Nosenzo & Raymond (2019) | 人们对诚实的内在偏好,本文发现此偏好可被激励机制削弱 |
| Cai & Wong (2006) | 信息传递博弈中的过度沟通,本文在动机性信念环境中发现相反的结果(虚假信息和不信任) |
核心结论
本文揭示了动机性信念从需求侧向供给侧传递的完整机制链条: 接收者的动机性推理 -> 发送者对此的(过度)预期 -> 激励机制放大策略性虚假信息发送 -> 接收者未能识别此效应。这一"信念供给"视角为理解政治语境下虚假信息的泛滥提供了新的理论和实证基础,也为平台设计和去偏差干预提供了明确的政策杠杆。
维度2:理论模型
Sender-Receiver 信号博弈基础设定
- 状态空间: \theta \in \{\theta_H, \theta_L\}
- 角色: Sender (S) 观察 \theta;Receiver (R) 不观察 \theta
- 行动: S 选择消息 x \in \{x_H, x_L\};R 选择评估 a \in [0,1](消息为真的后验概率)
- R 的效用: 准确性损失 -(a - \mathbb{1}\{x=\theta\})^2
- S 的效用: \tau \cdot \mathbb{1}\{x=\theta\} + \gamma \cdot a
- \tau > 0: 内在诚实偏好(lying aversion)
- \gamma \geq 0: "被认为可信"的外在激励
动机性推理的引入
- \lambda: R 对"好消息"(与其党派一致)评估为真的额外概率溢价
- R 的评估: a(x) = a_{\text{Bayes}}(x) + \lambda \cdot \mathbb{1}\{x \text{ 亲党派}\} - \lambda \cdot \mathbb{1}\{x \text{ 反党派}\}
- 均衡逻辑: 当 S 知道 R 的党派且 \gamma > 0 时,S 在"坏状态 + 接收者亲党派为虚假"时选择虚假消息——因为虚假消息的可信度溢价 \lambda 超过诚实损失
高阶信念
- \lambda_S: S 对 R 偏差的信念
- \lambda_R: R 对自身偏差的信念
- 偏见盲点: \lambda_R < \lambda_S \approx \lambda(R 低估自己的偏差,S 高估 R 的偏差)
关键理论预测
- 假说1(激励 × 党派一致): \gamma > 0 时,S 在党派与虚假消息一致时多发虚假消息
- 假说2(无激励基线): \gamma = 0 时,S 行为不依赖于 R 的党派
- 假说3(接收者天真): R 不调整对 S 激励的预期,导致均衡虚假消息率上升
- 假说4(信息互补性): 获取 R 党派信息使 \gamma > 0 的 S 更频繁发虚假信息
维度3:核心发现
实验1: Sender-Receiver 完整博弈
- 激励 + 党派一致效应: 被激励 S 在 R 党派与虚假消息一致时多发 7.1 pp(s.e. 3.2,p<0.05)虚假消息,相当于先验变化 29 pp 的效应。
- 激励的总体负效应: 被激励 S 比未激励 S 多发 7.3 pp(s.e. 2.5)虚假消息,相对增幅 34%。
- R 的天真性: R 对亲党派 vs 反党派消息评估差距 7.1 pp(p<0.001),但不随 S 激励状态变化——R 未能预见激励效应。
- 高阶信念偏差: S 预测 R 党派评估差距为 30 pp,实际仅 2 pp(控制先验后近零)——S 显著高估 R 的偏差。
- 表现性偏好: 21% 的无激励 S 也发虚假消息,且更频繁地发与自己党派一致的虚假消息。
- 竞争激励: 双 S 竞争场景效应未达统计显著,但方向一致。
实验2: 计算机发送者分离设计
- 强化主效应: 党派 × 激励交互效应增至 14.5 pp(s.e. 4.5,p<0.01);总激励效应 +8.5 pp(同样 ~34%)。
- 信息需求: 55.6-63.1% 的 S 在政治议题上愿意付费获取 R 党派;中性议题不到 50%。差距 17.7 pp(p<0.001)。
- 信息需求 → 虚假信息供给: 高需求 S 的虚假率 40.6%,低需求 S 30.1%(差异 10.5 pp,p<0.001)。
- 因果识别: 随机分配获得 R 党派信息的被激励 S 多选 6.5 pp 虚假消息(p=0.026)。
- R 评估: 亲党派 38.4% vs 反党派 29.2%(差异 9.2 pp,p=0.036);S 预测差距 12.5 pp,方向正确但幅度高估。
议题异质性
- 中性议题(非政治)上激励效应几乎为零,证明效应主要由党派动机驱动。
- 政治议题中,移民犯罪率、COVID 限制效果等议题上效应最强。
稳健性
- 控制先验报告噪声、议题固定效应、被试人口特征后结论稳健。
- Wave 内复制(实验1 vs 实验2)一致。
维度4:变量概览
自变量
- Incentive_i: 二元,被试 i 是否被分配到激励组(\gamma > 0)。
- PartyAlignFalse_iq: 二元,议题 q 上 R 党派与虚假消息方向一致。
- TopicPolitical_q: 二元,议题为政治议题。
- ReceiverPartyKnown_iq: 二元,S 是否知道 R 党派。
因变量
- SendFalse_iq: 二元,S 是否选择发送虚假消息。
- ReceiverEval_iq: R 对消息为真的概率评估,0/10 到 10/10。
- HigherOrderBelief_S: S 对 R 党派评估差距的预测。
- DemandPartyInfo_S: S 是否愿意付费获取 R 党派(实验2)。
关键控制
- R 报告的先验 \pi_q^R
- 议题固定效应
- S 的人口特征(年龄、性别、党派、教育、收入)
- 被试身份(民主党/共和党,1:1 配比)
激励机制
- 诚实激励(\tau): S 选择真实消息时获得 $0.10 奖励(基于 Abeler-Nosenzo-Raymond 2019 的 lying-aversion 测量)。
- 可信激励(\gamma): S 报酬与 R 评估线性挂钩,最高 $1。
- R 评估激励: 二次评分规则,鼓励真实报告概率。
- 基础报酬: $2-3 / 30 分钟。
议题(共 12 + 中性)
- 政治议题: 移民犯罪率、COVID 限制效果、警察暴力、性别工资差距、LGBTQ 权利、环境政策等。
- 中性议题: 一般地理、历史事实。
维度5:局限性
- 策略方法的代表性: 策略方法(11 个先验下逐一选择)可能产生选择过载,与真实场景中的"快速判断"不同;S 在策略方法下可能更深思熟虑。
- 实验室 vs 现场: 在线实验缺乏真实社交媒体的重复互动、声誉积累、关注度奖励等机制,结果可能低估或高估真实效应。
- 样本局限: Prolific 美国社交媒体用户偏年轻、教育程度高;跨文化推广性未知。
- 战略与动机性推理的混淆(实验1): Sender-Receiver 博弈本身使 S 行为兼有战略考虑和动机性推理预期;实验2 的计算机设计部分解决但未完全消除。
- R 先验的内生性: R 报告的先验可能本身受党派影响(亲党派议题先验更高),影响动机性推理识别。
- 激励金额较小: $0.10-$1 的激励可能不足以模拟现实中网红、媒体的强激励,效应可能被低估。
- 诚实偏好测量假设: 假定 \tau 通过 lying-aversion 测量精确捕捉,但 \tau 可能因议题异质(涉及政治议题时 lying-aversion 可能下降)。
- 未直接测量信念变化: 主要测量行为(发送/评估)和元信念(高阶信念),未追踪 R 在多轮交互后的信念修正。
- 缺乏多议题动态: 单次发送-接收互动,未观察 S 在反复议题间的"信誉"积累。
- 去偏差干预未直接测试: 政策启示部分提出"接收者去偏差化",但实验未直接操纵 R 的偏差水平验证因果。
维度6:与其他文献的关系
与动机性信念理论的对话
- Benabou_Tirole_2016_MindfulEconomics_Beliefs: 经典动机性信念框架。本文将其从"个人信念形成"扩展到"信念在 Sender-Receiver 博弈中的供给",揭示动机性信念如何通过策略性沟通从需求侧传播到供给侧。
- Kunda_1990_MotivatedReasoning: 动机性推理的心理学经典。本文在博弈论框架中操作化 Kunda 的概念,量化"被预期的动机性推理"对策略行为的影响。
与 Thaler 自身研究的关系
- Thaler_GoodNews_MotivatedReasoning: 同作者,证明纯效价不引发动机性推理,需要功能性动机。本文是"功能性动机驱动"的补充——发送者在党派功能性激励下放大虚假信息,与 Good News 论文的"功能性才是关键"形成完整闭环。
- Augenblick_Lazarus_Thaler_2025_Overinference_Underinference: 信念更新偏差的另一维度。本文聚焦动机性偏差,与之互补。
与假新闻/媒体经济学
- Allcott & Gentzkow (2017): 假新闻的社会成本。本文为其提供微观机制——"被认为可信"的激励是供给侧根源。
- Gentzkow & Shapiro (2006, 2010): 媒体偏向受众信念的理论模型。本文通过实验验证并区分"当前信念" vs "动机性信念"两条偏向通道。
与偏见盲点文献
- Pronin et al. (2002, 2004): 偏见盲点心理学经典。本文提供首个关于"动机性推理盲点"的实验证据——人们对自己的动机性推理认知准确,对他人的高估。
与诚实/谎言厌恶文献
- Abeler, Nosenzo & Raymond (2019): 诚实内在偏好的元分析。本文发现这种偏好可被适度激励削弱,对其外部效度提供边界条件。
与战略沟通文献
- Cai & Wong (2006): 战略沟通中的过度沟通现象。本文在动机性信念环境中发现相反结果——虚假信息和不信任。
- Crawford-Sobel cheap talk: 经典框架。本文通过引入动机性推理参数扩展。
与确认偏差/极化文献
- Charness_2017_ConfirmationBias_MotivatedBeliefs: 确认偏差的实验证据。本文显示供给侧策略性放大确认偏差。
- DelVicario_2017_ConfirmationBias_Polarization: 政治极化的信息生态。本文提供供给侧机制。
维度7:可拓展的研究方向
- 现场实验: 与社交媒体平台合作,在真实环境中操纵评分/可信度激励,检验实验室效应能否外推。
- 重复博弈与声誉: 在多轮 S-R 博弈中观察 S 是否会形成声誉,长期来看激励效应是否被声誉抑制。
- 多发送者竞争: 扩展到 N 个发送者竞争同一受众的场景(如多媒体竞争市场份额),分析竞争是否促进诚实或加剧虚假信息。
- 去偏差干预: 直接操纵 R 的动机性推理水平(如通过提示、教育、问责),测量供给侧反应——这是政策最关键的实证缺口。
- 跨议题/跨领域推广: 将设计应用到金融建议(投顾对客户)、医疗建议(医生对患者)、科学传播等场景,检验"动机性信念供给"机制的普遍性。
- AI 发送者: 用 LLM 替代人类 S,检验大模型在被"用户满意度"激励时是否复制人类的策略性虚假信息行为,对接 Chen_Kirshner_2025_ChatGPT_BiasedDecisions 等 AI 偏差研究。
- 高阶信念校准: 设计干预(如提供"实际偏差水平"反馈)纠正 S 的高估,观察是否减少虚假信息。
- 细分动机类型: 区分党派身份动机、经济利益动机(如 S 自身是相关行业从业者)、群体认同动机,比较不同动机源对供给的相对贡献。
- 接收者反向操纵: 让 R 知道 S 被激励,是否激活 R 的策略性怀疑?这是"双侧动机性推理"模型的延伸。
- 金融市场应用: 将框架应用到分析师推荐(被"准确性"评级激励 vs 被"客户满意度"激励),区分两种激励对推荐质量的影响,与 Barberis_PsychologyBased_AssetPricing 等行为金融文献对话。
- 真实行为追踪: 与新闻平台合作追踪受激励的内容创作者(如 Substack 写手)的实际发布行为,测量"订阅增长激励"对内容真实性的影响。
- 儿童/青少年发展: 研究偏见盲点的发展轨迹——人们何时开始高估他人偏差?这对媒体素养教育有政策意义。
关键结论
- 激励机制反向放大虚假信息: 被"被认为可信"激励的发送者比未激励者多发送 7.3 pp(实验1)至 8.5 pp(实验2)的虚假消息——相对增幅约 34%。这对社交媒体平台的"用户评分/可信度系统"提出了反直觉警示:迎合受众偏好的激励反而恶化信息质量。
- 党派 × 激励的交互: 在 R 党派与虚假消息一致时,被激励 S 多发 7.1-14.5 pp 虚假信息,方向与动机性推理理论预测完全一致,证明 S 在战略性地利用 R 的动机性偏差。
- 接收者天真性: R 的评估不随 S 激励状态调整,未能预见激励对 S 行为的影响——这是"接收者去偏差化"的政策切入点,可能比改变 S 激励更可行。
- 偏见盲点: S 预测 R 党派偏差为 30 pp,实际仅 2 pp——首个关于"动机性推理盲点"的实验证据。这提示干预策略可同时纠正人们的元信念。
- 信息渠道的双刃剑: 给 S 获取受众党派信息的渠道使被激励 S 多选 6.5 pp 虚假信息(因果证据)。社交媒体平台的"受众分析工具"可能加剧虚假信息供给。
- 诚实偏好可被激励削弱: 21% 的无激励 S 也发虚假消息(表现性偏好),且 lying-aversion 在 \gamma > 0 时显著被压制——对 Abeler-Nosenzo-Raymond 诚实偏好的边界条件。
- 与 Thaler_GoodNews_MotivatedReasoning 形成完整闭环: Good News 论文证明纯效价不引发动机性推理,需要功能性动机;本文证明功能性激励确实通过供给侧放大虚假信息——两文共同将动机性推理的边界条件与作用机制完整刻画。
- 政策启示: 平台设计需重新审视评分/可信度激励;接收者媒体素养教育和元信念校准可能是更有效的干预路径;强制披露发送者激励状态可能改善受众判断。