Exley_2024_MotivatedErrors

实验设计

本文包含三组实验（Adding Study、Correlation Neglect Study、Anchoring Studies），均在 Amazon Mechanical Turk 上招募被试，总计超过 5,000 名被试。核心设计思路：当个体可以借助"犯错"或"困惑"的可能性来为自私行为辩护时，他们是否会做出 motivated errors（动机性错误）。

Adding Study（加法研究）

被试：1,769 名 MTurk 被试，随机分配到 8 个 treatment 之一。每人完成约 25 分钟的实验，获得 $4 参与费。此外，随机抽取一个决策实施奖金支付。

第一步：Multiple Price List 校准阶段

被试首先完成一组 multiple price list，用于找到使被试在"获得 X 美分给自己"和"150 美分捐给 Make-A-Wish Foundation"之间无差异的金额 X。具体而言，被试在一系列"X 美分给自己 vs. 150 美分给慈善"的二元选择中做出偏好，X 值递增，系统据此确定被试的无差异点。若无差异区间下界为 0，则设定 X = 5 美分。

第二步：48 道二元决策任务

校准完成后，被试进入核心决策阶段，共做 48 道二元选择题。每道题中，被试在两个选项之间选择：

Outside option（外部选项）：固定金额。在 Charity/Charity treatment 中为 150 美分给 Make-A-Wish Foundation；在 Self/Charity treatment 中为 X 美分给自己。
Bundle（捆绑选项）：由 4 或 5 个 summand（加数）组成的一笔总额，全部捐给 Make-A-Wish Foundation。

Bundle 的构造方式：

36 个主要 bundle（12 个含 4 个 summand 的 bundle + 24 个含 5 个 summand 的 bundle）。
summand 个数 n 属于 {2, 3, 4, 5}，非零 summand 值 d 属于 {51, 52, 53, 54, 55, 56, 57, 58, 59}。
每个 bundle 内，summand 要么为 0 要么为同一个正数 d，因此总和始终为 n x d。
12 个基线 bundle（4 个 summand，均为正数 d）。在每个基线 bundle 基础上：(a) 添加一个等于 0 的第 5 个 summand 构成 5-summand bundle（+0 条件）；(b) 添加一个等于 d 的第 5 个 summand 构成另一个 5-summand bundle（+1 条件）。
n = 2 时，n x d 显著低于 150 美分；n = 3 时略高于 150 美分；n = 4 和 n = 5 时显著高于 150 美分。

信息呈现方式：每个 bundle 以交互式方式呈现——第一个 summand 默认显示，其余 summand 需被试逐个点击才能看到。被试必须点击查看所有 summand 后才能做出决策。这一设计既确保被试看到所有信息，又便于追踪信息回避行为。

48 道决策的呈现顺序：在每个被试内部随机排列。一半被试先做 12 道 4-summand bundle 决策，再做 24 道 5-summand bundle 决策；另一半顺序相反。在每组 24 或 12 道决策中，呈现顺序也随机。

两个主要 treatment 的区别：

Charity/Charity treatment：外部选项为 150 美分给慈善。被试在两个都捐给慈善的选项间选择。此时不存在自私动机——无论怎么选，钱都给慈善。
Self/Charity treatment：外部选项为 X 美分给自己（X 由 price list 校准得到）。被试在"给自己 X 美分"和"给慈善 bundle 总额"之间选择。此时存在自私动机——选择外部选项意味着把钱留给自己。

识别策略：比较同一基线 bundle 在添加 0（+0 条件）前后被试选择 bundle 的比例变化。在 Charity/Charity treatment 中，添加 0 不改变自私动机（因为两个选项都给慈善），所以不应影响选择。在 Self/Charity treatment 中，如果被试利用简单加法错误（"加了一个数所以总额可能变了"）来为自私选择辩护，那么添加 0 会降低被试选择 bundle 的概率。

额外的 debiasing treatments（基于 Self/Charity treatment 构建）：

Self/Charity (sum optional)：被试可选择点击按钮查看 bundle 的总和，但非强制。
Self/Charity (sum shown)：每道决策屏幕上直接显示 bundle 的总和。
Self/Charity (sum unavoidable)：总和醒目地显示在决策屏幕上，且被试必须正确报告总和后才能做出决策。

支付：随机抽取一个决策实施。若该决策的结果是慈善选项，则对应金额捐给 Make-A-Wish Foundation；若结果是自己的选项，则被试获得 X 美分作为奖金。

Correlation Neglect Study（相关性忽视研究）

被试：1,200 名 MTurk 被试，随机分配到 3 个 treatment 之一。每人完成约 20 分钟的实验，获得 $3.50 参与费。

第一步：Multiple Price List 校准

与 Adding Study 相同，被试先完成 multiple price list 确定无差异金额 X。

第二步：10 道预测任务

被试回答 10 道题，每题要求预测一个数，该数等于四个 estimate（Estimate 1, 2, 3, 4）的平均值。被试使用 0-100 的 slider 作答（选择一个区间而非精确值）。

信息呈现方式（参考 Enke and Zimmermann 2019 的设计）：

被试被直接告知 Estimate 1 的值。
被试被告知三个"新闻频道"的报道：Channel 1 News 报道 Estimate 1 和 Estimate 2 的平均值；Channel 2 News 报道 Estimate 1 和 Estimate 3 的平均值；Channel 3 News 报道 Estimate 1 和 Estimate 4 的平均值。
关键特征：所有信息都与 Estimate 1 相关（每个 channel 报道的都是 Estimate 1 与另一个 estimate 的平均值）。正确答案等于三个 channel 报道值的平均值（若被试正确考虑相关性）。但如果被试把各信号视为独立信息（即忽视相关性），他们会过度估计高信号、低估低信号。

10 道题的构造（配对设计）：5 对题目，每对中 Estimate 1 是四个 estimate 中最小的（Low Estimate 1 题）或最大的（High Estimate 1 题），但两题的正确答案相同。因此：

Low Estimate 1 题中，correlation neglect 导致答案偏低。
High Estimate 1 题中，correlation neglect 导致答案偏高。

三个 treatment：

Control condition：无论被试低估（slider 区间过低）还是高估（slider 区间过高）或正确回答（slider 区间包含正确答案），慈善均获得 150 美分。此外，若被试答对，自己获得 X 美分奖金。
Underestimate treatment：低估时，被试获得 X 美分给自己而非 150 美分给慈善。即低估有自私激励。
Overestimate treatment：高估时，被试获得 X 美分给自己而非 150 美分给慈善。即高估有自私激励。

判定正确标准：答案与真实值相差不超过 2 视为正确。

识别策略：比较 Low Estimate 1 题 vs. High Estimate 1 题的回答差异。在 Control 中，差异反映纯粹的 correlation neglect。在 Underestimate / Overestimate treatment 中，若 motivated errors 存在，correlation neglect 在自私方向上被放大，在非自私方向上被缩小。

Anchoring Studies（锚定研究）

被试：Anchoring Study A 招募 1,195 名 MTurk 被试，Anchoring Study B 招募 1,192 名被试，各随机分配到 3 个 treatment 之一。每人完成约 10 分钟的实验，获得 $2 参与费。

第一步：Multiple Price List 校准

同上，确定无差异金额 X。

第二步：4 道知识问答题

被试回答 4 道常识题（源自 Enke et al. 2021）：(i) 光从太阳到木星需要多少分钟？ (ii) 第一次飞机飞越美国大陆需要多少天？ (iii) 乌兹别克斯坦有多少百万人？ (iv) 埃菲尔铁塔重量是多少百吨？

Anchoring Study A 的具体流程：

每道题先呈现一个随机锚值（20 或 80），问被试"答案是高于还是低于这个数字"。
然后被试在 0-100 的 slider 上选择精确答案。slider 的默认位置被设为锚值。被试有 15 秒作答，若不作答则以默认值（锚值）作为答案。

Anchoring Study B 的具体流程：

同样先呈现随机锚值（20 或 80），被试先回答"高于还是低于"。
然后在 0-100 的 slider 上作答，但 slider 默认位置为中点（50），不设时间限制，必须作答。

三个 treatment（与 Correlation Neglect Study 结构相同）：

Control：答对获得 X 美分给自己 + 150 美分给慈善；答错只有 150 美分给慈善。
Underestimate：低估时被试获得 X 美分给自己而非 150 美分给慈善。
Overestimate：高估时被试获得 X 美分给自己而非 150 美分给慈善。

判定正确标准：答案与真实值相差不超过 2 视为正确。

识别策略：比较 Low Anchor vs. High Anchor 条件下的回答差异。在 Control 中，差异反映纯粹的 anchoring bias。在 Underestimate / Overestimate treatment 中，motivated errors 预期会放大或缩小 anchoring bias。

理论模型

理论框架

本文不构建正式的结构模型，而是基于 motivated reasoning 的概念框架。核心思想源自 Benabou and Tirole (2002, 2006) 的自欺欺人（self-deception）理论传统：

核心假设：个体希望维持良好的自我形象（self-image）。当决策环境中存在犯错或困惑的可能性时，个体可以利用这种可能性来为自私行为提供借口。具体而言：

即使犯错的概率很小，个体也可以模仿"困惑型"（confused types）的行为，从而在选择自私行为时维持自我形象。
这意味着：只要存在犯错的可能性，自私行为的 image cost 就会降低，因为观察者（包括自己）无法确定行为是出于自私还是出于困惑。

Motivated errors 的定义：当且仅当犯错可以为自私选择提供辩护时，个体才会犯错。在没有自私动机的情境下，同一个体不会犯同类错误。

可检验预测

Adding Study：在 Self/Charity treatment 中（存在自私动机），被试应对添加 0 产生反应（降低选择 bundle 的概率）；在 Charity/Charity treatment 中（无自私动机），被试不应对添加 0 产生反应。
Correlation Neglect Study：在 Control 中应存在基准水平的 correlation neglect。在自私动机与 correlation neglect 方向一致时（Exacerbate bias），correlation neglect 应被放大；方向相反时（Mitigate bias），应被缩小。
Anchoring Studies：逻辑与 Correlation Neglect Study 类似。自私动机与 anchoring bias 方向一致时放大，方向相反时缩小。

估计方法

Adding Study：线性概率模型（LPM），回归被试选择 bundle 的概率，解释变量为添加 0 的指标（+0）和添加非零值的指标（+1），控制基线 bundle 的 summand 个数和值的固定效应，标准误在被试层面聚类。
Correlation Neglect Study 和 Anchoring Studies：OLS 回归误差大小（真实答案 - 被试回答的中点），解释变量为 Low Estimate 1（或 Low Anchor）的指标，控制题目对的固定效应，标准误在被试层面聚类。

核心发现

Adding Study 主要结果

Charity/Charity treatment（无自私动机）：添加 0 对被试选择 bundle 的概率没有显著影响。(+0) 系数为 0.01（SE = 0.01），不显著。被试不会因为添加一个 0 而改变决策。
Self/Charity treatment（有自私动机）：添加 0 显著降低被试选择 bundle 的概率，(+0) 系数为 -0.06（SE = 0.01），p < 0.01。被试在 bundle 中多加一个 0 后，选择 bundle（即选择给慈善）的概率下降 6 个百分点。这一效应占基线选择概率（0.58）的 10%，且超过添加一个非零金额（平均增加 33% 捐赠额）效应的一半。
效应在个体层面的表现：50% 的 Self/Charity 被试至少在一道题中对添加 0 产生反应，而 Charity/Charity 中仅 26%（p < 0.01）。37% 的 Self/Charity 被试表现出非单调行为（对捐赠总额的反应非单调），而 Charity/Charity 中仅 25%（p < 0.01）。
Debiasing 结果：
- Self/Charity (sum optional)：效应降至 3 个百分点（p < 0.1），但被试仅 58% 的时间点击查看总和。
- Self/Charity (sum shown)：效应同样约 3 个百分点（p < 0.1），因为被试可以声称没看到。
- Self/Charity (sum unavoidable)：效应降至 2 个百分点（p > 0.05 与 Self/Charity 的差异显著），motivated errors 基本消除。仅当被试必须向实验者证明自己知道总和时，motivated errors 才被消除。
补充性 Calculation Study：100 名 MTurk 被试被要求直接计算 bundle 的总和。正确率 98%（4-summand）和 99%（5-summand），且不依赖于是否包含 0。证明被试完全有能力正确计算。

Correlation Neglect Study 主要结果

Control condition：存在显著的 correlation neglect。Low Estimate 1 题中回答偏低约 19.50 个单位（在 0-100 支撑集上），证实被试忽视信号间的相关性。
Exacerbate bias（自私动机放大偏误）：当 correlation neglect 的方向恰好利于自私时，偏误增大至 24.81 个单位，显著大于 Control（p < 0.01）。
Mitigate bias（自私动机缩小偏误）：当 correlation neglect 的方向不利于自私时，偏误缩小至 7.70 个单位，显著小于 Control（p < 0.01）。

Anchoring Studies 主要结果

Anchoring Study A：

Control：Low Anchor 使回答偏低 19.93 个单位（显著 anchoring bias）。
Exacerbate bias：偏误增大至 27.91（p < 0.01 vs. Control）。
Mitigate bias：偏误缩小至 9.11（p < 0.01 vs. Control）。

Anchoring Study B：

Control：Low Anchor 使回答偏低 14.35。
Exacerbate bias：偏误增大至 21.36（p < 0.01 vs. Control）。
Mitigate bias：偏误缩小至 5.01（p < 0.01 vs. Control）。

两个 Anchoring Study 结果高度一致，且所有结果在多项稳健性检验下成立。

与其他文献的关系

Motivated reasoning 与自欺欺人

本文是 motivated reasoning 文献的重要拓展，将"利用犯错的可能性"作为一种新的自私辩护机制。与 Benabou_2002_SelfConfidence 和 Benabou_2006_IncentivesProsocial 的 self-deception 理论一脉相承，但聚焦于认知错误而非信念扭曲。
与 Dana_2007_MoralWiggleRoom 的 information avoidance 类似但有区别：本文的被试不是回避信息，而是在看到信息后仍然"犯错"。
与 Zimmermann_2020_DynamicsMotivatedBeliefs 关于 motivated beliefs 动态变化的研究互补。

Correlation neglect 与 anchoring

Correlation Neglect Study 的设计直接借鉴 Enke_2019_CorrelationNeglect，将其框架拓展到自私动机情境。
Anchoring Studies 借鉴 Enke_2021_CognitiveBiases 的实验设计和知识问答题目，发现 anchoring bias 可被 motivated errors 放大或缩小。

慈善捐赠与利他行为

与 Exley_2016_ExcusingSelfish 和 Exley_2020_UsingCharity 关于慈善捐赠中的借口行为形成系列研究。
Adding Study 中 Make-A-Wish Foundation 的选择与 outside option 校准方法也见于 Exley_2023_InformationAvoidance。

Debiasing 与政策启示

Debiasing 结果呼应 Chetty_2009_SalienceTaxation 和 Madrian_2014_BehavioralEconomicsPolicy 关于行为干预的讨论。
结果表明仅仅提供信息不足以消除 motivated errors，必须要求个体"不可回避地"确认信息才有效。这与 Hanna_2014_LearningThroughNoticing 的发现一致。