Exley_2024_MotivatedErrors
实验设计
本文包含三组实验(Adding Study、Correlation Neglect Study、Anchoring Studies),均在 Amazon Mechanical Turk 上招募被试,总计超过 5,000 名被试。核心设计思路:当个体可以借助"犯错"或"困惑"的可能性来为自私行为辩护时,他们是否会做出 motivated errors(动机性错误)。
Adding Study(加法研究)
被试:1,769 名 MTurk 被试,随机分配到 8 个 treatment 之一。每人完成约 25 分钟的实验,获得 $4 参与费。此外,随机抽取一个决策实施奖金支付。
第一步:Multiple Price List 校准阶段
被试首先完成一组 multiple price list,用于找到使被试在"获得 X 美分给自己"和"150 美分捐给 Make-A-Wish Foundation"之间无差异的金额 X。具体而言,被试在一系列"X 美分给自己 vs. 150 美分给慈善"的二元选择中做出偏好,X 值递增,系统据此确定被试的无差异点。若无差异区间下界为 0,则设定 X = 5 美分。
第二步:48 道二元决策任务
校准完成后,被试进入核心决策阶段,共做 48 道二元选择题。每道题中,被试在两个选项之间选择:
- Outside option(外部选项):固定金额。在 Charity/Charity treatment 中为 150 美分给 Make-A-Wish Foundation;在 Self/Charity treatment 中为 X 美分给自己。
- Bundle(捆绑选项):由 4 或 5 个 summand(加数)组成的一笔总额,全部捐给 Make-A-Wish Foundation。
Bundle 的构造方式:
- 36 个主要 bundle(12 个含 4 个 summand 的 bundle + 24 个含 5 个 summand 的 bundle)。
- summand 个数 n 属于 {2, 3, 4, 5},非零 summand 值 d 属于 {51, 52, 53, 54, 55, 56, 57, 58, 59}。
- 每个 bundle 内,summand 要么为 0 要么为同一个正数 d,因此总和始终为 n x d。
- 12 个基线 bundle(4 个 summand,均为正数 d)。在每个基线 bundle 基础上:(a) 添加一个等于 0 的第 5 个 summand 构成 5-summand bundle(+0 条件);(b) 添加一个等于 d 的第 5 个 summand 构成另一个 5-summand bundle(+1 条件)。
- n = 2 时,n x d 显著低于 150 美分;n = 3 时略高于 150 美分;n = 4 和 n = 5 时显著高于 150 美分。
信息呈现方式:每个 bundle 以交互式方式呈现——第一个 summand 默认显示,其余 summand 需被试逐个点击才能看到。被试必须点击查看所有 summand 后才能做出决策。这一设计既确保被试看到所有信息,又便于追踪信息回避行为。
48 道决策的呈现顺序:在每个被试内部随机排列。一半被试先做 12 道 4-summand bundle 决策,再做 24 道 5-summand bundle 决策;另一半顺序相反。在每组 24 或 12 道决策中,呈现顺序也随机。
两个主要 treatment 的区别:
- Charity/Charity treatment:外部选项为 150 美分给慈善。被试在两个都捐给慈善的选项间选择。此时不存在自私动机——无论怎么选,钱都给慈善。
- Self/Charity treatment:外部选项为 X 美分给自己(X 由 price list 校准得到)。被试在"给自己 X 美分"和"给慈善 bundle 总额"之间选择。此时存在自私动机——选择外部选项意味着把钱留给自己。
识别策略:比较同一基线 bundle 在添加 0(+0 条件)前后被试选择 bundle 的比例变化。在 Charity/Charity treatment 中,添加 0 不改变自私动机(因为两个选项都给慈善),所以不应影响选择。在 Self/Charity treatment 中,如果被试利用简单加法错误("加了一个数所以总额可能变了")来为自私选择辩护,那么添加 0 会降低被试选择 bundle 的概率。
额外的 debiasing treatments(基于 Self/Charity treatment 构建):
- Self/Charity (sum optional):被试可选择点击按钮查看 bundle 的总和,但非强制。
- Self/Charity (sum shown):每道决策屏幕上直接显示 bundle 的总和。
- Self/Charity (sum unavoidable):总和醒目地显示在决策屏幕上,且被试必须正确报告总和后才能做出决策。
支付:随机抽取一个决策实施。若该决策的结果是慈善选项,则对应金额捐给 Make-A-Wish Foundation;若结果是自己的选项,则被试获得 X 美分作为奖金。
Correlation Neglect Study(相关性忽视研究)
被试:1,200 名 MTurk 被试,随机分配到 3 个 treatment 之一。每人完成约 20 分钟的实验,获得 $3.50 参与费。
第一步:Multiple Price List 校准
与 Adding Study 相同,被试先完成 multiple price list 确定无差异金额 X。
第二步:10 道预测任务
被试回答 10 道题,每题要求预测一个数,该数等于四个 estimate(Estimate 1, 2, 3, 4)的平均值。被试使用 0-100 的 slider 作答(选择一个区间而非精确值)。
信息呈现方式(参考 Enke and Zimmermann 2019 的设计):
- 被试被直接告知 Estimate 1 的值。
- 被试被告知三个"新闻频道"的报道:Channel 1 News 报道 Estimate 1 和 Estimate 2 的平均值;Channel 2 News 报道 Estimate 1 和 Estimate 3 的平均值;Channel 3 News 报道 Estimate 1 和 Estimate 4 的平均值。
- 关键特征:所有信息都与 Estimate 1 相关(每个 channel 报道的都是 Estimate 1 与另一个 estimate 的平均值)。正确答案等于三个 channel 报道值的平均值(若被试正确考虑相关性)。但如果被试把各信号视为独立信息(即忽视相关性),他们会过度估计高信号、低估低信号。
10 道题的构造(配对设计):5 对题目,每对中 Estimate 1 是四个 estimate 中最小的(Low Estimate 1 题)或最大的(High Estimate 1 题),但两题的正确答案相同。因此:
- Low Estimate 1 题中,correlation neglect 导致答案偏低。
- High Estimate 1 题中,correlation neglect 导致答案偏高。
三个 treatment:
- Control condition:无论被试低估(slider 区间过低)还是高估(slider 区间过高)或正确回答(slider 区间包含正确答案),慈善均获得 150 美分。此外,若被试答对,自己获得 X 美分奖金。
- Underestimate treatment:低估时,被试获得 X 美分给自己而非 150 美分给慈善。即低估有自私激励。
- Overestimate treatment:高估时,被试获得 X 美分给自己而非 150 美分给慈善。即高估有自私激励。
判定正确标准:答案与真实值相差不超过 2 视为正确。
识别策略:比较 Low Estimate 1 题 vs. High Estimate 1 题的回答差异。在 Control 中,差异反映纯粹的 correlation neglect。在 Underestimate / Overestimate treatment 中,若 motivated errors 存在,correlation neglect 在自私方向上被放大,在非自私方向上被缩小。
Anchoring Studies(锚定研究)
被试:Anchoring Study A 招募 1,195 名 MTurk 被试,Anchoring Study B 招募 1,192 名被试,各随机分配到 3 个 treatment 之一。每人完成约 10 分钟的实验,获得 $2 参与费。
第一步:Multiple Price List 校准
同上,确定无差异金额 X。
第二步:4 道知识问答题
被试回答 4 道常识题(源自 Enke et al. 2021):(i) 光从太阳到木星需要多少分钟? (ii) 第一次飞机飞越美国大陆需要多少天? (iii) 乌兹别克斯坦有多少百万人? (iv) 埃菲尔铁塔重量是多少百吨?
Anchoring Study A 的具体流程:
- 每道题先呈现一个随机锚值(20 或 80),问被试"答案是高于还是低于这个数字"。
- 然后被试在 0-100 的 slider 上选择精确答案。slider 的默认位置被设为锚值。被试有 15 秒作答,若不作答则以默认值(锚值)作为答案。
Anchoring Study B 的具体流程:
- 同样先呈现随机锚值(20 或 80),被试先回答"高于还是低于"。
- 然后在 0-100 的 slider 上作答,但 slider 默认位置为中点(50),不设时间限制,必须作答。
三个 treatment(与 Correlation Neglect Study 结构相同):
- Control:答对获得 X 美分给自己 + 150 美分给慈善;答错只有 150 美分给慈善。
- Underestimate:低估时被试获得 X 美分给自己而非 150 美分给慈善。
- Overestimate:高估时被试获得 X 美分给自己而非 150 美分给慈善。
判定正确标准:答案与真实值相差不超过 2 视为正确。
识别策略:比较 Low Anchor vs. High Anchor 条件下的回答差异。在 Control 中,差异反映纯粹的 anchoring bias。在 Underestimate / Overestimate treatment 中,motivated errors 预期会放大或缩小 anchoring bias。
理论模型
理论框架
本文不构建正式的结构模型,而是基于 motivated reasoning 的概念框架。核心思想源自 Benabou and Tirole (2002, 2006) 的自欺欺人(self-deception)理论传统:
核心假设:个体希望维持良好的自我形象(self-image)。当决策环境中存在犯错或困惑的可能性时,个体可以利用这种可能性来为自私行为提供借口。具体而言:
- 即使犯错的概率很小,个体也可以模仿"困惑型"(confused types)的行为,从而在选择自私行为时维持自我形象。
- 这意味着:只要存在犯错的可能性,自私行为的 image cost 就会降低,因为观察者(包括自己)无法确定行为是出于自私还是出于困惑。
Motivated errors 的定义:当且仅当犯错可以为自私选择提供辩护时,个体才会犯错。在没有自私动机的情境下,同一个体不会犯同类错误。
可检验预测
- Adding Study:在 Self/Charity treatment 中(存在自私动机),被试应对添加 0 产生反应(降低选择 bundle 的概率);在 Charity/Charity treatment 中(无自私动机),被试不应对添加 0 产生反应。
- Correlation Neglect Study:在 Control 中应存在基准水平的 correlation neglect。在自私动机与 correlation neglect 方向一致时(Exacerbate bias),correlation neglect 应被放大;方向相反时(Mitigate bias),应被缩小。
- Anchoring Studies:逻辑与 Correlation Neglect Study 类似。自私动机与 anchoring bias 方向一致时放大,方向相反时缩小。
估计方法
- Adding Study:线性概率模型(LPM),回归被试选择 bundle 的概率,解释变量为添加 0 的指标(+0)和添加非零值的指标(+1),控制基线 bundle 的 summand 个数和值的固定效应,标准误在被试层面聚类。
- Correlation Neglect Study 和 Anchoring Studies:OLS 回归误差大小(真实答案 - 被试回答的中点),解释变量为 Low Estimate 1(或 Low Anchor)的指标,控制题目对的固定效应,标准误在被试层面聚类。
核心发现
Adding Study 主要结果
-
Charity/Charity treatment(无自私动机):添加 0 对被试选择 bundle 的概率没有显著影响。(+0) 系数为 0.01(SE = 0.01),不显著。被试不会因为添加一个 0 而改变决策。
-
Self/Charity treatment(有自私动机):添加 0 显著降低被试选择 bundle 的概率,(+0) 系数为 -0.06(SE = 0.01),p < 0.01。被试在 bundle 中多加一个 0 后,选择 bundle(即选择给慈善)的概率下降 6 个百分点。这一效应占基线选择概率(0.58)的 10%,且超过添加一个非零金额(平均增加 33% 捐赠额)效应的一半。
-
效应在个体层面的表现:50% 的 Self/Charity 被试至少在一道题中对添加 0 产生反应,而 Charity/Charity 中仅 26%(p < 0.01)。37% 的 Self/Charity 被试表现出非单调行为(对捐赠总额的反应非单调),而 Charity/Charity 中仅 25%(p < 0.01)。
-
Debiasing 结果:
- Self/Charity (sum optional):效应降至 3 个百分点(p < 0.1),但被试仅 58% 的时间点击查看总和。
- Self/Charity (sum shown):效应同样约 3 个百分点(p < 0.1),因为被试可以声称没看到。
- Self/Charity (sum unavoidable):效应降至 2 个百分点(p > 0.05 与 Self/Charity 的差异显著),motivated errors 基本消除。仅当被试必须向实验者证明自己知道总和时,motivated errors 才被消除。
-
补充性 Calculation Study:100 名 MTurk 被试被要求直接计算 bundle 的总和。正确率 98%(4-summand)和 99%(5-summand),且不依赖于是否包含 0。证明被试完全有能力正确计算。
Correlation Neglect Study 主要结果
-
Control condition:存在显著的 correlation neglect。Low Estimate 1 题中回答偏低约 19.50 个单位(在 0-100 支撑集上),证实被试忽视信号间的相关性。
-
Exacerbate bias(自私动机放大偏误):当 correlation neglect 的方向恰好利于自私时,偏误增大至 24.81 个单位,显著大于 Control(p < 0.01)。
-
Mitigate bias(自私动机缩小偏误):当 correlation neglect 的方向不利于自私时,偏误缩小至 7.70 个单位,显著小于 Control(p < 0.01)。
Anchoring Studies 主要结果
Anchoring Study A:
- Control:Low Anchor 使回答偏低 19.93 个单位(显著 anchoring bias)。
- Exacerbate bias:偏误增大至 27.91(p < 0.01 vs. Control)。
- Mitigate bias:偏误缩小至 9.11(p < 0.01 vs. Control)。
Anchoring Study B:
- Control:Low Anchor 使回答偏低 14.35。
- Exacerbate bias:偏误增大至 21.36(p < 0.01 vs. Control)。
- Mitigate bias:偏误缩小至 5.01(p < 0.01 vs. Control)。
两个 Anchoring Study 结果高度一致,且所有结果在多项稳健性检验下成立。
与其他文献的关系
Motivated reasoning 与自欺欺人
- 本文是 motivated reasoning 文献的重要拓展,将"利用犯错的可能性"作为一种新的自私辩护机制。与 Benabou_2002_SelfConfidence 和 Benabou_2006_IncentivesProsocial 的 self-deception 理论一脉相承,但聚焦于认知错误而非信念扭曲。
- 与 Dana_2007_MoralWiggleRoom 的 information avoidance 类似但有区别:本文的被试不是回避信息,而是在看到信息后仍然"犯错"。
- 与 Zimmermann_2020_DynamicsMotivatedBeliefs 关于 motivated beliefs 动态变化的研究互补。
Correlation neglect 与 anchoring
- Correlation Neglect Study 的设计直接借鉴 Enke_2019_CorrelationNeglect,将其框架拓展到自私动机情境。
- Anchoring Studies 借鉴 Enke_2021_CognitiveBiases 的实验设计和知识问答题目,发现 anchoring bias 可被 motivated errors 放大或缩小。
慈善捐赠与利他行为
- 与 Exley_2016_ExcusingSelfish 和 Exley_2020_UsingCharity 关于慈善捐赠中的借口行为形成系列研究。
- Adding Study 中 Make-A-Wish Foundation 的选择与 outside option 校准方法也见于 Exley_2023_InformationAvoidance。
Debiasing 与政策启示
- Debiasing 结果呼应 Chetty_2009_SalienceTaxation 和 Madrian_2014_BehavioralEconomicsPolicy 关于行为干预的讨论。
- 结果表明仅仅提供信息不足以消除 motivated errors,必须要求个体"不可回避地"确认信息才有效。这与 Hanna_2014_LearningThroughNoticing 的发现一致。