Bribing the Self

元数据

作者: Uri Gneezy, Silvia Saccardo, Marta Serra-Garcia, Roel van Veldhuizen
年份: 2020
期刊: Games and Economic Behavior
DOI: https://doi.org/10.1016/j.geb.2019.12.010
JEL分类: D03, D83, C91
关键词: Advice, Self-Deception, Self-Image, Motivated Beliefs, Laboratory Experiment

一句话总结

通过实验室与线上建议博弈操纵"顾问何时知道自己有$1佣金"的信息时序，揭示事前知道激励 → 自我欺骗扭曲信念 → 给出有偏推荐的因果链；并证明只有当推荐选项完全严格被支配（无任何可辩护的理由空间）时，自我欺骗才被彻底消除。

研究问题

自我欺骗（self-deception）能否帮助有利益冲突的顾问在保留"自己是道德的"自我形象的同时给出有偏建议？
信息呈现的时序（先看选项还是先知道自身激励）如何约束自我欺骗的能力？
当被推荐选项的"客户偏好的合理理由"（风险厌恶、公平性）被逐步移除时，自我欺骗的强度如何变化？
自我欺骗是否会溢出到顾问自身的决策（例如为自己投资时也偏好同样选项）？

核心贡献

方法创新（信息时序设计）：通过Before/After操纵纯粹分离self-image与social-image关切——实验者只能观察最终推荐而非中间评估，因此处理效应反映的是顾问对自我的信念扭曲而非给观察者看的表演
理由空间的渐次移除（RiskReturn → Dominance → ObviousDominance）：系统性识别自我欺骗依赖的最小条件，发现即使只剩"佣金=客户期望损失因此公平"这一最小理由，自我欺骗仍同样强烈，只有完全严格支配时才消失
直接的信念测量：在线上实验中独立测量"顾问相信客户偏好A的概率"，证明Before组确实持有扭曲信念（不仅是策略性报告）
溢出效应：扭曲信念延伸到顾问为自己挑选投资的决策，提示自我欺骗确实改变了内在信念而非仅是事后合理化

维度1：实验设计分析

核心研究问题

自我欺骗（self-deception）如何帮助顾问在保持"自己是道德的"自我形象的同时，给出有偏的建议？信息时序（何时得知自身激励）如何约束自我欺骗的能力？

基本博弈框架：建议博弈（Advice Game）

角色: 发送者（"顾问"/advisor）和接收者（"客户"/client）
任务: 顾问了解两个投资选项A和B的详情，向不知情的客户推荐其中一个
与经典sender-receiver博弈的区别: 发送者需要做出主观判断（推荐），而非报告客观信息

三个处理组（核心操纵变量：信息时序）

处理组	信息顺序	逻辑
Control（控制组）	看到投资选项 -> 推荐	无佣金激励，推荐A无额外报酬
Before（事前组）	得知$1佣金 -> 看到投资选项 -> 推荐	先知道激励再评估选项，自我欺骗空间最大
After（事后组）	看到投资选项 -> 得知$1佣金 -> 推荐	先评估选项再知道激励，自我欺骗受约束

三个实验室实验（逐步减少自我欺骗的理由空间）

实验1：RiskReturn（风险-收益权衡）

投资A：50-50彩票，回报$2或$4（期望值$3）
投资B：50-50彩票，回报$1或$7（期望值$4）
A期望值更低但方差更小；B期望值更高但方差更大
自我欺骗的理由空间：两个 -- (1) 客户可能风险厌恶所以偏好A；(2) 佣金$1等于客户期望损失$1，可视为"公平"推荐

实验2：Dominance（支配）

投资A：不变（50-50彩票，$2或$4，期望值$3）
投资B：改为50-50彩票，$2或$6（期望值$4）
B在低状态下回报与A相同，高状态下更高 -> B弱支配A
自我欺骗的理由空间：一个 -- 风险理由被消除，但佣金$1仍等于客户期望损失$1，仍可辩称"公平"

实验3：ObviousDominance（明显支配）

投资A：不变（50-50彩票，$2或$4）
投资B：改为50-50彩票，$5或$7
B在两个状态下都严格优于A -> B严格支配A
自我欺骗的理由空间：零 -- 无任何合理理由推荐A

实验流程（实验室实验）

地点与时间: 加州大学圣迭戈分校（UCSD），2015年春季和秋季
指导语呈现: 4个屏幕依次展示
- 屏幕1：介绍研究、角色（顾问）、$1固定报酬；Before组在此屏告知佣金
- 屏幕2-3：展示投资A和B的详情，要求顾问思考推荐
- 屏幕4：举手获取纸条，手写推荐（"I recommend you to choose Product ___"）；After组在此屏展示佣金信息
- 屏幕5：确认推荐
关键设计细节: 每10个推荐中随机选1个实际传递给客户（10%概率执行）
样本量: 总计947名参与者（去除38名重复参与者后909名）
- RiskReturn: 294名顾问（每组约98人）
- Dominance: 295名顾问（Control 98, Before 100, After 97）
- ObviousDominance: 320名顾问（Control 106, Before 105, After 109）
- 女性占比48%

三个线上实验（MTurk，机制检验）

时间: 2019年春季，Amazon Mechanical Turk
样本: 每实验每处理组约150人，总计约900名顾问 + 899名客户
报酬调整: 所有收益除以4（A为$0.50-$1的50-50彩票，佣金$0.25）
关键新增测量:
- 信念测量: 推荐前询问"你认为客户更偏好A还是B？"（非激励性测量）
- 自我选择: 实验结束时，顾问为自己选择A或B作为报酬
匹配机制: 1对1匹配（每个顾问都与一个客户配对）
仅设Before和After两组（无Control组）

维度2：理论模型

理论框架

基于Benabou (2015)的动机性信念模型简化版（详见原文Appendix C）。

核心机制

顾问从以下来源获得效用：

物质收益: 推荐A获得佣金（$1实验室/$0.25线上）
自我形象效用: 相信自己的推荐符合客户偏好时获得正效用

U = \pi(recommendation) + \mu \cdot \mathbb{1}[\text{believe recommendation is ethical}] - c(\text{self-deception})

其中：

$\pi$ ：物质收益（推荐A时获得佣金）
$\mu$ ：自我形象价值（认为自己推荐是道德的所获效用）
$c$ ：自我欺骗成本（扭曲信念的心理成本）

关键假说

假说1（RiskReturn实验）: Before组推荐A的比例 > After组（存在风险-收益权衡的理由空间允许自我欺骗）

假说2A: 若顾问仅就客户风险偏好自我欺骗 -> Dominance实验中Before = After（风险理由被移除）
假说2B: 若顾问还就客户公平关切自我欺骗 -> Dominance实验中Before > After（公平理由仍存在）

假说3（ObviousDominance实验）: Before = After（所有理由空间被消除，无法自我欺骗）

内部观察者模型

框架中存在一个"内部观察者"（internal observer），评估决策者的行为：

观察者不知道决策者是否真正相信A是客户偏好，但通过决策者的声明信念和推荐行为来推断其类型
自我欺骗表现为有偏的信念更新（biased updating），使观察者更可能判断决策者是道德的

维度3：核心发现

实验室实验：推荐A的比例

RiskReturn实验

处理组	推荐A比例	与After比较
Control	30.6%	--
Before	61.2%	+28.6pp（Z=4.30, p<0.001）
After	32.7%	基准

Before vs Control: +30.6pp（p=0.000）
After vs Control: +2.1pp（Z=0.31, p=0.759，不显著）
Effect size: Before处理使推荐有偏投资的概率翻倍（从30.6%到61.2%）

Dominance实验

处理组	推荐A比例	与After比较
Control	13.3%	--
Before	53.0%	+28.3pp（Z=4.06, p<0.001）
After	24.7%	基准

After vs Control: +11.4pp（Z=2.04, p=0.041，显著）
Before-After差异与RiskReturn实验无显著区别（DID交互项系数=-0.003, p>0.1）
含义: 即使只有"最小理由"（公平性），自我欺骗仍然同样强烈

ObviousDominance实验

处理组	推荐A比例	与After比较
Control	16.0%	--
Before	30.5%	+1.1pp（Z=0.18, p=0.858，不显著）
After	29.4%	基准

Before vs Control: +14.5pp（Z=2.48, p=0.013）
After vs Control: +13.4pp（Z=2.33, p=0.020）
Before-After差距消失: 当所有自我欺骗的理由被移除后，信息时序不再影响推荐
DID：Before X ObviousDominance交互项 = -0.275***（p<0.01），与RiskReturn相比Before-After效应显著更弱

线上实验：信念扭曲的直接证据

信念（"认为客户偏好A"的比例）

实验	Before	After	差异
RiskReturn	75.2%	31.4%	+43.8pp（Z=7.18, p<0.001）
Dominance	46.6%	8.1%	+38.5pp（Z=7.18, p<0.001）
ObviousDominance	29.9%	10.6%	+19.3pp（Z=4.04, p<0.001）

实验	Before	After	差异
RiskReturn	86.0%	75.0%	+11.0pp（Z=2.28, p=0.02）
Dominance	73.6%	59.3%	+14.3pp（Z=2.57, p=0.01）
ObviousDominance	48.9%	45.1%	+3.8pp（Z=0.64, p=0.52，不显著）

为自己选择A的比例（溢出效应）

实验	Before	After	差异
RiskReturn	58.1%	30.7%	+27.4pp（Z=4.53, p<0.001）
Dominance	19.6%	7.4%	+12.2pp（Z=2.97, p=0.003）
ObviousDominance	11.7%	9.9%	+1.8pp（Z=0.49, p=0.62，不显著）

关键发现: 自我欺骗不仅影响对客户的推荐，还溢出到顾问自身的投资选择

客户跟随率

RiskReturn: 76.7%客户跟随推荐
Dominance: 80.7%
ObviousDominance: 73.5%
线上实验: 88.7%（其中推荐A时90.4%跟随，推荐B时85.4%跟随）

回归分析关键结果（Table 1, LPM）

Before处理系数（以After为基准）：
- RiskReturn: 0.286***（SE=0.069）
- Dominance: 0.283***（SE=0.067）
- ObviousDominance: 0.011（SE=0.063，不显著）
Control处理系数：
- RiskReturn: -0.020（不显著）
- Dominance: -0.115**（SE=0.056）
- ObviousDominance: -0.133**（SE=0.057）

维度6：与其他文献的关系

所属领域

行为经济学 / 实验经济学 / 信息经济学交叉领域，聚焦于**动机性推理（motivated reasoning）与自我欺骗（self-deception）**在专家建议场景中的应用。

理论根基

动机性信念: Benabou & Tirole (2002, 2006, 2016); Benabou (2015)
自利归因与模糊性利用: Kunda (1990); Babcock et al. (1995); Dana et al. (2007); Haisley & Weber (2010); Exley (2015)
信息回避与信念效用: Golman et al. (2016); Loewenstein & Molnar (2018)

关键贡献

方法创新: 通过时序操纵（Before vs After）识别自我欺骗，区分自我形象（self-image）与社会形象（social image）关切。实验者在所有处理组中观察到的只有最终推荐，因此社会形象关切在各组间保持恒定，处理效应纯粹反映自我形象驱动的自我欺骗。
约束条件: 系统性地减少自我欺骗的"理由空间"（justification scope），发现即使只有最小理由（Dominance实验），自我欺骗仍然存在；只有当所有理由被完全移除时（ObviousDominance），自我欺骗才消失。
信念证据: 线上实验直接测量了信念扭曲，发现Before组顾问确实更倾向于相信客户偏好被激励的投资，并且这种信念扭曲溢出到自身选择。

与相关文献的对话

文献	关系
Babcock et al. (1995)	使用类似时序操纵研究自利偏差，但其初始评估可被实验者观察到；本文设计使评估仅发生在顾问心中，更纯粹地分离自我形象 vs 社会形象
Grossman & van der Weele (2017)	研究willful ignorance中的自我形象关切；本文在建议场景中提供互补证据
Schwardmann & van der Weele (2019)	研究欺骗与自我欺骗的关系；本文发现自我欺骗的顾问可能更有说服力（Trivers 2011的假说）
Chen & Gesche (2018)	发现建议给予中的持续偏差；本文解释其机制为自我欺骗
Gneezy, Saccardo & van Veldhuizen (2018)	同一作者团队研究贿赂对决策扭曲的行为驱动因素

政策启示

信息时序干预: 让专家在了解自身激励之前先评估选项，可减少有偏建议
减少模糊性: 向专家提供尽可能多的客户偏好信息，缩小自我欺骗空间
制度设计: 从按服务收费转向固定薪酬可限制过度治疗（但实施成本高），本文提供的时序操纵方案是更可行的补充
核心警示: 必须移除所有自我欺骗的理由空间，才能有效消除有偏建议；仅减少部分理由空间不足以降低偏差程度

局限性

实验室场景相对简单，现实中专家面临更复杂的信息环境
自我欺骗成本在模型中被假设为常数，实证支持有限
线上实验的信念测量为非激励性的（non-incentivized），可能受需求效应影响
未区分"真正的自我欺骗"与"策略性信念报告"

维度4：变量概览

变量类别	变量名	定义/操作化
主处理变量	信息时序	Control / Before（先知佣金） / After（后知佣金）
主因变量	推荐A比例	顾问最终是否推荐有佣金的选项A（0/1）
因变量（线上）	信念A	顾问相信客户更偏好A的0/1陈述（非激励性）
因变量（线上）	自选A	实验末顾问为自己投资时是否选A（0/1，溢出测度）
因变量	客户跟随率	客户是否听从推荐（0/1）
操纵变量	投资选项设计	RiskReturn（A高确定性低期望）/ Dominance（B弱支配A）/ ObviousDominance（B严格支配A）
激励参数	佣金	实验室$1，线上$0.25（推荐A时支付）
激励参数	实施概率	每10个推荐随机选1个实际传递给客户（10%概率）
控制变量	性别、年龄、固定报酬	实验室$1基本报酬
样本规模	实验室	947名顾问（去重后909），3个实验各约295-320人
样本规模	线上MTurk	约900名顾问 + 899名客户，每实验每处理组约150人

维度5：局限性

实验任务简化：50-50彩票远比真实金融建议简单，现实顾问面临多维度产品、长期客户关系、声誉机制
小额激励：佣金仅$1（实验室）或$0.25（线上），未检验大额激励下自我欺骗的边界
信念测量的非激励性：线上实验对"客户偏好"的信念报告未付费，可能受需求效应或后hoc合理化影响
未区分"真信念"与"策略性报告"：尽管溢出至自选行为提供了支持，仍无法完全排除顾问知道自己有偏却给出符合期望的报告
自我欺骗成本被假设为常数：理论模型未刻画异质性，未检验高自我形象关切个体的更强反应
样本以学生与MTurk为主：外部有效性有限，未在专业金融顾问、医生等真实专家中复制
单期博弈：未考察重复互动、声誉建立、客户反馈等长期机制对自我欺骗的影响
理由空间维度有限：仅操纵风险与公平两个维度，未系统检验如"信息复杂度"等其他理由维度

维度7：可拓展的研究方向

实地实验：在真实金融顾问、医生、律师中复制Before/After设计，检验外部有效性
激励规模的边界：当佣金从$1扩展到$100、$1000时，自我欺骗强度如何变化？是否存在临界点
重复博弈与学习：顾问能否随经验积累"学会"自我欺骗？亏损客户的反馈能否打破自我欺骗循环
神经/生理证据：脑成像或皮电反应能否识别"真信念"vs"策略性报告"的不同
群体影响：当多位顾问公开互动时，社会形象与自我形象如何相互作用
客户的反向适应：客户若知晓Before vs After操纵后，会如何调整对推荐的解读与跟随
结构估计：将Benabou (2015) 模型参数化估计，识别自我形象效用μ与自我欺骗成本c的相对重要性
干预设计与政策评估：测试制度性"先评估、后告知激励"流程在金融监管中的实际效果
跨文化比较：自我形象关切μ的文化差异（个人主义vs集体主义社会）如何调节效应
AI/算法顾问：当人类顾问被AI替代时，自我欺骗机制消失，但客户对算法的信任如何变化

关键结论

仅当顾问事先知道自己将获得佣金时，才会显著更频繁地推荐有利益冲突的选项A：RiskReturn从33%上升至61%、Dominance从25%上升至53%；此模式在ObviousDominance实验中完全消失（30% vs 29%）
自我欺骗的强度对"理由空间"的减少具有强非线性：从两个理由（风险+公平）到一个理由（仅公平）几乎不衰减，但从一个理由到零理由则完全崩溃，提示最小可辩护性即足以维持自我欺骗
信念测量与自我投资选择的溢出效应共同表明，Before组顾问确实持有扭曲信念，而非仅做策略性报告——自我欺骗改变了内在认知，因此推荐偏差不能仅靠透明披露来纠正

Gneezy_2020_BribingTheSelf