Motivated Self-Deception, Identity, and Unethical Behavior

元数据

作者: Uri Gneezy, Silvia Saccardo, Marta Serra-Garcia, Roel van Veldhuizen
年份: Working Paper
机构: UCSD, Carnegie Mellon University, WZB Berlin
JEL分类: D03, D83, C91
关键词: Unethical Behavior, Motivated Self-Deception, Laboratory Experiment, Self-Image

一句话总结

通过三个实验室sender-receiver建议博弈，操纵顾问"何时知道自己有$1佣金"的信息时序，证明利益冲突下的有偏建议主要源于判断形成过程中的动机性自我欺骗（而非事后合理化），且这种自我欺骗只要存在最小可辩护理由就持续存在，但当被推荐选项被严格支配时彻底消失。

研究问题

利益冲突下的有偏建议是"明知故犯"（knowingly distorting）还是"动机性自我欺骗"（在判断形成时无意识地扭曲）？
信息时序（先评估后知激励 vs 先知激励后评估）能否识别自我欺骗的存在？
自我欺骗对"主观判断空间"的依赖有多强？当弱支配/严格支配关系逐步移除可辩护理由时，自我欺骗如何变化？
这些机制是否可推广到非建议场景（如主观裁判中的贿赂）？

核心贡献

方法论创新：通过"心理评估不留可观察痕迹"的Before/After设计，识别自我欺骗发生在判断形成阶段而非事后合理化阶段；既不同于Babcock et al. (1995)（书面预先评估），也不同于Mazar et al. (2008)（客观作弊任务）
理由空间的渐次解构：三个实验从风险-收益权衡 → 弱支配 → 严格支配，系统识别自我欺骗的最小条件——只要存在任何微小可辩护理由（即使仅"坏状态相同"），自我欺骗就持续；只有完全严格支配才能消除
跨场景推广：附录的"扭曲选择博弈"（裁判+笑话+贿赂）将相同识别策略推广至主观裁判场景，证明自我欺骗机制在多种利益冲突情境中通用
政策含义：揭示透明披露不足以消除偏差，必须通过制度设计（先评估后知激励）或客观化标准来约束自我欺骗

维度1：实验设计分析

核心研究问题

当评估者在给出建议时面临利益冲突，他们的判断偏差是"明知故犯"（knowingly distorting），还是通过"动机性自我欺骗"（motivated self-deception）说服自己相信有偏的建议是合理的？信息时序——即评估者在做出私下判断之前还是之后才得知自身激励——如何影响自我欺骗的程度？

实验总览

本文包含三个实验室实验，均采用sender-receiver博弈框架。核心操纵均为"信息时序"（Before vs After），即顾问何时得知推荐特定选项的佣金激励。三个实验通过逐步改变投资选项之间的支配关系，系统性地增减自我欺骗的空间。

实验1：扭曲建议实验（Distorted Advice Experiment）

博弈框架

角色: 顾问（advisor，发送者）与客户（client，接收者）
任务: 顾问了解两个投资选项A和B的详情，向不知情的客户推荐其中一个
与经典sender-receiver博弈的区别: 顾问做出的是主观判断（推荐），而非报告客观信息状态

投资选项设计

选项	彩票结构	期望值	特征
投资A	50-50彩票，$2或$4	$3	低期望值，低方差
投资B	50-50彩票，$1或$7	$4	高期望值，高方差

A与B之间存在风险-收益权衡（risk-return tradeoff）：A更安全但期望值更低，B期望值更高但风险更大
自我欺骗的理由空间: 顾问可以说服自己"客户可能风险厌恶，所以推荐A对客户更好"，从而在推荐A获取佣金的同时维护道德自我形象

三个处理组

处理组	信息顺序	自我欺骗空间
Control（控制组）	看到投资选项 -> 推荐	无佣金激励，推荐A或B无额外报酬
Before（事前组）	得知$1佣金 -> 看到投资选项 -> 推荐	先知道激励再评估选项，自我欺骗空间最大
After（事后组）	看到投资选项 -> 得知$1佣金 -> 推荐	先在心中形成评估再知道激励，自我欺骗受约束

实验流程（4个屏幕）

屏幕1: 介绍角色（顾问）、$1固定参与费。Before组在此屏被告知推荐A可获额外$1佣金
屏幕2: 展示投资A和B的详情（彩票结构），要求顾问思考推荐。屏幕底部提示："请考虑你的推荐，准备好后进入下一页"
屏幕3: 提示顾问举手，研究助理送来纸条，用于手写推荐
屏幕4: 收到纸条后进入此屏，在纸上和屏幕上同时提交推荐。After组在此屏被告知佣金信息。Before组在此屏也会再次看到佣金信息（确保唯一差异是信息时序）

手写推荐: 格式为"I recommend you to choose Product (A or B) ___"，使推荐更具真实感
客户匹配: 每10个推荐中随机抽取1个传递给另一场次的真实客户。客户对A和B一无所知，仅收到推荐

实验执行

地点: 加州大学圣迭戈分校（UCSD）
时长: 1小时（包含其他不相关研究）
随机化: 在参与者层面随机分配到三个处理组
样本量: 324名顾问（Before 106人, After 110人, Control 108人），46%为女性，平均年龄21岁
客户跟随率: 84.8%的客户（28/33）遵循了顾问的推荐
复制实验: 另外招募311名顾问进行完全复制，结果更强（Before 60.2% vs After 34.7%，Z=3.826, p<0.01）

实验2：严格支配实验（Strict Dominance Experiment）

设计变化

唯一改变: 投资B变为50-50彩票，$5或$7（原为$1或$7）
投资A不变：50-50彩票，$2或$4
关键: B在每个状态下都严格优于A（低状态$5>$2，高状态$7>$4），B严格支配A
自我欺骗的理由空间: 被完全移除。顾问无法合理说服自己A对客户更好

处理组与流程

三个处理组（Control, Before, After）与实验1完全相同
仅改变投资B的彩票结构
样本量: 334名顾问（Control 113人, Before 109人, After 112人），54%为女性，平均年龄21岁
客户跟随率: 73.5%（25/34）

排除替代解释的逻辑

此实验同时检验了两个替代假说：

回避评估假说: 如果Before组被试跳过评估直接推荐被激励选项，则即使B严格支配A，Before组推荐A的比例仍应高于After组
一致性偏好假说: 如果After组被试因偏好一致性而坚持最初判断，则Before-After差异仍应存在

两个替代假说均预测Before > After，但实验结果显示Before = After，从而排除了替代解释

实验3：弱支配实验（Weak Dominance Experiment）

设计变化

投资B变为: 50-50彩票，$2或$6（介于实验1和实验2之间）
投资A不变：50-50彩票，$2或$4
支配关系: B弱支配A（低状态相同$2=$2，高状态$6>$4）
自我欺骗的理由空间: 部分存在。虽然B弱支配A，但如果顾问聚焦于"坏状态"（两者都是$2），或将自己的佣金$1与客户期望损失$1进行比较，仍可找到推荐A的理由

实验结果预期

竞争假说A: 弱支配与严格支配类似，限制自我欺骗 -> Before = After
竞争假说B: 只要存在任何微小理由，个体就能利用它进行自我欺骗 -> Before > After

样本量

300名顾问（Control 100人, Before 101人, After 99人）

维度2：理论模型

理论框架

本文未建立正式的数学模型，而是基于以下理论传统构建概念框架：

认知失调理论: Festinger (1957)
动机性推理: Kunda (1990); Lord, Ross & Lepper (1979)
自我欺骗: Gur & Sackeim (1979); Benabou & Tirole (2002); Bodner & Prelec (2003); Brocas & Carrillo (2008)

核心机制：动机性自我欺骗（Motivated Self-Deception）

定义: 个体持有两个相互矛盾的信念而不自知，且这种无意识是有动机的
机制: 当判断是主观的（存在模糊性），评估者可以在判断形成过程中无意识地（inadvertently）以自利方式形成推荐，同时维护自己的道德身份（identity）
与事后合理化的区别: 已有文献主要关注事后合理化（ex-post rationalization）——即在行为之后为其寻找理由。本文关注的是判断形成过程中的自我欺骗——即在评估和判断形成阶段就已经发生的偏差

识别策略

时序操纵（Before vs After）: 如果顾问在评估选项之前就知道激励（Before），她可以在评估过程中无意识地形成偏向被激励选项的判断。如果她先评估再知道激励（After），虽然仍可能推荐被激励选项，但她无法完全说服自己这是纯粹基于客户利益的判断
自我欺骗空间的系统性操纵: 通过三个实验逐步改变A和B之间的支配关系，当自我欺骗的所有理由被移除（严格支配），Before-After差异消失，证实了效应由自我欺骗驱动

自我形象的作用

自我形象成本: 扭曲判断以获取私利会带来自我形象成本（identity cost）
自我欺骗的功能: 允许个体在最大化物质利益的同时，维护"自己是道德的人"的身份认同
条件: 仅在判断具有主观性时才可能。当评判标准客观明确时，无法自我欺骗

维度3：核心发现

实验1（Distorted Advice）：推荐A的比例

处理组	推荐A比例	与After比较
Control	25.9%	--
Before	43.4%	+15.7pp（Z=2.481, p=0.013）
After	27.7%	基准

Before vs Control: +17.5pp（Z=2.687, p=0.007，显著）
After vs Control: +1.8pp（Z=0.225, p=0.822，不显著）
含义: $1佣金在事后告知时不显著扭曲判断；但在事前告知时显著增加推荐A的比例
Probit回归确认：Before处理的边际效应为+0.146***（SE=0.051）

性别差异

女性在Control组中更倾向推荐A（风险厌恶导致），Female系数 = +0.178***（SE=0.045）
Before效应对男性更强（p<0.001），对女性不显著（p=0.176）
但男女之间Before效应的差异不显著（p=0.319）

实验2（Strict Dominance）：推荐A的比例

处理组	推荐A比例	与After比较
Control	15.9%	--
Before	31.2%	+0.8pp（Z=0.1345, p=0.893，不显著）
After	30.4%	基准

Before vs After差异消失：边际效应仅为+0.008（SE=0.061，不显著）
Before vs Control: +15.3pp（Z=2.685, p=0.007）
After vs Control: +14.5pp（Z=2.567, p=0.010）
含义: 当B严格支配A时，信息时序不再影响推荐。激励仍增加推荐A的比例（相对于Control），但Before和After效应相同，支持"自我欺骗需要模糊空间"的假说
排除替代解释: 回避评估假说和一致性偏好假说均被排除

实验3（Weak Dominance）：推荐A的比例

处理组	推荐A比例	与After比较
Control	14.0%	--
Before	53.5%	+28.2pp（Z=4.081, p<0.01）
After	25.3%	基准

Before vs Control: +39.5pp（Z=5.913, p<0.01）
After vs Control: +11.3pp（Z=1.999, p=0.046）
含义: 即使B弱支配A，只要存在某个维度上的模糊性（如"坏状态"下两者相同），自我欺骗依然强劲且持续

跨实验比较：自我欺骗与理由空间的关系

实验	A与B关系	理由空间	Before-After差异
Distorted Advice	风险-收益权衡	最大	+15.7pp**
Weak Dominance	B弱支配A	中等	+28.2pp***
Strict Dominance	B严格支配A	零	+0.8pp（不显著）

核心发现: 自我欺骗是持续的（persistent）——只要存在任何微小的理由空间，个体就能利用它来偏向被激励选项。但当所有理由空间被完全移除（严格支配），自我欺骗彻底消失

附录实验：扭曲选择博弈（Distorted Choice Game）

不同场景: 两个工人完成主观任务（写笑话），裁判（referee）根据表现选出获胜者。工人可向裁判送钱
Before组: 裁判同时收到笑话和工人送的钱 -> 84%的情况下送钱最多的工人获胜（p=0.001），但最佳笑话仅56%获胜（不显著）
After组: 裁判先收到笑话，2分钟后收到钱 -> 送钱最多的工人仍73%获胜（p=0.003），但最佳笑话81%获胜（p<0.001，显著高于Before组的56%，MW检验p=0.027）
Objective组: 工人完成客观Stroop任务 -> 最佳表现者79%获胜（p<0.001），与After组类似
裁判评分与独立评审的相关性: Before组r=0.27, After组r=0.54 -> After组裁判的判断更接近无偏基准

维度6：与其他文献的关系

所属领域

行为经济学 / 实验经济学，聚焦于**动机性自我欺骗（motivated self-deception）**在利益冲突情境中的作用，交叉涉及道德心理学与身份经济学。

理论根基

认知失调与动机性推理: Freud (1933); Festinger (1957); Lord, Ross & Lepper (1979); Kunda (1990)
自我欺骗理论: Gur & Sackeim (1979); Benabou & Tirole (2002); Bodner & Prelec (2003); Brocas & Carrillo (2008); Mijovic-Prelec & Prelec (2010)
身份与自我形象: Bem (1972); Akerlof & Kranton (2000); Mazar, Amir & Ariely (2008)

关键贡献

区分自我欺骗与事后合理化: 已有实证研究（如Quattrone & Tversky, 1984）关注行为后的自利调整（ex-post rationalization），但缺乏对无意识性的证据。本文通过时序操纵，证明偏差发生在判断形成过程中（in the process of forming a judgment），而非事后
自我欺骗需要主观性: 当判断标准客观化（严格支配），自我欺骗消失。这与心理学中关于自我欺骗需要模糊性（vagueness）的发现一致（Sloman, Fernbach & Hagmayer, 2010）
自我欺骗的持续性: 即使仅存在最小理由空间（弱支配实验），自我欺骗仍然强劲，暗示完全消除偏差需要移除所有可能的自我辩护理由

与相关文献的对话

文献	关系
Babcock et al. (1995)	使用类似的before-after时序操纵研究谈判中的公平判断偏差。但其设计中被试在after处理中需提交书面评估，使初始判断不可忽视。本文中所有初始评估仅发生在顾问心中，更纯粹地识别自我欺骗
Quattrone & Tversky (1984)	冷水实验展示了与自我欺骗一致的行为，但缺乏"无意识性"的证据
Mazar et al. (2008); Shalvi et al. (2011, 2012)	研究作弊行为中的自我概念维护，但其中作弊对象是客观结果（如骰子点数），不留自我欺骗空间。本文利用主观判断创造自我欺骗空间
Cain, Loewenstein & Moore (2005, 2011)	研究利益冲突披露的反效果。本文提供互补证据：利益冲突中的偏差部分源于自我欺骗
Falk & Zimmermann (2015)	发现一致性偏好仅在书面表述时出现，心中形成的判断不受一致性约束。支持本文设计中心理评估不等同于承诺的假设

政策启示

信息时序干预: 让评估者在了解自身激励之前先评估选项，可显著减少有偏判断。例如，医生在看到患者保险信息之前先评估所需医疗程序
减少主观性: 制定更严格的事前评估标准，缩小主观判断空间，从而限制自我欺骗的余地
适用领域: 医疗（过度治疗）、金融（投资建议）、法律（法律咨询）、学术研究（预注册以减少p-hacking中的自我欺骗）
核心警示: 必须移除所有自我欺骗的理由空间，才能有效消除有偏判断；仅部分减少理由空间不足以降低偏差（弱支配实验的教训）

局限性

实验室场景中佣金仅$1，现实中利益冲突通常规模更大
未直接测量参与者的信念（无belief elicitation），对自我欺骗的推断基于行为模式
Before-After操纵同时改变了信息呈现顺序和评估过程，可能存在其他心理机制
弱支配实验中Before-After差异大于主实验（+28.2pp vs +15.7pp），原因未充分解释

维度4：变量概览

变量类别	变量名	定义/操作化
主处理变量	信息时序	Control（无激励）/ Before（先知$1佣金）/ After（后知$1佣金）
主因变量	推荐A比例	顾问最终是否推荐有佣金选项A（0/1）
操纵变量（实验1）	投资结构	A=$2/$4 (50-50)，B=$1/$7 (50-50)，存在风险-收益权衡
操纵变量（实验2）	投资结构	A=$2/$4，B=$5/$7，B严格支配A
操纵变量（实验3）	投资结构	A=$2/$4，B=$2/$6，B弱支配A
激励参数	佣金	推荐A时获得$1（基本参与费$1之外）
实施概率	客户匹配	每10个推荐随机抽1个传递给真实客户
控制变量	性别、年龄	平均年龄21岁，46-54%为女性
客户行为	跟随率	73.5%-84.8%客户遵循推荐
附录因变量	裁判选择正确率	主观笑话评判中最佳工人获胜的比例
附录因变量	评分相关性	裁判评分与独立评审的相关系数
样本规模	实验1	324名顾问（每组~108人）+ 复制实验311名
样本规模	实验2	334名顾问（每组~112人）
样本规模	实验3	300名顾问（每组~100人）

维度5：局限性

实验任务规模小：佣金仅$1，远低于真实金融顾问、医生面对的激励规模；高金额下自我欺骗的边界未知
未直接测量信念：缺乏belief elicitation，对"无意识性"的推断依赖行为模式与时序差异
学生样本：UCSD学生平均21岁，在专业顾问、医生中外部有效性有待验证
Before-After操纵的混淆：同时改变了信息时序与心理过程，可能存在锚定效应、注意力分配等其他机制
弱支配实验异常：Before-After差异（+28.2pp）大于主实验（+15.7pp），机制未充分解释——可能因弱支配创造了"专注坏状态"这一额外可辩护理由
单期决策：未考察重复互动、客户反馈、声誉机制下自我欺骗的动态演化
理由空间维度有限：仅操纵风险与公平，未系统检验信息复杂度、社会距离、群体身份等其他可能的理由维度
附录裁判实验复制性：扭曲选择博弈的样本量较小，需要进一步复制
理论模型缺失：未给出正式数学模型，无法结构化估计自我形象成本与自我欺骗成本的相对大小

维度7：可拓展的研究方向

现场实地实验：在真实金融顾问、保险经纪、医生中复制Before/After设计
激励规模异质性：当佣金从$1扩展到$100、$1000时自我欺骗强度的变化曲线
信念测量：使用激励性信念引出（如BDM机制）、神经成像（fMRI）或反应时数据识别"真信念"vs"策略性报告"
重复博弈与学习：长期客户关系下，亏损反馈能否打破自我欺骗
群体身份调节：当顾问与客户共享身份（同校、同族）时自我形象关切是否增强
干预设计：测试制度性"先评估再披露激励"流程在金融监管、医疗、研究伦理中的实际效果
预注册的自我欺骗机制：将本文框架应用于学术研究中的p-hacking与HARKing
AI建议时代：当算法替代人类顾问后，客户对"无自我欺骗"的算法信任如何变化
跨文化比较：自我形象关切的文化差异（个人主义vs集体主义）对自我欺骗的调节
结构估计：参数化Benabou-Tirole模型，识别自我形象效用与自我欺骗成本的分布
多人协作中的自我欺骗：团队决策中责任分散是否放大或缓解自我欺骗

关键结论

自我欺骗发生在判断形成过程中而非事后合理化：仅当顾问事先（Before）知道$1佣金时才显著推荐有利益冲突的选项A（实验1：43% vs 28%；实验3：54% vs 25%），事后（After）告知激励则与无激励的Control组无异
自我欺骗对"理由空间"具有强非线性依赖：风险-收益权衡（实验1）与弱支配（实验3）下Before-After差异均显著，但严格支配（实验2）下差异完全消失（31% vs 30%），证明只要存在最小可辩护理由，自我欺骗就持续；只有完全移除所有理由才能消除
该机制可推广至非建议场景——附录的裁判选择博弈中，事先看到贿赂的裁判判断与独立评审仅r=0.27，而事后看到的r=0.54，表明自我欺骗在主观裁判中同样作用，对反腐败、利益冲突披露等政策有重要含义

Gneezy_MotivatedSelfDeception_Identity

Motivated Self-Deception, Identity, and Unethical Behavior

元数据

一句话总结

研究问题

核心贡献

维度1：实验设计分析

核心研究问题

实验总览

实验1：扭曲建议实验（Distorted Advice Experiment）

博弈框架

投资选项设计

三个处理组

实验流程（4个屏幕）

实验执行

实验2：严格支配实验（Strict Dominance Experiment）

设计变化

处理组与流程

排除替代解释的逻辑

实验3：弱支配实验（Weak Dominance Experiment）

设计变化

实验结果预期

样本量

维度2：理论模型

理论框架

核心机制：动机性自我欺骗（Motivated Self-Deception）

识别策略

自我形象的作用

维度3：核心发现

实验1（Distorted Advice）：推荐A的比例

性别差异

实验2（Strict Dominance）：推荐A的比例

实验3（Weak Dominance）：推荐A的比例

跨实验比较：自我欺骗与理由空间的关系

附录实验：扭曲选择博弈（Distorted Choice Game）

维度6：与其他文献的关系

所属领域

理论根基

关键贡献

与相关文献的对话

政策启示

局限性

维度4：变量概览

维度5：局限性

维度7：可拓展的研究方向

标签

关键结论

🔗 链接到这篇笔记