Eil_Rao_2011_GoodNewsBadNews_AsymmetricProcessing
The Good News-Bad News Effect: Asymmetric Processing of Objective Information about Yourself
Eil and Rao (2011), American Economic Journal: Microeconomics
Authors: David Eil, Justin M. Rao
Journal: American Economic Journal: Microeconomics, 3(2), 114-138
DOI: 10.1257/mic.3.2.114
JEL: D82, D83
一句话总结
通过对IQ和外貌(Beauty)排名的客观成对比较信号设计,证明人们对涉及自我形象的"好消息"接近贝叶斯式更新,但对"坏消息"系统性低估信号强度并产生更大噪声,且驱动这种不对称的是信号的效价(valence)而非是否确认先验(confirmation)。
研究问题
- 当信息涉及个人在意的自我特质(智力、外貌)时,人们是否会不对称地处理客观的好消息与坏消息?
- 这种信念更新的不对称性是由"确认偏差"(confirmation bias)驱动,还是由信号效价(valence)本身驱动?
- 不对称更新是否会延伸到信息获取阶段——即人们是否愿意付费去学习关于自我的真实信息?
核心贡献
- 方法论创新: 设计了基于真实排名的客观成对比较信号,使贝叶斯后验可被精确计算,同时分离了"确认性"与"效价"两个长期在CB实验中共线的维度。
- 实证发现: 首次干净地证明good news-bad news asymmetry — 好消息接近贝叶斯更新,坏消息显著低反应且噪声更大;中性Control条件无此模式,排除了纯认知偏差解释。
- 理论意义: 为payoff-based updating / ego utility理论(Benabou & Tirole 2002; Brunnermeier & Parker 2005; Koszegi 2006)提供了直接实验证据,说明信念本身进入效用函数。
- 重新诠释CB文献: 证明长期被解释为"确认偏差"的现象实际上是"乐观偏差"——驱动力是valence而非confirmation。
- WTP延伸: 证明信念更新偏差延伸至信息获取阶段,乐观信念者愿付费获知真相,悲观信念者需被补贴。
维度1:实验设计分析
核心研究问题
当信息涉及个人在意的特质(智力、外貌)时,人们是否会不对称地处理好消息与坏消息?
被试与地点
- 地点: UC San Diego 经济学实验室
- 被试来源: 在线数据库招募,4000+人
- 样本量: 150名被试(7场IQ session + 4场Beauty session),剔除7名后最终143名
- 每场人数: IQ session 每场10人;Beauty session 每场10男10女
- 平均报酬: $23.33,时长约1.5小时
实验任务详细流程
第一阶段:排名信息生成
- IQ条件: 被试完成25题的韦氏成人智力量表(WAIS)测试,涵盖逻辑、空间推理和语言推理。答对随机抽取的"支付题"可获$5奖励
- Beauty条件: 被试参加快速约会(speed dating),每人与5名异性进行4分钟面对面交谈(中间有隔板)。交谈后双方在友善度、吸引力、雄心三个维度上互评(1-10分)。5次约会的吸引力平均分作为beauty score
- 排名规则: IQ按测试分数排名1-10(1=最高);Beauty在同性别组内按吸引力评分排名1-10(1=最高)。平局抛硬币打破
第二阶段:信念更新任务(核心任务)
每个被试完成两个更新任务:一个image task(IQ或Beauty)和一个Control task,顺序随机
Control条件设计:
- 被试获得一个密封信封,内含随机分配的1-10数字(卡片排名),被告知该排名完全随机
信念引出(Round 0):
- 被试通过电脑界面(含滑块和自动调整的直方图)报告自己占据10个排名中每个排名的百分比概率
- 总概率必须加总为100%,否则不计入支付
- 这构成了先验信念(prior beliefs)
信号接收与更新(Round 1-3):
- 每轮中,被试的排名与一个随机抽取的匿名同场被试进行成对比较
- 比较结果为二元信号:"You are ranked higher"(好消息, s=1)或 "You are ranked lower"(坏消息, s=0)
- 比较对象不重复抽样(drawn without replacement),且比较是双向的(bilateral)
- 收到信号后,被试重新报告10个排名的概率分布
- 屏幕顶部始终显示完整的历史猜测和信号记录
支付机制:
- 采用激励相容的二次评分规则(Quadratic Scoring Rule, Selten 1998)
- 每轮猜测的支付范围为$0-$2
- 被试被告知"诚实报告概率能最大化平均收益"
第三阶段:信息获取意愿(WTP)
- 完成更新任务后,通过离散化的BDM机制(Becker-DeGroot-Marschak)引出被试学习真实排名的支付意愿
- 价格列表形式:15个选项,x从-$7.00到$7.00($1.00递增)
- 选项A:获得$x并学习真实排名
- 选项B:获得$0且不学习真实排名
- 随机抽取一个选项执行,激励相容
关键设计创新
- 信号的客观性: 信号基于真实排名的成对比较,信号生成过程完全透明客观,可精确计算贝叶斯后验
- 方向与确认性的分离: 好消息可以是确认性的也可以是否认性的(如认为自己排名靠后的人收到"higher"信号是否认先验但是好消息),这打破了以往CB实验中confirmation与valence完全共线的问题
- 中性对照组: Control条件使用随机数字排名,无ego utility,信息结构与image task完全相同
维度2:理论模型
核心理论框架:Payoff-Based Updating(基于效用的信念更新)
标准经济学假设信念仅通过影响决策来间接影响效用。Payoff-based updating模型(Benabou & Tirole 2002; Brunnermeier & Parker 2005; Koszegi 2006)将信念纳入效用函数,使信念本身产生直接效用(ego utility / belief-based utility)。
核心逻辑:
- 贝叶斯推断最大化信念的工具价值(instrumental value),忽略直接效用
- 从贝叶斯基准向乐观方向偏移:信念准确性的二阶损失 vs. 直接信念效用的一阶收益
- 偏好最大化导致信念更新偏向乐观方向
贝叶斯后验计算
给定被试在Round 0报告的先验分布 q_0(i),在收到信号 s_1 后,排名 i 的后验概率为:
其中 P(s_1 \mid i) 是在真实排名为 i 时收到信号 s_1 的概率(由比较对象的随机抽取决定)。
附录A证明: 即使被试有"priors over priors"(对先验的先验),只要Round 0报告的是真实信念期望,贝叶斯后验完全由 q_0 决定。
主回归模型
Table 1 - 后验信念水平分析:
- 若完美贝叶斯更新:\beta_1 = 1, \beta_2 = 0
- 若好消息下更陡的斜率(\beta_2 > 0):好消息更尊重信号强度
Table 2 - 逐轮变化分析:
- \Delta\mu_t:被试均值信念从 t-1 到 t 的变化
- \Delta\mu_{Bayes,t}:对应的贝叶斯基准变化
WTP模型(Table 3)
- \mu_{final}:最终轮均值信念
- \sigma_{final}:最终轮信念标准差
维度3:核心发现
发现1:好消息-坏消息效应(Good News-Bad News Effect)
后验信念水平(Table 1):
| 条件 | 好消息斜率 (\beta_1 + \beta_2) | 坏消息斜率 (\beta_1) | 交互项 \beta_2 | 显著性 |
|---|---|---|---|---|
| Beauty | 1.047 | 0.641 | 0.406*** | p<0.01 |
| IQ | 0.917 | 0.846 | 0.071 | n.s. |
| Control | 0.589 | 0.589 | -0.001 | n.s. |
R-squared差异(关键effect size):
- Beauty: 好消息 R^2 比坏消息高约60%(方差比检验 p = 0.0000)
- IQ: 好消息 R^2 比坏消息高约58%(方差比检验 p = 0.0000)
- Control: 无显著差异(p = 0.6139)
逐轮变化(Table 2):
| 条件 | 好消息斜率 | 坏消息斜率 | 交互项 |
|---|---|---|---|
| Beauty | 0.687 | 0.212 | 0.475* |
| IQ | 0.566 | 0.026 | 0.540*** |
| Control | 0.282 | 0.141 | 0.141 |
- 坏消息的斜率在Beauty和IQ中均与0不可区分 -- 被试对坏消息几乎不尊重信号强度
- 好消息斜率显著更陡,更接近45度线(完美贝叶斯基准)
残差噪声(Figure 4):
- 坏消息后的更新噪声远大于好消息(Beauty: p = 0.0000; IQ: p = 0.085)
- Control组无差异(p = 0.347)
发现2:信息获取的不对称性(WTP, Table 3)
| 条件 | Final Round \mu 系数 | Final Round \sigma 系数 |
|---|---|---|
| IQ | -0.325*** | 0.911** |
| Beauty | -0.206** | 0.917 |
| Control | 0.011 | 0.237 |
- 在image条件中,均值信念越靠近顶端(数值越小=排名越高),WTP越高
- 认为自己排名靠后(rank 6+)的被试需要补贴才愿意学习真实排名
- WTP函数对高排名凸、对低排名凹(Figure 5)
- Control条件中WTP不受信念或信号历史影响
发现3:确认偏差的真正驱动力是效价(Valence)而非确认性(Confirmation)
Table 4分析:
- 均值信念高于平均的被试(above avg):对好消息(disconfirming good news)过度反应(-0.14),对坏消息(confirming bad news)正常反应(0.00) -- 与CB预测相反
- 均值信念低于平均的被试(below avg):对坏消息(disconfirming bad news)过度反应(-0.13),对好消息(confirming good news)不显著低反应(-0.13)
- 核心结论: 驱动不对称更新的是信号的效价(好/坏),而非信号是否确认先验信念
发现4:先验信念的乐观程度
- Round 0均值信念:Beauty = 4.26, IQ = 5.24, Control = 5.36(5.5为无偏基准)
- 先验越乐观的被试,不对称更新越强
维度6:与其他文献的关系
所属领域
行为经济学 / 信念更新 / 信息处理偏差 / Ego utility
与经典文献的关系
理论基础:
- Benabou & Tirole (2002): 自信与个人动机模型,信念直接进入效用
- Brunnermeier & Parker (2005): 最优预期(optimal expectations),乐观偏差的理论基础
- Koszegi (2006): Ego utility模型,信念影响信息获取策略
- Rabin & Schrag (1999): 确认偏差的正式模型,将CB作为机械偏差建模
实验方法论先驱:
- Tversky & Kahneman (1974): 贝叶斯更新偏差的经典实验范式(使用中性数量)
- Grether (1980): 代表性启发式与基础率忽略的实验证据
直接对话的实验研究:
- Ertac (2006): 类似设计但使用更粗糙的信念引出(三分位),发现坏消息权重更大(与本文相反,但信号结构不同)
- Mobius et al. (2010): 类似设计使用噪声信号,发现保守主义和好消息不对称(与本文一致)
- Coutts (2019): 后续复制和扩展研究
本文对CB文献的贡献:
- 以往CB实验(Lord, Ross & Lepper 1979; Plous 1991)中,confirming信号总是好消息、disconfirming信号总是坏消息,二者完全共线
- 本文通过设计使confirmation和valence独立变化,证明CB的真正驱动力是valence而非confirmation本身
下游应用领域
- 资产定价: 解释盈余公告后漂移(PEAD)的不对称性(Bernard & Thomas 1989)
- 泡沫: 乐观状态下坏消息被忽视,泡沫更持久(Farmer 1999; Chauvin et al. 2009)
- 自利偏差: 谈判中双方过度自信导致僵局(Babcock & Loewenstein 1997)
- 医疗决策: 癌症和HIV患者过度乐观评估存活率(Weeks et al. 1998)
- 过度自信: 不对称更新+不对称信息搜索共同产生过度自信
研究局限
- 实验室中"坏消息"的严重程度有限(排名10人中最后),真实世界效应可能更强
- IQ条件中不对称效应弱于Beauty条件,可能因为大学生对智力有更多先验信息
- 二次评分规则仅对风险中性被试严格激励相容
- 样本量相对较小(每个条件约50-70人)
Tags: #belief_updating #good_news_bad_news #asymmetric_processing #ego_utility #confirmation_bias #overconfidence #information_acquisition #WTP #Bayesian_updating #lab_experiment #valence #payoff_based_updating
维度4:变量概览
自变量(信号特征)
- 信号类型: 二元成对比较结果 (s=1 高于对手,s=0 低于对手)
- 信号方向: 好消息 (s=1) vs 坏消息 (s=0)
- 信号确认性: 是否与先验 \mu_0 同方向(confirming vs disconfirming)
- 条件: Image task (IQ / Beauty) vs Control task (随机数字排名)
- 轮次: Round 1, 2, 3(累积信号数)
因变量
- 后验信念分布 q_t(i):每轮报告的10维概率分布
- 均值信念 \mu_t = \sum_i i \cdot q_t(i)
- 信念标准差 \sigma_t
- 后验更新幅度 \Delta\mu_t = \mu_t - \mu_{t-1}
- WTP:学习真实排名的支付意愿($-7至$7区间)
关键基准变量
- 贝叶斯后验均值 \mu_{Bayes,t}:根据被试自报先验 q_0 和信号历史精确计算
- 贝叶斯更新幅度 \Delta\mu_{Bayes,t}
控制/识别变量
- 被试个体FE(部分回归)
- 条件交互项:\mathbf{1}\{Image\}, \mathbf{1}\{All\ s=1\}
- 任务顺序(image first vs control first,随机化)
- 样本特征:性别(Beauty条件相关)
维度5:局限性
实验设计层面
- "坏消息"严重程度有限: 实验室中最差结果是10人中排名末位,真实世界(如失业、患病)的坏消息严重程度远超此,效应可能更强或诱发不同心理机制(防御反应等)
- IQ条件不对称效应弱于Beauty: 大学生对自己智力有较强先验和反复反馈,可能压缩了更新幅度;外貌反馈在日常生活中更稀缺,先验更不确定
- 二次评分规则的局限: QSR仅对风险中性被试严格激励相容;风险厌恶可能影响信念报告,且被试可能不完全理解此机制
- 样本量有限: 每条件约50-70人,亚组分析(如above/below avg)的统计功效较低
- 大学生样本: UCSD学生外部效度受限,对智力和外貌的关注度可能与一般人群不同
理论解释层面
- 无法完全识别机制: 不对称更新可能源于payoff-based updating、动机性遗忘、注意分配偏差等多种机制,本设计无法完全分离
- 先验测量假设: 假设Round 0报告即真实先验,但被试可能因策略性考虑或锚定效应扭曲报告
- 信号"客观性"的边界: 即使信号客观,被试可能怀疑实验者操纵或同场被试的能力分布
结果稳健性层面
- Beauty与IQ结果不完全一致: Beauty的不对称效应在Table 1水平回归中显著,IQ仅在Table 2变化回归中显著,提示效应可能依赖任务特性
- WTP的解释含糊: WTP不仅取决于信念更新偏差,也取决于风险偏好、好奇心、惊喜厌恶等
维度7:可拓展的研究方向
方向A:机制深化
- 神经经济学实验: 用fMRI/EEG识别处理好/坏消息时的脑区差异(情感系统vs认知系统),检验ego utility的神经基础
- 注意分配机制: 用眼动追踪测量被试对好/坏消息的注视时长与回看模式,检验"动机性注意"假说
- 遗忘动力学: 一周/一月后回访测量信念,检验坏消息是否被选择性遗忘(motivated forgetting)
方向B:异质性与边界
- 个人差异: 探究自尊、特质乐观、抑郁倾向、自恋人格等个人特质如何调节不对称程度
- 领域特异性: 在社交能力、道德品格、收入潜力等其他自我特质上检验外部效度
- 群体特征: 跨文化(东亚vs西方)、性别、年龄差异;老年人是否更不对称(自我增强动机更强)
方向C:政策与应用
- 金融决策: 投资者对自身投资能力的信念如何不对称更新?是否解释频繁交易和过度自信?参见 Coutts_Gerhards_2024_SelfServingAttributionBias
- 健康行为: 患者对疾病诊断结果的不对称处理如何影响治疗依从性
- 教育反馈: 学生对成绩反馈的不对称更新如何影响学习投入
方向D:理论扩展
- 多维信念: 自我特质往往是多维的(智力的子维度),不对称更新是否在维度间产生溢出(compensatory beliefs)
- 社会信念: 对群体(性别、种族)的信念是否也呈现valence不对称?参见 Enke_2020_WYSIATI_CorrelationNeglect
- 市场均衡: 在分散信息环境(金融市场)中,不对称更新如何影响价格形成与泡沫
- 结构估计: 用本文数据估计ego utility与Bayesian utility的相对权重,参见 Benabou_2015_EconomicsMotivatedBeliefs
方向E:复制与稳健性
- 大样本复制: 已由 Coutts_2019_GoodNewsBadNews_BeliefUpdating 与 Coutts_2019_TestingModels_BeliefBias 部分复制,但结论混合,需更多预注册研究
- 激励强度: 提高QSR支付以检验经济激励是否能消除不对称
- 真实Stakes: 用真实学业成绩(GPA)或工资作为信号,检验外部效度
关键结论
- 好消息-坏消息不对称是真实且稳健的现象: 在涉及自我形象的IQ和Beauty任务中,被试对好消息接近贝叶斯式更新(斜率接近1),对坏消息系统性低估信号强度(斜率接近0),且坏消息后的更新噪声远大于好消息;中性Control条件无此模式,排除纯认知偏差解释。
- 驱动力是效价而非确认性: 通过设计使confirmation与valence独立变化,证明长期被归因于"确认偏差"的现象实际由信号效价驱动——好消息(无论是否确认先验)被过度采信,坏消息(无论是否确认先验)被低估。
- 信念偏差延伸至信息获取: 乐观信念者愿付费学习真相(WTP正且大),悲观信念者需被补贴(WTP负),形成"不对称更新+不对称信息搜索"的双重过度自信机制,对资产定价、谈判、医疗决策等领域有重要启示。
🔗 链接到这篇笔记
- Amelio_2022_CognitiveUncertainty_Overconfidence
- Anticipatory_2024_Anticipatory_Anxiety_Wishful_Thinking
- Belief_2023_Belief_Based_Utility_Signal
- Camerer_1999_Overconfidence_ExcessEntry
- Coutts_Gerhards_2024_SelfServingAttributionBias
- Elliott_Hobson_White_2024_Asymmetric_Motivated_Reasoning
- Ellis_2022_MotivatedReasoning_EthicsOfBelief
- Enke_Graeber_2019_CognitiveUncertainty_WP
- GonzalezFernandez_2026_BeliefBiasIdentification
- Harrison_BeliefDistributions_BayesianOverconfidence
- Huck_Szech_2017_MoreEffort_LessPay_OptimisticBeliefs
- Jiao_Pownall_TasteBeliefValuation
- Mullainathan_2005_MarketForNews
- Prajaksilpthai_MotivatedBelief_Anxiety_Financial
- Schilbach_Lectures_UtilityFromBeliefs
- Thaler_GoodNews_MotivatedReasoning
- The_2024_Fake_News_Effect_Experimentally
- Zhu_SelfImage_MotivatedReasoning