The Good News-Bad News Effect: Asymmetric Processing of Objective Information about Yourself

Eil and Rao (2011), American Economic Journal: Microeconomics

Authors: David Eil, Justin M. Rao
Journal: American Economic Journal: Microeconomics, 3(2), 114-138
DOI: 10.1257/mic.3.2.114
JEL: D82, D83

一句话总结

通过对IQ和外貌（Beauty）排名的客观成对比较信号设计，证明人们对涉及自我形象的"好消息"接近贝叶斯式更新，但对"坏消息"系统性低估信号强度并产生更大噪声，且驱动这种不对称的是信号的效价（valence）而非是否确认先验（confirmation）。

研究问题

当信息涉及个人在意的自我特质（智力、外貌）时，人们是否会不对称地处理客观的好消息与坏消息？
这种信念更新的不对称性是由"确认偏差"（confirmation bias）驱动，还是由信号效价（valence）本身驱动？
不对称更新是否会延伸到信息获取阶段——即人们是否愿意付费去学习关于自我的真实信息？

核心贡献

方法论创新： 设计了基于真实排名的客观成对比较信号，使贝叶斯后验可被精确计算，同时分离了"确认性"与"效价"两个长期在CB实验中共线的维度。
实证发现： 首次干净地证明good news-bad news asymmetry — 好消息接近贝叶斯更新，坏消息显著低反应且噪声更大；中性Control条件无此模式，排除了纯认知偏差解释。
理论意义： 为payoff-based updating / ego utility理论（Benabou & Tirole 2002; Brunnermeier & Parker 2005; Koszegi 2006）提供了直接实验证据，说明信念本身进入效用函数。
重新诠释CB文献： 证明长期被解释为"确认偏差"的现象实际上是"乐观偏差"——驱动力是valence而非confirmation。
WTP延伸： 证明信念更新偏差延伸至信息获取阶段，乐观信念者愿付费获知真相，悲观信念者需被补贴。

维度1：实验设计分析

核心研究问题

当信息涉及个人在意的特质（智力、外貌）时，人们是否会不对称地处理好消息与坏消息？

被试与地点

地点： UC San Diego 经济学实验室
被试来源： 在线数据库招募，4000+人
样本量： 150名被试（7场IQ session + 4场Beauty session），剔除7名后最终143名
每场人数： IQ session 每场10人；Beauty session 每场10男10女
平均报酬： $23.33，时长约1.5小时

实验任务详细流程

第一阶段：排名信息生成

IQ条件： 被试完成25题的韦氏成人智力量表（WAIS）测试，涵盖逻辑、空间推理和语言推理。答对随机抽取的"支付题"可获$5奖励
Beauty条件： 被试参加快速约会（speed dating），每人与5名异性进行4分钟面对面交谈（中间有隔板）。交谈后双方在友善度、吸引力、雄心三个维度上互评（1-10分）。5次约会的吸引力平均分作为beauty score
排名规则： IQ按测试分数排名1-10（1=最高）；Beauty在同性别组内按吸引力评分排名1-10（1=最高）。平局抛硬币打破

第二阶段：信念更新任务（核心任务）

每个被试完成两个更新任务：一个image task（IQ或Beauty）和一个Control task，顺序随机

Control条件设计：

被试获得一个密封信封，内含随机分配的1-10数字（卡片排名），被告知该排名完全随机

信念引出（Round 0）：

被试通过电脑界面（含滑块和自动调整的直方图）报告自己占据10个排名中每个排名的百分比概率
总概率必须加总为100%，否则不计入支付
这构成了先验信念（prior beliefs）

信号接收与更新（Round 1-3）：

每轮中，被试的排名与一个随机抽取的匿名同场被试进行成对比较
比较结果为二元信号："You are ranked higher"（好消息, s=1）或 "You are ranked lower"（坏消息, s=0）
比较对象不重复抽样（drawn without replacement），且比较是双向的（bilateral）
收到信号后，被试重新报告10个排名的概率分布
屏幕顶部始终显示完整的历史猜测和信号记录

支付机制：

采用激励相容的二次评分规则（Quadratic Scoring Rule, Selten 1998）
每轮猜测的支付范围为$0-$2
被试被告知"诚实报告概率能最大化平均收益"

第三阶段：信息获取意愿（WTP）

完成更新任务后，通过离散化的BDM机制（Becker-DeGroot-Marschak）引出被试学习真实排名的支付意愿
价格列表形式：15个选项，x从-$7.00到$7.00（$1.00递增）
- 选项A：获得$x并学习真实排名
- 选项B：获得$0且不学习真实排名
随机抽取一个选项执行，激励相容

关键设计创新

信号的客观性： 信号基于真实排名的成对比较，信号生成过程完全透明客观，可精确计算贝叶斯后验
方向与确认性的分离： 好消息可以是确认性的也可以是否认性的（如认为自己排名靠后的人收到"higher"信号是否认先验但是好消息），这打破了以往CB实验中confirmation与valence完全共线的问题
中性对照组： Control条件使用随机数字排名，无ego utility，信息结构与image task完全相同

维度2：理论模型

核心理论框架：Payoff-Based Updating（基于效用的信念更新）

标准经济学假设信念仅通过影响决策来间接影响效用。Payoff-based updating模型（Benabou & Tirole 2002; Brunnermeier & Parker 2005; Koszegi 2006）将信念纳入效用函数，使信念本身产生直接效用（ego utility / belief-based utility）。

核心逻辑：

贝叶斯推断最大化信念的工具价值（instrumental value），忽略直接效用
从贝叶斯基准向乐观方向偏移：信念准确性的二阶损失 vs. 直接信念效用的一阶收益
偏好最大化导致信念更新偏向乐观方向

贝叶斯后验计算

给定被试在Round 0报告的先验分布 $q_0(i)$ ，在收到信号 $s_1$ 后，排名 $i$ 的后验概率为：

P(i \mid s_1) = \frac{P(s_1 \mid i) \cdot q_0(i)}{\sum_{j=1}^{10} P(s_1 \mid j) \cdot q_0(j)}

其中 $P(s_1 \mid i)$ 是在真实排名为 $i$ 时收到信号 $s_1$ 的概率（由比较对象的随机抽取决定）。

附录A证明： 即使被试有"priors over priors"（对先验的先验），只要Round 0报告的是真实信念期望，贝叶斯后验完全由 $q_0$ 决定。

主回归模型

Table 1 - 后验信念水平分析：

\mu_{subject} = \beta_0 + \beta_1 \cdot \mu_{Bayes} + \beta_2 \cdot \mu_{Bayes} \times \mathbf{1}\{All\ s=1\} + \beta_3 \cdot \mathbf{1}\{All\ s=1\} + \varepsilon

若完美贝叶斯更新： $\beta_1 = 1$ , $\beta_2 = 0$
若好消息下更陡的斜率（ $\beta_2 > 0$ ）：好消息更尊重信号强度

Table 2 - 逐轮变化分析：

\Delta\mu_t = \beta_0 + \beta_1 \cdot \Delta\mu_{Bayes,t} + \beta_2 \cdot \Delta\mu_{Bayes,t} \times \mathbf{1}\{s=1\} + \beta_3 \cdot \mathbf{1}\{s=1\} + \varepsilon

$\Delta\mu_t$ ：被试均值信念从 $t-1$ 到 $t$ 的变化
$\Delta\mu_{Bayes,t}$ ：对应的贝叶斯基准变化

WTP模型（Table 3）

WTP = \beta_0 + \beta_1 \cdot \mu_{final} + \beta_2 \cdot \sigma_{final} + \varepsilon

$\mu_{final}$ ：最终轮均值信念
$\sigma_{final}$ ：最终轮信念标准差

维度3：核心发现

发现1：好消息-坏消息效应（Good News-Bad News Effect）

后验信念水平（Table 1）：

条件	好消息斜率 ( $\beta_1 + \beta_2$ )	坏消息斜率 ( $\beta_1$ )	交互项 $\beta_2$	显著性
Beauty	1.047	0.641	0.406***	p<0.01
IQ	0.917	0.846	0.071	n.s.
Control	0.589	0.589	-0.001	n.s.

R-squared差异（关键effect size）：

Beauty： 好消息 $R^2$ 比坏消息高约60%（方差比检验 $p = 0.0000$ ）
IQ： 好消息 $R^2$ 比坏消息高约58%（方差比检验 $p = 0.0000$ ）
Control： 无显著差异（ $p = 0.6139$ ）

逐轮变化（Table 2）：

条件	好消息斜率	坏消息斜率	交互项
Beauty	0.687	0.212	0.475*
IQ	0.566	0.026	0.540***
Control	0.282	0.141	0.141

坏消息的斜率在Beauty和IQ中均与0不可区分 -- 被试对坏消息几乎不尊重信号强度
好消息斜率显著更陡，更接近45度线（完美贝叶斯基准）

残差噪声（Figure 4）：

坏消息后的更新噪声远大于好消息（Beauty: $p = 0.0000$ ; IQ: $p = 0.085$ ）
Control组无差异（ $p = 0.347$ ）

发现2：信息获取的不对称性（WTP, Table 3）

条件	Final Round $\mu$ 系数	Final Round $\sigma$ 系数
IQ	-0.325***	0.911**
Beauty	-0.206**	0.917
Control	0.011	0.237

在image条件中，均值信念越靠近顶端（数值越小=排名越高），WTP越高
认为自己排名靠后（rank 6+）的被试需要补贴才愿意学习真实排名
WTP函数对高排名凸、对低排名凹（Figure 5）
Control条件中WTP不受信念或信号历史影响

发现3：确认偏差的真正驱动力是效价（Valence）而非确认性（Confirmation）

Table 4分析：

均值信念高于平均的被试（above avg）：对好消息（disconfirming good news）过度反应（-0.14），对坏消息（confirming bad news）正常反应（0.00） -- 与CB预测相反
均值信念低于平均的被试（below avg）：对坏消息（disconfirming bad news）过度反应（-0.13），对好消息（confirming good news）不显著低反应（-0.13）
核心结论： 驱动不对称更新的是信号的效价（好/坏），而非信号是否确认先验信念

发现4：先验信念的乐观程度

Round 0均值信念：Beauty = 4.26, IQ = 5.24, Control = 5.36（5.5为无偏基准）
先验越乐观的被试，不对称更新越强

维度6：与其他文献的关系

所属领域

行为经济学 / 信念更新 / 信息处理偏差 / Ego utility

与经典文献的关系

理论基础：

Benabou & Tirole (2002): 自信与个人动机模型，信念直接进入效用
Brunnermeier & Parker (2005): 最优预期（optimal expectations），乐观偏差的理论基础
Koszegi (2006): Ego utility模型，信念影响信息获取策略
Rabin & Schrag (1999): 确认偏差的正式模型，将CB作为机械偏差建模

实验方法论先驱：

Tversky & Kahneman (1974): 贝叶斯更新偏差的经典实验范式（使用中性数量）
Grether (1980): 代表性启发式与基础率忽略的实验证据

直接对话的实验研究：

Ertac (2006): 类似设计但使用更粗糙的信念引出（三分位），发现坏消息权重更大（与本文相反，但信号结构不同）
Mobius et al. (2010): 类似设计使用噪声信号，发现保守主义和好消息不对称（与本文一致）
Coutts (2019): 后续复制和扩展研究

本文对CB文献的贡献：

以往CB实验（Lord, Ross & Lepper 1979; Plous 1991）中，confirming信号总是好消息、disconfirming信号总是坏消息，二者完全共线
本文通过设计使confirmation和valence独立变化，证明CB的真正驱动力是valence而非confirmation本身

下游应用领域

资产定价： 解释盈余公告后漂移（PEAD）的不对称性（Bernard & Thomas 1989）
泡沫： 乐观状态下坏消息被忽视，泡沫更持久（Farmer 1999; Chauvin et al. 2009）
自利偏差： 谈判中双方过度自信导致僵局（Babcock & Loewenstein 1997）
医疗决策： 癌症和HIV患者过度乐观评估存活率（Weeks et al. 1998）
过度自信： 不对称更新+不对称信息搜索共同产生过度自信

研究局限

实验室中"坏消息"的严重程度有限（排名10人中最后），真实世界效应可能更强
IQ条件中不对称效应弱于Beauty条件，可能因为大学生对智力有更多先验信息
二次评分规则仅对风险中性被试严格激励相容
样本量相对较小（每个条件约50-70人）

Tags: #belief_updating #good_news_bad_news #asymmetric_processing #ego_utility #confirmation_bias #overconfidence #information_acquisition #WTP #Bayesian_updating #lab_experiment #valence #payoff_based_updating

维度4：变量概览

自变量（信号特征）

信号类型： 二元成对比较结果 ( $s=1$ 高于对手， $s=0$ 低于对手)
信号方向： 好消息 (s=1) vs 坏消息 (s=0)
信号确认性： 是否与先验 $\mu_0$ 同方向（confirming vs disconfirming）
条件： Image task (IQ / Beauty) vs Control task (随机数字排名)
轮次： Round 1, 2, 3（累积信号数）

因变量

后验信念分布 $q_t(i)$ ：每轮报告的10维概率分布
均值信念 $\mu_t = \sum_i i \cdot q_t(i)$
信念标准差 $\sigma_t$
后验更新幅度 $\Delta\mu_t = \mu_t - \mu_{t-1}$
WTP：学习真实排名的支付意愿（$-7至$7区间）

关键基准变量

贝叶斯后验均值 $\mu_{Bayes,t}$ ：根据被试自报先验 $q_0$ 和信号历史精确计算
贝叶斯更新幅度 $\Delta\mu_{Bayes,t}$

控制/识别变量

被试个体FE（部分回归）
条件交互项： $\mathbf{1}\{Image\}$ , $\mathbf{1}\{All\ s=1\}$
任务顺序（image first vs control first，随机化）
样本特征：性别（Beauty条件相关）

维度5：局限性

实验设计层面

"坏消息"严重程度有限： 实验室中最差结果是10人中排名末位，真实世界（如失业、患病）的坏消息严重程度远超此，效应可能更强或诱发不同心理机制（防御反应等）
IQ条件不对称效应弱于Beauty： 大学生对自己智力有较强先验和反复反馈，可能压缩了更新幅度；外貌反馈在日常生活中更稀缺，先验更不确定
二次评分规则的局限： QSR仅对风险中性被试严格激励相容；风险厌恶可能影响信念报告，且被试可能不完全理解此机制
样本量有限： 每条件约50-70人，亚组分析（如above/below avg）的统计功效较低
大学生样本： UCSD学生外部效度受限，对智力和外貌的关注度可能与一般人群不同

理论解释层面

无法完全识别机制： 不对称更新可能源于payoff-based updating、动机性遗忘、注意分配偏差等多种机制，本设计无法完全分离
先验测量假设： 假设Round 0报告即真实先验，但被试可能因策略性考虑或锚定效应扭曲报告
信号"客观性"的边界： 即使信号客观，被试可能怀疑实验者操纵或同场被试的能力分布

结果稳健性层面

Beauty与IQ结果不完全一致： Beauty的不对称效应在Table 1水平回归中显著，IQ仅在Table 2变化回归中显著，提示效应可能依赖任务特性
WTP的解释含糊： WTP不仅取决于信念更新偏差，也取决于风险偏好、好奇心、惊喜厌恶等

维度7：可拓展的研究方向

方向A：机制深化

神经经济学实验： 用fMRI/EEG识别处理好/坏消息时的脑区差异（情感系统vs认知系统），检验ego utility的神经基础
注意分配机制： 用眼动追踪测量被试对好/坏消息的注视时长与回看模式，检验"动机性注意"假说
遗忘动力学： 一周/一月后回访测量信念，检验坏消息是否被选择性遗忘（motivated forgetting）

方向B：异质性与边界

个人差异： 探究自尊、特质乐观、抑郁倾向、自恋人格等个人特质如何调节不对称程度
领域特异性： 在社交能力、道德品格、收入潜力等其他自我特质上检验外部效度
群体特征： 跨文化（东亚vs西方）、性别、年龄差异；老年人是否更不对称（自我增强动机更强）

方向C：政策与应用

金融决策： 投资者对自身投资能力的信念如何不对称更新？是否解释频繁交易和过度自信？参见 Coutts_Gerhards_2024_SelfServingAttributionBias
健康行为： 患者对疾病诊断结果的不对称处理如何影响治疗依从性
教育反馈： 学生对成绩反馈的不对称更新如何影响学习投入

方向D：理论扩展

多维信念： 自我特质往往是多维的（智力的子维度），不对称更新是否在维度间产生溢出（compensatory beliefs）
社会信念： 对群体（性别、种族）的信念是否也呈现valence不对称？参见 Enke_2020_WYSIATI_CorrelationNeglect
市场均衡： 在分散信息环境（金融市场）中，不对称更新如何影响价格形成与泡沫
结构估计： 用本文数据估计ego utility与Bayesian utility的相对权重，参见 Benabou_2015_EconomicsMotivatedBeliefs

方向E：复制与稳健性

大样本复制： 已由 Coutts_2019_GoodNewsBadNews_BeliefUpdating 与 Coutts_2019_TestingModels_BeliefBias 部分复制，但结论混合，需更多预注册研究
激励强度： 提高QSR支付以检验经济激励是否能消除不对称
真实Stakes： 用真实学业成绩（GPA）或工资作为信号，检验外部效度

关键结论

好消息-坏消息不对称是真实且稳健的现象： 在涉及自我形象的IQ和Beauty任务中，被试对好消息接近贝叶斯式更新（斜率接近1），对坏消息系统性低估信号强度（斜率接近0），且坏消息后的更新噪声远大于好消息；中性Control条件无此模式，排除纯认知偏差解释。
驱动力是效价而非确认性： 通过设计使confirmation与valence独立变化，证明长期被归因于"确认偏差"的现象实际由信号效价驱动——好消息（无论是否确认先验）被过度采信，坏消息（无论是否确认先验）被低估。
信念偏差延伸至信息获取： 乐观信念者愿付费学习真相（WTP正且大），悲观信念者需被补贴（WTP负），形成"不对称更新+不对称信息搜索"的双重过度自信机制，对资产定价、谈判、医疗决策等领域有重要启示。

Eil_Rao_2011_GoodNewsBadNews_AsymmetricProcessing