Utility from Beliefs

元数据

讲师: Frank Schilbach (MIT)
课程: 14.13 Psychology and Economics
类型: 课程讲义
主题: 信念效用（Belief-Based Utility）——人们从对未来状态的信念本身获得效用
关键词: anticipatory utility, belief-based utility, motivated beliefs, overconfidence, self-deception, optimal expectations

一句话总结

MIT 14.13 课程关于"信念效用"(belief-based utility)的核心讲义——系统讲解从 Loewenstein (1987) 的预期效用、Brunnermeier-Parker (2005) 最优预期，到 Benabou-Tirole (2002) 自我欺骗均衡和 Koszegi (2006) 自我形象效用的理论谱系，并结合过度自信、信息回避、非对称信念更新等实验证据。

研究问题

为什么人们会持有系统性偏离客观概率的信念（如过度自信、过度乐观）？
标准期望效用模型中信念仅作为决策工具(instrumental view)，但若信念本身直接进入效用函数(hedonic view)，行为预测如何改变？
如何在效用论框架中刻画自我欺骗、动机性推理、信息回避等现象，使其与理性选择理论兼容？
信念效用对金融决策（投资、交易、CEO并购）有何具体含义？
如果有偏信念能增加效用，纠正偏差是否改善福利？——信念效用对家长式干预(paternalism)的边界含义

核心贡献

作为课程讲义，本讲义的"贡献"在于整合性而非原创性：

理论谱系整合：将 Loewenstein-Caplin-Leahy 的预期效用、Brunnermeier-Parker 的最优预期、Benabou-Tirole 的自我欺骗均衡、Koszegi 的自我形象统一在"信念直接进入效用"的框架下
实证证据系统化：将驾驶过度自信(Svenson 1981)、鸵鸟效应(Karlsson-Loewenstein-Seppi 2009)、基因检测回避(Oster-Shoulson-Dorsey 2013)、非对称信念更新(Mobius et al. 2011)等实验证据归类到对应理论
金融市场应用：明确连接信念效用与过度交易(Barber-Odean)、CEO 并购(Malmendier-Tate)、外推预期(Greenwood-Shleifer)等金融现象
模型对比表格：提供贝叶斯偏差 vs 信念效用 vs 理性疏忽 vs 叙事经济学的清晰对比框架
教学价值：为研究者和学生提供进入"信念效用"研究领域的标准化路径与开放问题清单

维度1：实验设计分析

整体结构

本讲义围绕一个核心问题展开：人们为什么会持有系统性偏离理性的信念？ 标准经济学假设信念仅是决策的工具（instrumental view），但行为经济学发现人们可能直接从信念中获得效用（hedonic view），从而产生自我欺骗、过度自信等现象。

主要板块

标准模型回顾 - 期望效用理论中信念的角色：信念是概率权重，不直接进入效用函数
预期效用（Anticipatory Utility） - Loewenstein (1987)、Caplin & Leahy (2001)：等待结果期间，信念本身产生效用（如期待假期的快乐）
最优预期（Optimal Expectations） - Brunnermeier & Parker (2005)：理性地选择有偏信念以最大化预期+决策效用之和
自我信号（Self-Signaling） - Bodner & Prelec (2003)：行动被用作推断自身类型的信号
动机性推理（Motivated Reasoning） - Benabou & Tirole (2002, 2004, 2006)：自我欺骗的均衡模型
过度自信（Overconfidence） - 实验证据与理论解释
实验证据总结 - 信念偏差的实验室和实地证据

核心动机

人们回避信息（information avoidance）：HIV检测、基因检测、投资账户查看
人们选择性记忆（selective memory）：更容易记住好消息
人们选择性注意（selective attention）：更多关注与已有信念一致的信息
人们持续表现出过度自信：即使有反馈也不完全修正

这些现象在标准贝叶斯模型中无法解释，需要引入"信念直接影响效用"的假设。

维度2：理论模型

2.1 标准期望效用模型（基准）

V = \sum_s \pi(s) \cdot u(c(s))

其中 $\pi(s)$ 是状态 s 的主观概率（信念）， $u(c(s))$ 是状态 s 下消费的效用。信念 $\pi$ 仅作为权重出现，不直接产生效用。

2.2 预期效用模型（Anticipatory Utility）

Loewenstein (1987) 提出人们在等待未来结果时从信念中获得流量效用（flow utility）：

U = \underbrace{\sum_s \pi(s) \cdot u(c(s))}_{\text{decision utility}} + \underbrace{\alpha \cdot \sum_s \pi(s) \cdot u(c(s))}_{\text{anticipatory utility}}

$\alpha > 0$ ：预期的权重（反映人们多大程度上"提前享受"或"提前痛苦"）
含义：乐观信念（高估好结果的概率）可以增加预期效用

2.3 Brunnermeier & Parker (2005) 最优预期模型

核心思想：agent 在 t=0 时选择主观信念 $\hat{\pi}$ 来最大化总期望幸福感：

\max_{\hat{\pi}} \underbrace{(T-1) \cdot \sum_s \hat{\pi}(s) \cdot u(c^*(s; \hat{\pi}))}_{\text{anticipatory utility (T-1 periods)}} + \underbrace{\sum_s \pi(s) \cdot u(c^*(s; \hat{\pi}))}_{\text{decision utility (1 period, true probs)}}

其中 $c^*(s; \hat{\pi})$ 是在有偏信念 $\hat{\pi}$ 下做出的最优决策。

关键权衡：

收益：乐观信念增加 T-1 期的预期效用（"感觉好"）
成本：有偏信念导致次优决策，在真实概率下降低1期的决策效用（"做错事"）
当 T 较大时（等待期长），乐观偏差更大（如长期投资、职业选择）

核心结论：

最优信念一般偏向乐观（ $\hat{\pi}(\text{good state}) > \pi(\text{good state})$ ）
风险越大（状态空间越分散），乐观偏差越大
在金融市场中可能导致过度交易和低分散化

2.4 Benabou & Tirole (2002) 自信即动机模型

设定：agent 有不确定的能力 $\theta$ ，需要决定是否在 t=1 投入努力 e。

t=0：收到关于 $\theta$ 的信号，可以选择性地"遗忘"（self-deception）
t=1：基于记忆中的信息决定努力程度
t=2：实现结果

效用函数：
$ $U = \theta \cdot e - C(e)$ $

自我欺骗的机制：t=0 的 self 通过选择性记忆（memory manipulation）来影响 t=1 的 self 的信念，从而影响其努力决策。

均衡结果：

存在部分遗忘的均衡：坏消息被以概率 $\lambda < 1$ 遗忘
自我欺骗不是完全的——过度自信有限度
遗忘率 $\lambda$ 取决于：(1) 信念对动机的重要性；(2) 遗忘的心理成本

核心洞见：

自我欺骗（self-deception）可以是理性的——它通过增强动机来改善表现
但也可能导致过度冒险和计划谬误

2.5 Koszegi (2006) 自我形象模型

效用同时取决于结果和关于自身类型的信念：

U = u(c) + \mu(\hat{\theta})

$\mu(\hat{\theta})$ ：自我形象效用（ego utility），是关于自身能力信念的增函数
人们愿意付出代价来维持高自我评价

2.6 信息回避的理论基础

当信念直接产生效用时，信息可能具有负价值：

\text{Value of Information} = \underbrace{\text{Decision Value}}_{\geq 0} + \underbrace{\text{Belief Utility Impact}}_{\lessgtr 0}

标准模型中信息价值非负（Blackwell定理）
有信念效用时，坏消息降低信念效用，可能使信息净价值为负
预测：人们更可能回避关于健康状况、投资表现等的负面信息

维度3：核心发现

3.1 预期效用的证据

Loewenstein (1987) 电击实验：被试愿意多付钱来提前接受一次电击（而非等待一周），说明等待中的恐惧降低效用
购买体验 vs 消费体验：度假前的期待（anticipation）本身是效用的重要来源（Van Boven & Gilovich 2003）

3.2 过度自信的证据

Svenson (1981)：93%的美国司机认为自己驾驶技术在前50%——"above-average effect"
学术界：94%的教授认为自己的教学水平高于平均
投资者：过度自信的投资者交易更频繁，但收益更低（Barber & Odean 2001: "Boys Will Be Boys"）
创业者：创业者对成功概率的主观估计远高于客观基准率（Camerer & Lovallo 1999）

3.3 选择性信息处理的证据

Oster, Shoulson & Dorsey (2013)：有亨廷顿舞蹈症家族风险的人中，仅约5%选择接受基因检测（尽管检测免费且准确）
Karlsson, Loewenstein & Seppi (2009)：投资者在市场下跌时更少查看投资组合——"鸵鸟效应"（ostrich effect）
Mobius, Niederle, Niehaus & Rosenblat (2011)：被试对好消息（关于自身IQ排名）更新更多，对坏消息更新更少——非对称信念更新

3.4 动机性推理的实验证据

Kunda (1990) 综述：确立动机性推理（motivated reasoning）的心理学基础，人们的推理过程受到期望结论的方向性影响
Zimmermann (2020)：提供IQ测试反馈后，被试在获得正面反馈时提高对自身能力的评估，获得负面反馈时几乎不修正——信念更新的不对称性
Exley & Kessler (2022)：人们在有经济动机时更容易形成自利信念（self-serving beliefs）

3.5 自我欺骗的实验证据

Mijovic-Prelec & Prelec (2010)：被试在一项预测任务中，即使知道正确答案，也倾向于选择让自己"看起来"更有能力的答案——self-signaling
Gneezy, Saccardo, Serra-Garcia & van Veldhuizen (2020) "Bribing the Self"：被试在可以通过欺骗获利时，会说服自己错误答案是正确的

3.6 金融市场中的信念偏差

Odean (1998)：投资者持有亏损股票太久（处置效应），部分源于乐观信念
Malmendier & Tate (2005)：过度自信的CEO更可能过度投资、进行价值毁灭的并购
Greenwood & Shleifer (2014)：投资者期望与过去回报正相关（外推），与未来回报负相关

维度6：与其他文献的关系

在行为经济学课程体系中的位置

本讲义是 Schilbach 14.13 课程的核心模块之一，位于"非标准信念"（non-standard beliefs）部分。与课程其他模块的关系：

前置模块：期望效用理论、前景理论、时间偏好（为理解"标准 vs 行为"提供基准）
并行模块：概率判断偏差（probability judgment biases）——关注信念更新的认知错误
区别：概率判断偏差是"认知能力不足"导致的错误，信念效用是"动机驱动"的系统性偏差
后续模块：社会偏好、说服与叙事（persuasion and narratives）

核心文献谱系

理论奠基：

Akerlof & Dickens (1982): 首次在经济学中正式讨论自我欺骗（cognitive dissonance）
Loewenstein (1987): 预期效用（anticipatory utility）的形式化
Caplin & Leahy (2001): 焦虑与信息回避的形式化模型

核心理论模型：

Brunnermeier_2007_OptimalBeliefs_SkewedReturns: 最优预期模型在金融市场（偏斜收益资产）上的应用
Benabou_2015_EconomicsMotivatedBeliefs: 动机性信念的经济学综述
Benabou_Tirole_2016_MindfulEconomics_Beliefs: 信念作为效用来源的整合性框架
Benabou_2011_Identity_Morals_BeliefsAsAssets: 信念作为"资产"——身份与道德维度

实证支持：

Eil_Rao_2011_GoodNewsBadNews_AsymmetricProcessing: 关于外貌和智力的非对称信念更新
Zimmermann_2020_DynamicsOfMotivatedBeliefs: 动机性信念的动态演化
Coutts_2019_GoodNewsBadNews_BeliefUpdating: 好消息/坏消息更新的进一步检验
Coutts_Gerhards_2024_SelfServingAttributionBias: 自利归因偏差的实验证据
Kunda_1990_MotivatedReasoning: 动机性推理的心理学经典综述

金融应用：

Barber_Odean_BoysWillBeBoys_Gender_Overconfidence: 过度自信与性别差异下的过度交易
Malmendier_Tate_Overconfidence_EarlyLife: CEO过度自信的早期生活根源
Daniel_Hirshleifer_2015_Overconfident_Returns_Trading: 过度自信投资者与资产价格

与其他理论框架的关系

框架	信念偏差来源	与信念效用的区别
贝叶斯更新偏差	认知局限（heuristics）	非动机驱动，不涉及效用函数
信念效用	动机驱动（motivation）	偏差有方向性（通常偏向乐观）
理性疏忽	信息处理成本	不处理 ≠ 不想知道
叙事经济学	故事和框架影响信念	社会性机制 vs 个人内部机制

该领域的开放问题

信念效用 vs 认知偏差的区分：如何在实验中区分"不能正确更新"（cognitive）和"不想正确更新"（motivational）？
福利分析的困难：如果有偏信念增加效用，纠正偏差是否改善福利？——paternalism的边界
均衡效果：大量agent持有有偏信念时，市场均衡如何变化？
测量挑战：如何可靠地测量主观信念（beliefs elicitation）以区分真实信念与报告策略？
神经基础：动机性推理的神经科学机制仍不清楚

维度4：变量概览

作为讲义而非实证研究，本讲义所介绍模型涉及的核心变量／参数如下：

关键参数（理论模型）

符号	含义	出现的模型
$\pi(s)$	状态 s 的客观概率	标准EU模型
$\hat{\pi}(s)$	状态 s 的主观/有偏信念	Brunnermeier-Parker, Benabou-Tirole
$u(c)$	消费效用函数	全部
$\alpha$	预期效用权重（多大程度上"提前享受"）	Loewenstein, Caplin-Leahy
$T$	等待结果的期数	Brunnermeier-Parker
$\theta$	个体能力（不可观测）	Benabou-Tirole
$e$	努力程度	Benabou-Tirole
$\lambda$	坏消息被遗忘的概率	Benabou-Tirole
$\mu(\hat{\theta})$	自我形象效用函数	Koszegi
$C(e)$	努力成本	Benabou-Tirole

主要实证测量

过度自信：相对自评（如"自评驾驶技能在前X%"）、绝对自信（如对智力测试得分的高估）
信息回避：基因检测/HIV检测接受率、投资账户查看频率、健康体检参与率
非对称更新：好消息更新量 vs 坏消息更新量的比值
预期效用：愿意支付以避免/提前结果的金额

维度5：局限性

作为讲义，本身不存在"研究局限"，但讲义所综述领域的局限值得注意：

测量挑战：主观信念的可靠测量极为困难——报告策略、激励效应、问题措辞均可影响信念引出结果（参见 Danz-Vesterlund 2022 关于 BIC 引出方法的批评）
认知 vs 动机的区分困难：实验中难以严格区分"不能正确更新"(cognitive limitation)和"不想正确更新"(motivational distortion)
福利分析的悖论：若有偏信念增加效用但导致次优决策，规范性结论难以下达——纠偏可能"治好病但杀死病人"
均衡效果未充分研究：大量agent持有有偏信念时，市场均衡如何变化？讲义提到但未深入
文化与代际差异：信念效用模型的实证证据多来自WEIRD样本，跨文化推广性存疑
理论模型的多重均衡：Benabou-Tirole 类模型常存在多重均衡，实证识别哪一均衡被选中非常困难
神经基础不清：动机性推理、自我欺骗的神经机制尚未充分研究
讲义结构限制：作为本科生课程材料，未深入推导技术性证明（如最优预期问题的可解性条件、Benabou-Tirole 均衡的精炼）

维度7：可拓展的研究方向

信念效用与金融决策的精细化：
- 在受控实验中分别识别 anticipatory utility、ego utility、optimal expectations 各自对投资决策的贡献
- 研究散户投资者的"鸵鸟效应"是否随市场状态、个人财富水平变化
- 分析加密货币投资者的信念效用——高波动 + 强叙事是否放大信念效用作用？
信息回避的机制识别：
- 区分"焦虑回避"（Caplin-Leahy）vs"行为后果回避"（Karlsson-Loewenstein-Seppi）
- 测试纵向干预（如强制反馈）是否反而降低福利
群体层面的信念效用：
- 政治极化是否反映集体性信念效用？
- 阴谋论传播能否用 Benabou-Tirole 的群体自我欺骗模型解释？
AI/大语言模型与信念效用：
- LLM 是否会"奉承"用户从而强化其信念效用？
- 用 LLM 模拟实验被试，检验信念效用模型的预测
实地干预：
- 健康行为（HIV检测、癌症筛查）中的信息回避与去偏干预
- 退休账户查看频率干预对储蓄行为的影响
跨学科融合：
- 神经经济学：用 fMRI 定位信念效用相关脑区
- 心理学：将动机性推理(motivated reasoning)的具体心理机制（如 reasoning-based vs motivated processing）整合入经济模型
信念引出方法的改进：
- 设计抗策略性报告的引出机制（如 BSR、贝叶斯市场）
- 用脑成像或行为间接指标交叉验证报告信念
政策设计：
- 在养老金、医疗保险、教育投资等长期决策场景中，如何利用/对抗信念效用？
- 信念效用的"可纠正性"边界——何种干预既改善决策又不显著降低主观幸福感？

关键结论

核心范式转移：标准期望效用模型将信念视为决策工具(instrumental view)，但行为经济学需要将信念视为直接产生效用的对象(hedonic view)，才能解释信息回避、过度自信、自我欺骗等系统性现象
理论谱系成熟：Loewenstein(预期效用) → Caplin-Leahy(焦虑模型) → Brunnermeier-Parker(最优预期) → Benabou-Tirole(自我欺骗均衡) → Koszegi(自我形象) 构成了信念效用模型的完整谱系
关键权衡：所有信念效用模型的共同核心是 "感觉好"(belief utility) vs "做对事"(decision utility) 的权衡，决定了乐观偏差的最优幅度
方向性预测：信念效用模型预测偏差具有方向性（通常偏向乐观），区别于纯认知模型预测的无方向性噪声
实证证据丰富：从 Svenson 驾驶过度自信、Mobius 非对称更新到 Oster 基因检测回避、Karlsson-Loewenstein-Seppi 鸵鸟效应，多种现象都难以用纯贝叶斯模型解释
金融市场含义：过度交易、CEO 并购泡沫、外推预期、动量交易等多个金融"异象"可在信念效用框架下统一理解
福利分析的两难：若有偏信念增加效用，纯粹基于决策正确性的去偏干预可能降低福利——家长式干预的边界需重新审视
方法论挑战：可靠的信念引出仍是关键瓶颈，需结合直接报告、激励机制、行为间接指标和神经测量等多种手段

Schilbach_Lectures_UtilityFromBeliefs