Schilbach_Lectures_UtilityFromBeliefs

更新于 2026/7/5

Utility from Beliefs

元数据

  • 讲师: Frank Schilbach (MIT)
  • 课程: 14.13 Psychology and Economics
  • 类型: 课程讲义
  • 主题: 信念效用(Belief-Based Utility)——人们从对未来状态的信念本身获得效用
  • 关键词: anticipatory utility, belief-based utility, motivated beliefs, overconfidence, self-deception, optimal expectations

一句话总结

MIT 14.13 课程关于"信念效用"(belief-based utility)的核心讲义——系统讲解从 Loewenstein (1987) 的预期效用、Brunnermeier-Parker (2005) 最优预期,到 Benabou-Tirole (2002) 自我欺骗均衡和 Koszegi (2006) 自我形象效用的理论谱系,并结合过度自信、信息回避、非对称信念更新等实验证据。

研究问题

  1. 为什么人们会持有系统性偏离客观概率的信念(如过度自信、过度乐观)?
  2. 标准期望效用模型中信念仅作为决策工具(instrumental view),但若信念本身直接进入效用函数(hedonic view),行为预测如何改变?
  3. 如何在效用论框架中刻画自我欺骗、动机性推理、信息回避等现象,使其与理性选择理论兼容?
  4. 信念效用对金融决策(投资、交易、CEO并购)有何具体含义?
  5. 如果有偏信念能增加效用,纠正偏差是否改善福利?——信念效用对家长式干预(paternalism)的边界含义

核心贡献

作为课程讲义,本讲义的"贡献"在于整合性而非原创性:

  1. 理论谱系整合:将 Loewenstein-Caplin-Leahy 的预期效用、Brunnermeier-Parker 的最优预期、Benabou-Tirole 的自我欺骗均衡、Koszegi 的自我形象统一在"信念直接进入效用"的框架下
  2. 实证证据系统化:将驾驶过度自信(Svenson 1981)、鸵鸟效应(Karlsson-Loewenstein-Seppi 2009)、基因检测回避(Oster-Shoulson-Dorsey 2013)、非对称信念更新(Mobius et al. 2011)等实验证据归类到对应理论
  3. 金融市场应用:明确连接信念效用与过度交易(Barber-Odean)、CEO 并购(Malmendier-Tate)、外推预期(Greenwood-Shleifer)等金融现象
  4. 模型对比表格:提供贝叶斯偏差 vs 信念效用 vs 理性疏忽 vs 叙事经济学的清晰对比框架
  5. 教学价值:为研究者和学生提供进入"信念效用"研究领域的标准化路径与开放问题清单

维度1:实验设计分析

整体结构

本讲义围绕一个核心问题展开:人们为什么会持有系统性偏离理性的信念? 标准经济学假设信念仅是决策的工具(instrumental view),但行为经济学发现人们可能直接从信念中获得效用(hedonic view),从而产生自我欺骗、过度自信等现象。

主要板块

  1. 标准模型回顾 - 期望效用理论中信念的角色:信念是概率权重,不直接进入效用函数
  2. 预期效用(Anticipatory Utility) - Loewenstein (1987)、Caplin & Leahy (2001):等待结果期间,信念本身产生效用(如期待假期的快乐)
  3. 最优预期(Optimal Expectations) - Brunnermeier & Parker (2005):理性地选择有偏信念以最大化预期+决策效用之和
  4. 自我信号(Self-Signaling) - Bodner & Prelec (2003):行动被用作推断自身类型的信号
  5. 动机性推理(Motivated Reasoning) - Benabou & Tirole (2002, 2004, 2006):自我欺骗的均衡模型
  6. 过度自信(Overconfidence) - 实验证据与理论解释
  7. 实验证据总结 - 信念偏差的实验室和实地证据

核心动机

  • 人们回避信息(information avoidance):HIV检测、基因检测、投资账户查看
  • 人们选择性记忆(selective memory):更容易记住好消息
  • 人们选择性注意(selective attention):更多关注与已有信念一致的信息
  • 人们持续表现出过度自信:即使有反馈也不完全修正

这些现象在标准贝叶斯模型中无法解释,需要引入"信念直接影响效用"的假设。


维度2:理论模型

2.1 标准期望效用模型(基准)

V = \sum_s \pi(s) \cdot u(c(s))

其中 \pi(s) 是状态 s 的主观概率(信念),u(c(s)) 是状态 s 下消费的效用。信念 \pi 仅作为权重出现,不直接产生效用

2.2 预期效用模型(Anticipatory Utility)

Loewenstein (1987) 提出人们在等待未来结果时从信念中获得流量效用(flow utility):

U = \underbrace{\sum_s \pi(s) \cdot u(c(s))}_{\text{decision utility}} + \underbrace{\alpha \cdot \sum_s \pi(s) \cdot u(c(s))}_{\text{anticipatory utility}}
  • \alpha > 0:预期的权重(反映人们多大程度上"提前享受"或"提前痛苦")
  • 含义:乐观信念(高估好结果的概率)可以增加预期效用

2.3 Brunnermeier & Parker (2005) 最优预期模型

核心思想:agent 在 t=0 时选择主观信念 \hat{\pi} 来最大化总期望幸福感:

\max_{\hat{\pi}} \underbrace{(T-1) \cdot \sum_s \hat{\pi}(s) \cdot u(c^*(s; \hat{\pi}))}_{\text{anticipatory utility (T-1 periods)}} + \underbrace{\sum_s \pi(s) \cdot u(c^*(s; \hat{\pi}))}_{\text{decision utility (1 period, true probs)}}

其中 c^*(s; \hat{\pi}) 是在有偏信念 \hat{\pi} 下做出的最优决策。

关键权衡

  • 收益:乐观信念增加 T-1 期的预期效用("感觉好")
  • 成本:有偏信念导致次优决策,在真实概率下降低1期的决策效用("做错事")
  • 当 T 较大时(等待期长),乐观偏差更大(如长期投资、职业选择)

核心结论

  1. 最优信念一般偏向乐观(\hat{\pi}(\text{good state}) > \pi(\text{good state})
  2. 风险越大(状态空间越分散),乐观偏差越大
  3. 在金融市场中可能导致过度交易和低分散化

2.4 Benabou & Tirole (2002) 自信即动机模型

设定:agent 有不确定的能力 \theta,需要决定是否在 t=1 投入努力 e。

  • t=0:收到关于 \theta 的信号,可以选择性地"遗忘"(self-deception)
  • t=1:基于记忆中的信息决定努力程度
  • t=2:实现结果

效用函数
$U = \theta \cdot e - C(e)$

自我欺骗的机制:t=0 的 self 通过选择性记忆(memory manipulation)来影响 t=1 的 self 的信念,从而影响其努力决策。

均衡结果

  • 存在部分遗忘的均衡:坏消息被以概率 \lambda < 1 遗忘
  • 自我欺骗不是完全的——过度自信有限度
  • 遗忘率 \lambda 取决于:(1) 信念对动机的重要性;(2) 遗忘的心理成本

核心洞见

  • 自我欺骗(self-deception)可以是理性的——它通过增强动机来改善表现
  • 但也可能导致过度冒险和计划谬误

2.5 Koszegi (2006) 自我形象模型

效用同时取决于结果和关于自身类型的信念:

U = u(c) + \mu(\hat{\theta})
  • \mu(\hat{\theta}):自我形象效用(ego utility),是关于自身能力信念的增函数
  • 人们愿意付出代价来维持高自我评价

2.6 信息回避的理论基础

当信念直接产生效用时,信息可能具有负价值

\text{Value of Information} = \underbrace{\text{Decision Value}}_{\geq 0} + \underbrace{\text{Belief Utility Impact}}_{\lessgtr 0}
  • 标准模型中信息价值非负(Blackwell定理)
  • 有信念效用时,坏消息降低信念效用,可能使信息净价值为负
  • 预测:人们更可能回避关于健康状况、投资表现等的负面信息

维度3:核心发现

3.1 预期效用的证据

  • Loewenstein (1987) 电击实验:被试愿意多付钱来提前接受一次电击(而非等待一周),说明等待中的恐惧降低效用
  • 购买体验 vs 消费体验:度假前的期待(anticipation)本身是效用的重要来源(Van Boven & Gilovich 2003)

3.2 过度自信的证据

  • Svenson (1981):93%的美国司机认为自己驾驶技术在前50%——"above-average effect"
  • 学术界:94%的教授认为自己的教学水平高于平均
  • 投资者:过度自信的投资者交易更频繁,但收益更低(Barber & Odean 2001: "Boys Will Be Boys")
  • 创业者:创业者对成功概率的主观估计远高于客观基准率(Camerer & Lovallo 1999)

3.3 选择性信息处理的证据

  • Oster, Shoulson & Dorsey (2013):有亨廷顿舞蹈症家族风险的人中,仅约5%选择接受基因检测(尽管检测免费且准确)
  • Karlsson, Loewenstein & Seppi (2009):投资者在市场下跌时更少查看投资组合——"鸵鸟效应"(ostrich effect)
  • Mobius, Niederle, Niehaus & Rosenblat (2011):被试对好消息(关于自身IQ排名)更新更多,对坏消息更新更少——非对称信念更新

3.4 动机性推理的实验证据

  • Kunda (1990) 综述:确立动机性推理(motivated reasoning)的心理学基础,人们的推理过程受到期望结论的方向性影响
  • Zimmermann (2020):提供IQ测试反馈后,被试在获得正面反馈时提高对自身能力的评估,获得负面反馈时几乎不修正——信念更新的不对称性
  • Exley & Kessler (2022):人们在有经济动机时更容易形成自利信念(self-serving beliefs)

3.5 自我欺骗的实验证据

  • Mijovic-Prelec & Prelec (2010):被试在一项预测任务中,即使知道正确答案,也倾向于选择让自己"看起来"更有能力的答案——self-signaling
  • Gneezy, Saccardo, Serra-Garcia & van Veldhuizen (2020) "Bribing the Self":被试在可以通过欺骗获利时,会说服自己错误答案是正确的

3.6 金融市场中的信念偏差

  • Odean (1998):投资者持有亏损股票太久(处置效应),部分源于乐观信念
  • Malmendier & Tate (2005):过度自信的CEO更可能过度投资、进行价值毁灭的并购
  • Greenwood & Shleifer (2014):投资者期望与过去回报正相关(外推),与未来回报负相关

维度6:与其他文献的关系

在行为经济学课程体系中的位置

本讲义是 Schilbach 14.13 课程的核心模块之一,位于"非标准信念"(non-standard beliefs)部分。与课程其他模块的关系:

  • 前置模块:期望效用理论、前景理论、时间偏好(为理解"标准 vs 行为"提供基准)
  • 并行模块:概率判断偏差(probability judgment biases)——关注信念更新的认知错误
  • 区别:概率判断偏差是"认知能力不足"导致的错误,信念效用是"动机驱动"的系统性偏差
  • 后续模块:社会偏好、说服与叙事(persuasion and narratives)

核心文献谱系

理论奠基

  • Akerlof & Dickens (1982): 首次在经济学中正式讨论自我欺骗(cognitive dissonance)
  • Loewenstein (1987): 预期效用(anticipatory utility)的形式化
  • Caplin & Leahy (2001): 焦虑与信息回避的形式化模型

核心理论模型

实证支持

金融应用

与其他理论框架的关系

框架 信念偏差来源 与信念效用的区别
贝叶斯更新偏差 认知局限(heuristics) 非动机驱动,不涉及效用函数
信念效用 动机驱动(motivation) 偏差有方向性(通常偏向乐观)
理性疏忽 信息处理成本 不处理 ≠ 不想知道
叙事经济学 故事和框架影响信念 社会性机制 vs 个人内部机制

该领域的开放问题

  1. 信念效用 vs 认知偏差的区分:如何在实验中区分"不能正确更新"(cognitive)和"不想正确更新"(motivational)?
  2. 福利分析的困难:如果有偏信念增加效用,纠正偏差是否改善福利?——paternalism的边界
  3. 均衡效果:大量agent持有有偏信念时,市场均衡如何变化?
  4. 测量挑战:如何可靠地测量主观信念(beliefs elicitation)以区分真实信念与报告策略?
  5. 神经基础:动机性推理的神经科学机制仍不清楚

维度4:变量概览

作为讲义而非实证研究,本讲义所介绍模型涉及的核心变量/参数如下:

关键参数(理论模型)

符号 含义 出现的模型
\pi(s) 状态 s 的客观概率 标准EU模型
\hat{\pi}(s) 状态 s 的主观/有偏信念 Brunnermeier-Parker, Benabou-Tirole
u(c) 消费效用函数 全部
\alpha 预期效用权重(多大程度上"提前享受") Loewenstein, Caplin-Leahy
T 等待结果的期数 Brunnermeier-Parker
\theta 个体能力(不可观测) Benabou-Tirole
e 努力程度 Benabou-Tirole
\lambda 坏消息被遗忘的概率 Benabou-Tirole
\mu(\hat{\theta}) 自我形象效用函数 Koszegi
C(e) 努力成本 Benabou-Tirole

主要实证测量

  • 过度自信:相对自评(如"自评驾驶技能在前X%")、绝对自信(如对智力测试得分的高估)
  • 信息回避:基因检测/HIV检测接受率、投资账户查看频率、健康体检参与率
  • 非对称更新:好消息更新量 vs 坏消息更新量的比值
  • 预期效用:愿意支付以避免/提前结果的金额

维度5:局限性

作为讲义,本身不存在"研究局限",但讲义所综述领域的局限值得注意:

  1. 测量挑战:主观信念的可靠测量极为困难——报告策略、激励效应、问题措辞均可影响信念引出结果(参见 Danz-Vesterlund 2022 关于 BIC 引出方法的批评)
  2. 认知 vs 动机的区分困难:实验中难以严格区分"不能正确更新"(cognitive limitation)和"不想正确更新"(motivational distortion)
  3. 福利分析的悖论:若有偏信念增加效用但导致次优决策,规范性结论难以下达——纠偏可能"治好病但杀死病人"
  4. 均衡效果未充分研究:大量agent持有有偏信念时,市场均衡如何变化?讲义提到但未深入
  5. 文化与代际差异:信念效用模型的实证证据多来自WEIRD样本,跨文化推广性存疑
  6. 理论模型的多重均衡:Benabou-Tirole 类模型常存在多重均衡,实证识别哪一均衡被选中非常困难
  7. 神经基础不清:动机性推理、自我欺骗的神经机制尚未充分研究
  8. 讲义结构限制:作为本科生课程材料,未深入推导技术性证明(如最优预期问题的可解性条件、Benabou-Tirole 均衡的精炼)

维度7:可拓展的研究方向

  1. 信念效用与金融决策的精细化

    • 在受控实验中分别识别 anticipatory utility、ego utility、optimal expectations 各自对投资决策的贡献
    • 研究散户投资者的"鸵鸟效应"是否随市场状态、个人财富水平变化
    • 分析加密货币投资者的信念效用——高波动 + 强叙事是否放大信念效用作用?
  2. 信息回避的机制识别

    • 区分"焦虑回避"(Caplin-Leahy)vs"行为后果回避"(Karlsson-Loewenstein-Seppi)
    • 测试纵向干预(如强制反馈)是否反而降低福利
  3. 群体层面的信念效用

    • 政治极化是否反映集体性信念效用?
    • 阴谋论传播能否用 Benabou-Tirole 的群体自我欺骗模型解释?
  4. AI/大语言模型与信念效用

    • LLM 是否会"奉承"用户从而强化其信念效用?
    • 用 LLM 模拟实验被试,检验信念效用模型的预测
  5. 实地干预

    • 健康行为(HIV检测、癌症筛查)中的信息回避与去偏干预
    • 退休账户查看频率干预对储蓄行为的影响
  6. 跨学科融合

    • 神经经济学:用 fMRI 定位信念效用相关脑区
    • 心理学:将动机性推理(motivated reasoning)的具体心理机制(如 reasoning-based vs motivated processing)整合入经济模型
  7. 信念引出方法的改进

    • 设计抗策略性报告的引出机制(如 BSR、贝叶斯市场)
    • 用脑成像或行为间接指标交叉验证报告信念
  8. 政策设计

    • 在养老金、医疗保险、教育投资等长期决策场景中,如何利用/对抗信念效用?
    • 信念效用的"可纠正性"边界——何种干预既改善决策又不显著降低主观幸福感?

标签

#lecture_notes #belief_utility #anticipatory_utility #optimal_expectations #motivated_reasoning #self_deception #overconfidence #information_avoidance #Brunnermeier_Parker #Benabou_Tirole #Schilbach #behavioral_economics #psychology_economics

关键结论

  1. 核心范式转移:标准期望效用模型将信念视为决策工具(instrumental view),但行为经济学需要将信念视为直接产生效用的对象(hedonic view),才能解释信息回避、过度自信、自我欺骗等系统性现象
  2. 理论谱系成熟:Loewenstein(预期效用) → Caplin-Leahy(焦虑模型) → Brunnermeier-Parker(最优预期) → Benabou-Tirole(自我欺骗均衡) → Koszegi(自我形象) 构成了信念效用模型的完整谱系
  3. 关键权衡:所有信念效用模型的共同核心是 "感觉好"(belief utility) vs "做对事"(decision utility) 的权衡,决定了乐观偏差的最优幅度
  4. 方向性预测:信念效用模型预测偏差具有方向性(通常偏向乐观),区别于纯认知模型预测的无方向性噪声
  5. 实证证据丰富:从 Svenson 驾驶过度自信、Mobius 非对称更新到 Oster 基因检测回避、Karlsson-Loewenstein-Seppi 鸵鸟效应,多种现象都难以用纯贝叶斯模型解释
  6. 金融市场含义:过度交易、CEO 并购泡沫、外推预期、动量交易等多个金融"异象"可在信念效用框架下统一理解
  7. 福利分析的两难:若有偏信念增加效用,纯粹基于决策正确性的去偏干预可能降低福利——家长式干预的边界需重新审视
  8. 方法论挑战:可靠的信念引出仍是关键瓶颈,需结合直接报告、激励机制、行为间接指标和神经测量等多种手段