Schilbach_Lectures_UtilityFromBeliefs
Utility from Beliefs
元数据
- 讲师: Frank Schilbach (MIT)
- 课程: 14.13 Psychology and Economics
- 类型: 课程讲义
- 主题: 信念效用(Belief-Based Utility)——人们从对未来状态的信念本身获得效用
- 关键词: anticipatory utility, belief-based utility, motivated beliefs, overconfidence, self-deception, optimal expectations
一句话总结
MIT 14.13 课程关于"信念效用"(belief-based utility)的核心讲义——系统讲解从 Loewenstein (1987) 的预期效用、Brunnermeier-Parker (2005) 最优预期,到 Benabou-Tirole (2002) 自我欺骗均衡和 Koszegi (2006) 自我形象效用的理论谱系,并结合过度自信、信息回避、非对称信念更新等实验证据。
研究问题
- 为什么人们会持有系统性偏离客观概率的信念(如过度自信、过度乐观)?
- 标准期望效用模型中信念仅作为决策工具(instrumental view),但若信念本身直接进入效用函数(hedonic view),行为预测如何改变?
- 如何在效用论框架中刻画自我欺骗、动机性推理、信息回避等现象,使其与理性选择理论兼容?
- 信念效用对金融决策(投资、交易、CEO并购)有何具体含义?
- 如果有偏信念能增加效用,纠正偏差是否改善福利?——信念效用对家长式干预(paternalism)的边界含义
核心贡献
作为课程讲义,本讲义的"贡献"在于整合性而非原创性:
- 理论谱系整合:将 Loewenstein-Caplin-Leahy 的预期效用、Brunnermeier-Parker 的最优预期、Benabou-Tirole 的自我欺骗均衡、Koszegi 的自我形象统一在"信念直接进入效用"的框架下
- 实证证据系统化:将驾驶过度自信(Svenson 1981)、鸵鸟效应(Karlsson-Loewenstein-Seppi 2009)、基因检测回避(Oster-Shoulson-Dorsey 2013)、非对称信念更新(Mobius et al. 2011)等实验证据归类到对应理论
- 金融市场应用:明确连接信念效用与过度交易(Barber-Odean)、CEO 并购(Malmendier-Tate)、外推预期(Greenwood-Shleifer)等金融现象
- 模型对比表格:提供贝叶斯偏差 vs 信念效用 vs 理性疏忽 vs 叙事经济学的清晰对比框架
- 教学价值:为研究者和学生提供进入"信念效用"研究领域的标准化路径与开放问题清单
维度1:实验设计分析
整体结构
本讲义围绕一个核心问题展开:人们为什么会持有系统性偏离理性的信念? 标准经济学假设信念仅是决策的工具(instrumental view),但行为经济学发现人们可能直接从信念中获得效用(hedonic view),从而产生自我欺骗、过度自信等现象。
主要板块
- 标准模型回顾 - 期望效用理论中信念的角色:信念是概率权重,不直接进入效用函数
- 预期效用(Anticipatory Utility) - Loewenstein (1987)、Caplin & Leahy (2001):等待结果期间,信念本身产生效用(如期待假期的快乐)
- 最优预期(Optimal Expectations) - Brunnermeier & Parker (2005):理性地选择有偏信念以最大化预期+决策效用之和
- 自我信号(Self-Signaling) - Bodner & Prelec (2003):行动被用作推断自身类型的信号
- 动机性推理(Motivated Reasoning) - Benabou & Tirole (2002, 2004, 2006):自我欺骗的均衡模型
- 过度自信(Overconfidence) - 实验证据与理论解释
- 实验证据总结 - 信念偏差的实验室和实地证据
核心动机
- 人们回避信息(information avoidance):HIV检测、基因检测、投资账户查看
- 人们选择性记忆(selective memory):更容易记住好消息
- 人们选择性注意(selective attention):更多关注与已有信念一致的信息
- 人们持续表现出过度自信:即使有反馈也不完全修正
这些现象在标准贝叶斯模型中无法解释,需要引入"信念直接影响效用"的假设。
维度2:理论模型
2.1 标准期望效用模型(基准)
其中 \pi(s) 是状态 s 的主观概率(信念),u(c(s)) 是状态 s 下消费的效用。信念 \pi 仅作为权重出现,不直接产生效用。
2.2 预期效用模型(Anticipatory Utility)
Loewenstein (1987) 提出人们在等待未来结果时从信念中获得流量效用(flow utility):
- \alpha > 0:预期的权重(反映人们多大程度上"提前享受"或"提前痛苦")
- 含义:乐观信念(高估好结果的概率)可以增加预期效用
2.3 Brunnermeier & Parker (2005) 最优预期模型
核心思想:agent 在 t=0 时选择主观信念 \hat{\pi} 来最大化总期望幸福感:
其中 c^*(s; \hat{\pi}) 是在有偏信念 \hat{\pi} 下做出的最优决策。
关键权衡:
- 收益:乐观信念增加 T-1 期的预期效用("感觉好")
- 成本:有偏信念导致次优决策,在真实概率下降低1期的决策效用("做错事")
- 当 T 较大时(等待期长),乐观偏差更大(如长期投资、职业选择)
核心结论:
- 最优信念一般偏向乐观(\hat{\pi}(\text{good state}) > \pi(\text{good state}))
- 风险越大(状态空间越分散),乐观偏差越大
- 在金融市场中可能导致过度交易和低分散化
2.4 Benabou & Tirole (2002) 自信即动机模型
设定:agent 有不确定的能力 \theta,需要决定是否在 t=1 投入努力 e。
- t=0:收到关于 \theta 的信号,可以选择性地"遗忘"(self-deception)
- t=1:基于记忆中的信息决定努力程度
- t=2:实现结果
效用函数:
$U = \theta \cdot e - C(e)$
自我欺骗的机制:t=0 的 self 通过选择性记忆(memory manipulation)来影响 t=1 的 self 的信念,从而影响其努力决策。
均衡结果:
- 存在部分遗忘的均衡:坏消息被以概率 \lambda < 1 遗忘
- 自我欺骗不是完全的——过度自信有限度
- 遗忘率 \lambda 取决于:(1) 信念对动机的重要性;(2) 遗忘的心理成本
核心洞见:
- 自我欺骗(self-deception)可以是理性的——它通过增强动机来改善表现
- 但也可能导致过度冒险和计划谬误
2.5 Koszegi (2006) 自我形象模型
效用同时取决于结果和关于自身类型的信念:
- \mu(\hat{\theta}):自我形象效用(ego utility),是关于自身能力信念的增函数
- 人们愿意付出代价来维持高自我评价
2.6 信息回避的理论基础
当信念直接产生效用时,信息可能具有负价值:
- 标准模型中信息价值非负(Blackwell定理)
- 有信念效用时,坏消息降低信念效用,可能使信息净价值为负
- 预测:人们更可能回避关于健康状况、投资表现等的负面信息
维度3:核心发现
3.1 预期效用的证据
- Loewenstein (1987) 电击实验:被试愿意多付钱来提前接受一次电击(而非等待一周),说明等待中的恐惧降低效用
- 购买体验 vs 消费体验:度假前的期待(anticipation)本身是效用的重要来源(Van Boven & Gilovich 2003)
3.2 过度自信的证据
- Svenson (1981):93%的美国司机认为自己驾驶技术在前50%——"above-average effect"
- 学术界:94%的教授认为自己的教学水平高于平均
- 投资者:过度自信的投资者交易更频繁,但收益更低(Barber & Odean 2001: "Boys Will Be Boys")
- 创业者:创业者对成功概率的主观估计远高于客观基准率(Camerer & Lovallo 1999)
3.3 选择性信息处理的证据
- Oster, Shoulson & Dorsey (2013):有亨廷顿舞蹈症家族风险的人中,仅约5%选择接受基因检测(尽管检测免费且准确)
- Karlsson, Loewenstein & Seppi (2009):投资者在市场下跌时更少查看投资组合——"鸵鸟效应"(ostrich effect)
- Mobius, Niederle, Niehaus & Rosenblat (2011):被试对好消息(关于自身IQ排名)更新更多,对坏消息更新更少——非对称信念更新
3.4 动机性推理的实验证据
- Kunda (1990) 综述:确立动机性推理(motivated reasoning)的心理学基础,人们的推理过程受到期望结论的方向性影响
- Zimmermann (2020):提供IQ测试反馈后,被试在获得正面反馈时提高对自身能力的评估,获得负面反馈时几乎不修正——信念更新的不对称性
- Exley & Kessler (2022):人们在有经济动机时更容易形成自利信念(self-serving beliefs)
3.5 自我欺骗的实验证据
- Mijovic-Prelec & Prelec (2010):被试在一项预测任务中,即使知道正确答案,也倾向于选择让自己"看起来"更有能力的答案——self-signaling
- Gneezy, Saccardo, Serra-Garcia & van Veldhuizen (2020) "Bribing the Self":被试在可以通过欺骗获利时,会说服自己错误答案是正确的
3.6 金融市场中的信念偏差
- Odean (1998):投资者持有亏损股票太久(处置效应),部分源于乐观信念
- Malmendier & Tate (2005):过度自信的CEO更可能过度投资、进行价值毁灭的并购
- Greenwood & Shleifer (2014):投资者期望与过去回报正相关(外推),与未来回报负相关
维度6:与其他文献的关系
在行为经济学课程体系中的位置
本讲义是 Schilbach 14.13 课程的核心模块之一,位于"非标准信念"(non-standard beliefs)部分。与课程其他模块的关系:
- 前置模块:期望效用理论、前景理论、时间偏好(为理解"标准 vs 行为"提供基准)
- 并行模块:概率判断偏差(probability judgment biases)——关注信念更新的认知错误
- 区别:概率判断偏差是"认知能力不足"导致的错误,信念效用是"动机驱动"的系统性偏差
- 后续模块:社会偏好、说服与叙事(persuasion and narratives)
核心文献谱系
理论奠基:
- Akerlof & Dickens (1982): 首次在经济学中正式讨论自我欺骗(cognitive dissonance)
- Loewenstein (1987): 预期效用(anticipatory utility)的形式化
- Caplin & Leahy (2001): 焦虑与信息回避的形式化模型
核心理论模型:
- Brunnermeier_2007_OptimalBeliefs_SkewedReturns: 最优预期模型在金融市场(偏斜收益资产)上的应用
- Benabou_2015_EconomicsMotivatedBeliefs: 动机性信念的经济学综述
- Benabou_Tirole_2016_MindfulEconomics_Beliefs: 信念作为效用来源的整合性框架
- Benabou_2011_Identity_Morals_BeliefsAsAssets: 信念作为"资产"——身份与道德维度
实证支持:
- Eil_Rao_2011_GoodNewsBadNews_AsymmetricProcessing: 关于外貌和智力的非对称信念更新
- Zimmermann_2020_DynamicsOfMotivatedBeliefs: 动机性信念的动态演化
- Coutts_2019_GoodNewsBadNews_BeliefUpdating: 好消息/坏消息更新的进一步检验
- Coutts_Gerhards_2024_SelfServingAttributionBias: 自利归因偏差的实验证据
- Kunda_1990_MotivatedReasoning: 动机性推理的心理学经典综述
金融应用:
- Barber_Odean_BoysWillBeBoys_Gender_Overconfidence: 过度自信与性别差异下的过度交易
- Malmendier_Tate_Overconfidence_EarlyLife: CEO过度自信的早期生活根源
- Daniel_Hirshleifer_2015_Overconfident_Returns_Trading: 过度自信投资者与资产价格
与其他理论框架的关系
| 框架 | 信念偏差来源 | 与信念效用的区别 |
|---|---|---|
| 贝叶斯更新偏差 | 认知局限(heuristics) | 非动机驱动,不涉及效用函数 |
| 信念效用 | 动机驱动(motivation) | 偏差有方向性(通常偏向乐观) |
| 理性疏忽 | 信息处理成本 | 不处理 ≠ 不想知道 |
| 叙事经济学 | 故事和框架影响信念 | 社会性机制 vs 个人内部机制 |
该领域的开放问题
- 信念效用 vs 认知偏差的区分:如何在实验中区分"不能正确更新"(cognitive)和"不想正确更新"(motivational)?
- 福利分析的困难:如果有偏信念增加效用,纠正偏差是否改善福利?——paternalism的边界
- 均衡效果:大量agent持有有偏信念时,市场均衡如何变化?
- 测量挑战:如何可靠地测量主观信念(beliefs elicitation)以区分真实信念与报告策略?
- 神经基础:动机性推理的神经科学机制仍不清楚
维度4:变量概览
作为讲义而非实证研究,本讲义所介绍模型涉及的核心变量/参数如下:
关键参数(理论模型)
| 符号 | 含义 | 出现的模型 |
|---|---|---|
| \pi(s) | 状态 s 的客观概率 | 标准EU模型 |
| \hat{\pi}(s) | 状态 s 的主观/有偏信念 | Brunnermeier-Parker, Benabou-Tirole |
| u(c) | 消费效用函数 | 全部 |
| \alpha | 预期效用权重(多大程度上"提前享受") | Loewenstein, Caplin-Leahy |
| T | 等待结果的期数 | Brunnermeier-Parker |
| \theta | 个体能力(不可观测) | Benabou-Tirole |
| e | 努力程度 | Benabou-Tirole |
| \lambda | 坏消息被遗忘的概率 | Benabou-Tirole |
| \mu(\hat{\theta}) | 自我形象效用函数 | Koszegi |
| C(e) | 努力成本 | Benabou-Tirole |
主要实证测量
- 过度自信:相对自评(如"自评驾驶技能在前X%")、绝对自信(如对智力测试得分的高估)
- 信息回避:基因检测/HIV检测接受率、投资账户查看频率、健康体检参与率
- 非对称更新:好消息更新量 vs 坏消息更新量的比值
- 预期效用:愿意支付以避免/提前结果的金额
维度5:局限性
作为讲义,本身不存在"研究局限",但讲义所综述领域的局限值得注意:
- 测量挑战:主观信念的可靠测量极为困难——报告策略、激励效应、问题措辞均可影响信念引出结果(参见 Danz-Vesterlund 2022 关于 BIC 引出方法的批评)
- 认知 vs 动机的区分困难:实验中难以严格区分"不能正确更新"(cognitive limitation)和"不想正确更新"(motivational distortion)
- 福利分析的悖论:若有偏信念增加效用但导致次优决策,规范性结论难以下达——纠偏可能"治好病但杀死病人"
- 均衡效果未充分研究:大量agent持有有偏信念时,市场均衡如何变化?讲义提到但未深入
- 文化与代际差异:信念效用模型的实证证据多来自WEIRD样本,跨文化推广性存疑
- 理论模型的多重均衡:Benabou-Tirole 类模型常存在多重均衡,实证识别哪一均衡被选中非常困难
- 神经基础不清:动机性推理、自我欺骗的神经机制尚未充分研究
- 讲义结构限制:作为本科生课程材料,未深入推导技术性证明(如最优预期问题的可解性条件、Benabou-Tirole 均衡的精炼)
维度7:可拓展的研究方向
-
信念效用与金融决策的精细化:
- 在受控实验中分别识别 anticipatory utility、ego utility、optimal expectations 各自对投资决策的贡献
- 研究散户投资者的"鸵鸟效应"是否随市场状态、个人财富水平变化
- 分析加密货币投资者的信念效用——高波动 + 强叙事是否放大信念效用作用?
-
信息回避的机制识别:
- 区分"焦虑回避"(Caplin-Leahy)vs"行为后果回避"(Karlsson-Loewenstein-Seppi)
- 测试纵向干预(如强制反馈)是否反而降低福利
-
群体层面的信念效用:
- 政治极化是否反映集体性信念效用?
- 阴谋论传播能否用 Benabou-Tirole 的群体自我欺骗模型解释?
-
AI/大语言模型与信念效用:
- LLM 是否会"奉承"用户从而强化其信念效用?
- 用 LLM 模拟实验被试,检验信念效用模型的预测
-
实地干预:
- 健康行为(HIV检测、癌症筛查)中的信息回避与去偏干预
- 退休账户查看频率干预对储蓄行为的影响
-
跨学科融合:
- 神经经济学:用 fMRI 定位信念效用相关脑区
- 心理学:将动机性推理(motivated reasoning)的具体心理机制(如 reasoning-based vs motivated processing)整合入经济模型
-
信念引出方法的改进:
- 设计抗策略性报告的引出机制(如 BSR、贝叶斯市场)
- 用脑成像或行为间接指标交叉验证报告信念
-
政策设计:
- 在养老金、医疗保险、教育投资等长期决策场景中,如何利用/对抗信念效用?
- 信念效用的"可纠正性"边界——何种干预既改善决策又不显著降低主观幸福感?
标签
#lecture_notes #belief_utility #anticipatory_utility #optimal_expectations #motivated_reasoning #self_deception #overconfidence #information_avoidance #Brunnermeier_Parker #Benabou_Tirole #Schilbach #behavioral_economics #psychology_economics
关键结论
- 核心范式转移:标准期望效用模型将信念视为决策工具(instrumental view),但行为经济学需要将信念视为直接产生效用的对象(hedonic view),才能解释信息回避、过度自信、自我欺骗等系统性现象
- 理论谱系成熟:Loewenstein(预期效用) → Caplin-Leahy(焦虑模型) → Brunnermeier-Parker(最优预期) → Benabou-Tirole(自我欺骗均衡) → Koszegi(自我形象) 构成了信念效用模型的完整谱系
- 关键权衡:所有信念效用模型的共同核心是 "感觉好"(belief utility) vs "做对事"(decision utility) 的权衡,决定了乐观偏差的最优幅度
- 方向性预测:信念效用模型预测偏差具有方向性(通常偏向乐观),区别于纯认知模型预测的无方向性噪声
- 实证证据丰富:从 Svenson 驾驶过度自信、Mobius 非对称更新到 Oster 基因检测回避、Karlsson-Loewenstein-Seppi 鸵鸟效应,多种现象都难以用纯贝叶斯模型解释
- 金融市场含义:过度交易、CEO 并购泡沫、外推预期、动量交易等多个金融"异象"可在信念效用框架下统一理解
- 福利分析的两难:若有偏信念增加效用,纯粹基于决策正确性的去偏干预可能降低福利——家长式干预的边界需重新审视
- 方法论挑战:可靠的信念引出仍是关键瓶颈,需结合直接报告、激励机制、行为间接指标和神经测量等多种手段