Misinterpreting Yourself

元信息

作者: Paul Heidhues (DICE, University of Dusseldorf), Botond Koszegi (briq), Philipp Strack (Yale University)
年份: 2023 (January 16, 2023 working paper)
期刊/来源: Working Paper
关键词: misspecified learning, present bias, partial naivete, self-observation equilibrium, self-defeating beliefs, addiction-like behavior, apparent sophistication
论文类型: 纯理论论文

一句话总结

构建一般性"自我观察均衡"(Self-Observation Equilibrium, SOE)框架并将其应用于部分天真的现时偏好(partially naive present bias)，证明误自我认知会通过观察自身行为产生系统性误学习，导致自我挫败的福利损失、表面成熟性、以及类成瘾的消费动态。

研究问题

(1) 当agent对自己的偏好/动机有误认知(如部分天真的现时偏好者认为自己比实际更有自制力)时，他从自身行为中能学到什么？(2) 这种误学习的均衡是什么样的？是否会收敛？(3) 误学习对福利有何系统性影响——它是缓解还是加剧原始偏差？(4) 外部观察者(如计量经济学家)能否通过标准方法识别出agent的真实参数？(5) 这种机制能否解释现实中的成瘾式消费、信息干预的失效、以及看似成熟的agent持续过度消费等现象？

核心贡献

概念创新——SOE框架：提出"自我观察均衡"概念，为分析"对自身动机的误解如何通过自我观察产生系统性后果"提供通用工具。SOE是agent观察自己过去行为后不再修正基本面信念的稳定状态。
收敛性证明：在actions与beliefs互相依赖的复杂动态中证明信念几乎必然收敛到SOE(Proposition 1)，这在误指定学习文献中是重要技术突破。
自我挫败性一般结果：证明在等方向问题(equi-directional problems)中，任何类型的自我认知偏差都使agent的表现严格劣于正确指定的agent，即使按agent自己希望的偏好评估也是如此(Proposition 2)。
新型福利损失渠道：识别出部分天真通过误学习渠道产生无歧义的负面福利效应，与既有模型中模糊的福利效应形成鲜明对比。
表面成熟性(Apparent Sophistication)：证明外部观察者使用标准预测测试会错误地将有经验的天真agent判定为成熟agent(Proposition 5)，对实证文献的识别策略提出方法论挑战。
类成瘾动态：即使产品无生理成瘾性，误学习也能内生地产生消费递增、后向跨期互补性等类成瘾动态(Proposition 6)。
信息干预失效解释：信息干预(如健康警告)的长期效果被误学习削弱——agent短期减少消费，但逐渐重新学习"消费没那么有害"，消费回升(Corollary 1)。

维度1：模型设定

论文性质

本文是一篇纯理论论文，不包含实验。论文构建了一个关于"错误自我认知下的误导性学习"(misspecified learning about oneself)的一般性框架，并将其应用于部分天真的现时偏好(partially naive present bias)。

建模方法与核心机制

基本时序结构：

无穷期模型， $t = 1, 2, \ldots$
每期开始，agent观察一个随机冲击信号 $s_t = \Theta + \epsilon_t$ ，其中 $\Theta$ 为未知的时间不变基本面， $\epsilon_t$ 为均值为零的正态分布误差项
Agent选择行动 $a_t \in A$ 以最大化 $v(a_t, s_t, \Theta)$ 的期望
期后，agent只记得自己的行动 $a_t$ ，但不记得信号 $s_t$ ，也不观察已实现的效用

自我认知的两层局限：

有限记忆：agent在期后记住 $a_t$ 但忘记 $s_t$
错误的自我认知：agent认为自己一直在最大化 $\tilde{v}(a_t, s_t, \Theta)$ ，而非真实的 $v(a_t, s_t, \Theta)$ 。agent不会更新对 $\tilde{v}$ 的信念

推断与学习过程：

Agent利用过去行动 $a_t$ 作为关于冲击 $s_t$ 的证据（因为他认为自己按 $\tilde{v}$ 行事）
他据此使用贝叶斯法则更新对 $\Theta$ 的信念
由于自我认知错误，他从自身行为中推断出的信号 $\tilde{s}_t$ 与真实信号 $s_t$ 存在系统性偏差

现时偏好应用的具体设定：

真实决策效用： $v(a_t, s_t, \Theta) = u(a_t) + \phi_t a_t - \beta \kappa a_t$ ，其中 $\phi_t = l\Theta + (1-l)s_t$
感知效用： $\tilde{v}(a_t, s_t, \Theta) = u(a_t) + \phi_t a_t - \tilde{\beta}\kappa a_t$
$\beta < 1$ 为真实贴现因子， $\tilde{\beta} > \beta$ 为感知贴现因子（部分天真）
$\kappa > 0$ 表示有害消费， $\kappa < 0$ 表示有益活动

维度2：主要结果

基准理论

现时偏好(present bias)：O'Donoghue and Rabin (1999)的 $\beta$ - $\delta$ 模型
部分天真(partial naivete)：O'Donoghue and Rabin (2001)，agent认为自己的贴现因子为 $\tilde{\beta} \in (\beta, 1]$
误指定学习(misspecified learning)：Esponda and Pouzo (2016)的Berk-Nash均衡框架

行为偏差的形式化

定义1：自我观察均衡 (Self-Observation Equilibrium, SOE)

基本面 $\tilde{\theta}$ 是给定真实 $\Theta$ 的SOE，当且仅当：

\tilde{\theta} = \arg\max_z \int \log f\left(\tilde{\pi}_{\tilde{\theta}}^{-1}\left(\pi_{\tilde{\theta}}(\Theta + \epsilon)\right) - z\right) f(\epsilon) d\epsilon

其中 $\pi_\theta(s)$ 和 $\tilde{\pi}_\theta(s)$ 分别为真实和感知的最优策略函数。

直觉：SOE是一个稳定信念，在该信念下agent观察自己的行为后不会改变对基本面的看法。

观察1（完美解释SOE）： 如果对所有 $\epsilon$ 有
$ $\pi_{\tilde{\theta}}(\Theta + \epsilon) = \tilde{\pi}_{\tilde{\theta}}(\tilde{\theta} + \epsilon)$ $
则 $\tilde{\theta}$ 是SOE。此时agent完美预测自己的行为分布。

定义2：等方向问题 (Equi-Directional Problem)

如果 $v$ 和 $\tilde{v}$ 在 $(a, \theta)$ 和 $(a, s)$ 上均为超模或均为次模，则称该问题为等方向的。

定义3：自我挫败的自我认知 (Self-Defeating Self-View)

Agent的自我认知是自我挫败的，如果对任意 $\Theta$ 、对应的SOE $\tilde{\theta}$ 和任意信号 $s$ ：
$ $\tilde{v}(\pi_{\tilde{\theta}}(s), s, \Theta) < \tilde{v}(\pi_\Theta(s), s, \Theta)$ $

即：即使按照agent希望拥有的偏好 $\tilde{v}$ 来评估，误指定agent的表现也严格劣于正确指定的agent。

关键假设

Assumption 1：对所有行动序列和由此产生的后验信念，真实和感知策略函数在 $s_t$ 上均严格单调（保证可逆性）
Assumption 2：存在常数 $k > 0$ ，使得agent感知信号与真实信号之差有界： $|\pi_{\mu_t}^{-1}(a) - \tilde{\pi}_{\mu_t}^{-1}(a)| \leq k$
Assumption 3：最优行动的收敛性近似条件（技术性假设，确保信念收敛）
$v$ 和 $\tilde{v}$ 关于 $a_t$ 二次可微且单峰
正态分布假设（ $\Theta$ 和 $\epsilon_t$ 均为正态）

核心命题与推论

Proposition 1（SOE存在性与收敛性）： SOE存在。如果SOE的个数有限，则agent的信念 $(\mu_t)_t$ 几乎必然收敛到某个SOE。

Proposition 2（等方向问题中自我挫败性）： 对任何等方向问题，若 $v$ 和 $\tilde{v}$ 对所有 $s$ 和 $\theta$ 导致不同的最优行动，则agent的自我认知是自我挫败的。

Proposition 3（现时偏好下的唯一SOE）： Agent的信念几乎必然收敛到唯一SOE：
$ $\tilde{\theta} = \Theta + \frac{\tilde{\beta} - \beta}{1 - l} \kappa$ $

在SOE处，agent选择的消费满足：
$ $\frac{\partial v(a_t, s_t, \Theta)}{\partial a_t} = u'(a_t) + l\Theta + (1-l)s_t - \beta\kappa = -\frac{l(\tilde{\beta} - \beta)}{1-l}\kappa$ $

Proposition 4（关于未来伤害的信念）： 当效用函数为乘法形式（ $v = u(a_t) - \beta e^{\phi_t} a_t$ ）时，唯一SOE为：
$ $\tilde{\theta} = \Theta - \frac{\ln\tilde{\beta} - \ln\beta}{1-l}$ $

Agent低估消费的未来伤害。

Proposition 5（表面成熟性）： 外部观察者不会拒绝其错误模型：(i) 对新手agent正确估计 $\beta$ 和 $\tilde{\beta}$ ；(ii) 对有经验agent估计出 $\tilde{\beta}$ ，但错误推断agent是成熟的（ $\beta = \tilde{\beta}$ ）。

Proposition 6（成瘾式行为动态）： 假设 $\tilde{\beta} > \beta$ ：

I. 当前消费对过去消费的敏感度随时间递减但始终为正（后向跨期互补性）
II. 从 $t \geq 2$ 开始，agent总是高估状态并过度消费，过度消费量在 $\kappa$ 上严格递增
III. Agent的事前预期消费在 $t$ 上严格递增（消费路径上升），但agent自己预期消费恒定

Corollary 1（对新信息的非对称反应）： Agent对伤害 $\kappa$ 增加的短期反应大于长期（SOE）反应。信息干预的效果被误学习部分抵消。

维度3：数值分析与校准

主要理论结果

自我挫败的天真：在等方向问题中，部分天真总是福利递减的。Agent通过误学习加剧了原本的行为偏差。这是一种新型伤害机制：与既有文献中天真通过跨期行为互依影响当期行为不同，本文的机制是天真导致对瞬时效用函数的错误推断。
完美预测但仍然次优：在稳定环境中，agent最终可以完美预测自己的行为（SOE满足条件2），但他既不理解自己，行为也不是最优的。他始终表现得比成熟agent更偏向现时。
对环境变化的系统性误判：
- agent高估自己对未来激励变化的响应（因为高估自己对未来的权重）
- 在新环境中重新开始误预测（学习不可迁移）
- 预测在新节食中会表现更好，但实际不会
信念的跨领域相关性：在人群中，不同程度天真的agents会同时持有多种逻辑上不相关但事实上正相关的错误信念（如"吸烟有助社交"和"其他活动同样有害"）
表面成熟性：外部观察者使用标准预测测试会错误地将有经验的天真agent判定为成熟agent，导致过于乐观的政策结论

比较静态

$\tilde{\beta}$ 越高（越天真），SOE中 $\tilde{\theta}$ 偏离 $\Theta$ 越大，过度消费越严重
$\kappa$ 越大（产品越有害），误推断和过度消费越严重
$l$ 越大（基本面权重越大），误推断的"杠杆"越小
消费路径随时间上升（ $\mathbb{E}_{\mu_1}[a_t]$ 在 $t$ 上递增），上升速度在 $\kappa$ 上递增

Welfare分析

在等方向问题中，天真总是福利递减的（无论按 $v$ 还是 $\tilde{v}$ 评估）
与既有模型对比：既有模型中天真的福利效应可正可负（取决于跨期互依），本文的误学习渠道产生无歧义的负面福利效应
信息干预（如健康警告）的长期效果被误学习削弱：agent短期减少消费，但逐渐形成"消费没那么有害"的信念，消费回升
在非等方向问题（如工作分配）中，天真可能反而有益：agent可能表现得像时间一致且正确学习了基本面

维度5：与其他文献的关系

领域位置

本文处于行为经济学理论与误指定学习(misspecified learning)文献的交叉点，具体属于：

现时偏好与天真性(present bias and naivete)理论
误指定贝叶斯学习模型
自我认知与自我信号传递

核心对话论文

论文	对话关系
O'Donoghue and Rabin (1999, 2001)	基准的现时偏好与部分天真模型；本文在此基础上加入误学习
Esponda and Pouzo (2016)	Berk-Nash均衡框架；SOE改编自此概念
Heidhues, Koszegi, and Strack (2018)	同作者前作，研究误指定学习下的不切实际预期；本文是不同设定（从行动而非产出中推断）
Allcott et al. (2022)	发薪日贷款实证，本文论证其发现更符合误学习模型而非正确指定学习
Becker and Murphy (1988)	理性成瘾模型；本文的成瘾式动态机制不同（信念驱动而非生理驱动）
Bernheim and Rangel (2004)	提示触发的成瘾模型；外生假设过度消费，本文从基本面内生推导
Frick, Iijima, and Ishii (2020, 2021)	误指定社会学习；技术上最接近但模型和问题不同
Fudenberg, Lanzani, and Strack (2021)	内生误指定学习的极限点；收敛性证明的技术对比
Le Yaouanq and Schwardmann (2022)	关于自我认知学习的实验室实验；本文提供替代解释
Haggag et al. (2018)	消费者选择中的归因偏差实证；支持误学习假说

新贡献

一般性框架：提出自我观察均衡(SOE)概念，为分析"对自身动机的误解如何通过学习产生系统性后果"提供通用工具
收敛性证明：在actions与beliefs互相依赖的复杂动态中证明信念收敛到SOE，这在误指定学习文献中是一个重要的技术突破
自我挫败性的一般结果：证明在等方向问题中，任何类型的自我认知偏差都是自我挫败的
部分天真的新型福利损失：识别出天真通过误学习渠道产生的无歧义负面福利效应，与既有模型中模糊的福利效应形成对比
表面成熟性概念：揭示标准预测测试可能系统性地错误识别agent的成熟度，对实证文献有重要方法论含义
非成瘾产品的成瘾式行为：即使产品无生理成瘾性，误学习也能产生消费递增、后向互补性等类成瘾动态
对新信息的反直觉反应：短期反应大于长期反应（与跨期互补性模型的预测相反）

维度4：局限性

纯理论无实证：本文是纯理论论文，未在实验或观察数据中直接检验SOE预测。虽与Allcott et al. (2022)等实证发现一致，但缺乏直接验证。
正态分布假设：核心收敛性结果依赖于 $\Theta$ 与 $\epsilon_t$ 的正态分布假设，对其他分布形式的稳健性未充分讨论。
完美记忆与有限记忆的中间情形：模型设定agent完全忘记 $s_t$ 但完全记住 $a_t$ ，现实中记忆遗忘是连续的。引入部分记忆可能改变结果。
静态 $\tilde{v}$ 假设：假定agent对自己偏好的认知 $\tilde{v}$ 从不更新，与一些自我意识(self-awareness)文献中agent通过反复经验逐渐认识自己的设定不同。
单一基本面：模型中只有一个时间不变基本面 $\Theta$ ，多维基本面或动态基本面下结果可能更复杂。
agent不观察效用：假设agent期后不观察已实现效用，这对部分应用(如食物消费、运动)较合理，对其他应用(如金融投资)可能过强。
未模型化反馈与建议：现实中agent会与他人交流、寻求专家建议，这些机制如何与SOE互动未被分析。
政策干预设计有限：虽指出信息干预效果被削弱，但未深入探讨何种干预设计可以克服误学习(如承诺装置、跨情境一致性测试等)。
未与其他自我认知偏差整合：与过度自信、双曲贴现、损失厌恶等其他偏差的整合未被探讨。
均衡多重性问题：虽证明SOE存在，但多重均衡情形下的选择标准与跨均衡比较有限。

维度6：可拓展的研究方向

实验检验SOE：设计实验直接检验agent是否会通过观察自身行为形成系统性偏差信念，并验证类成瘾消费动态预测。
结构估计：将SOE模型应用于纵向消费数据(吸烟、饮酒、社交媒体使用)，结构估计参数并校验"表面成熟性"的实证含义。
政策干预设计：设计能够克服误学习的干预——如承诺装置、跨情境对比、外部反馈、社会比较等，并理论分析其效果。
多维基本面与多种偏好误认知：将框架扩展到多个基本面和多种偏好维度(如同时存在现时偏好与过度自信)。
社会学习与信念溢出：在agent群体中考察通过观察他人行为带来的额外学习，研究SOE的社会均衡性质。
专家建议与信任：引入专家(如医生、财务顾问)，分析agent是否信任与其自我认知冲突的建议，及其福利含义。
对其他应用的扩展：将SOE应用于其他领域：(a) 投资决策中误学习风险偏好，(b) 工作选择中误学习能力或耐心，(c) 关系中误学习关心他人的动机。
动态自我认知：放松 $\tilde{v}$ 不变的假设，建模agent如何通过特殊事件(危机、反馈)更新对自己偏好的认知。
记忆机制建模：与有限记忆/选择性记忆文献(如Bordalo, Gennaioli, Shleifer; Mullainathan)整合，建模更现实的记忆过程。
对前作Heidhues, Koszegi & Strack (2018)的整合：与产出推断设定整合，分析当agent同时从行动与产出推断时的均衡性质。
福利经济学含义：基于SOE框架重新审视家长式干预、行为定价、自由家长主义等政策辩论。
与机器学习中"misspecification"研究的对话：跨学科地将SOE与算法学习中的model misspecification研究对比，启发新的方法论。

关键结论

误自我认知必然产生系统性误学习：当agent对自己的偏好(如自制力)有误认知时，他通过观察自身行为不可避免地形成对外部世界基本面的系统性偏差信念。这种信念在SOE中稳定，agent即使经验丰富也不会自我修正。
天真在等方向问题中无歧义地有害：在等方向问题中，部分天真总是福利递减的，无论按真实偏好还是按agent自己希望的偏好评估。这是相对于既有部分天真模型的一个新发现，因为既有模型中天真的福利效应可正可负。
类成瘾动态可纯由信念驱动产生：即使产品没有生理成瘾性、没有跨期生理互依，部分天真的agent也会因误学习而表现出消费随时间递增、对过去消费正向反应等典型成瘾特征。这为非物质成瘾(社交媒体、赌博、购物)提供了纯认知机制的解释。
表面成熟性挑战实证识别：标准的预测测试(比较agent的预期行为与实际行为)无法识别有经验的天真agent——他们看起来像成熟agent，因为他们的SOE信念使预测与实际行为一致。这对依赖此类测试的实证文献(如发薪日贷款、健身房合约、储蓄装置等)提出根本性挑战。
政策含义：信息干预(如健康警告)的长期效果被误学习削弱；针对误自我认知的干预可能更有效——如帮助agent识别"承诺—违约"模式、提供跨情境一致性反馈、设计承诺装置等。家长式干预的辩护因SOE机制而被加强：即使agent自己满意当前选择，他的福利也是次优的。

Heidhues_Koszegi_2023_MisinterpretingYourself