Noisy Memory and Over-Reaction to News

作者: Rava Azeredo da Silveira, Michael Woodford
期刊: AEA Papers and Proceedings, 2019, 109: 557-561
DOI: https://doi.org/10.1257/pandp.20191049

一句话总结

将理性疏忽（rational inattention）的信息瓶颈从"对当期感知的噪声"转移到"对过去记忆的噪声"，证明在最优记忆管理下，决策者会对新闻产生过度反应——为消费过度反应、预测修正可预测性、共同与异质偏差提供统一的信息论解释。

研究问题

为什么家庭和专业预测者对新闻表现出系统性的过度反应（over-reaction），而不是 Sims (2003) 标准理性疏忽模型预测的反应不足？
当认知约束作用于记忆精度（而非感知精度）时，最优信息处理会导致何种预测和消费行为？
单一的有限记忆精度假说能否同时解释"共同偏差"（系统性预测误差）与"异质性偏差"（个体预测者间的差异）？

核心贡献

理论范式转移：将理性疏忽的信息瓶颈从感知通道（perception channel）重新定位到记忆通道（memory channel），打开新的建模空间
过度反应的微观基础：在线性高斯框架内严格证明，最优有噪声记忆必然产生对当期信号的过度赋权，因此消费/预测对新闻过度反应
统一解释：用同一参数 $\bar{\theta}$ 解释 (a) 永久收入假说违反、(b) 消费变化的可预测性、(c) 实验中预测修正的回归系数、(d) 个体预测的异质持续性
替代竞争机制：提供与"自然预期"（Fuster et al., 2011）和"诊断性预期"（Bordalo et al., 2018）平行但基于信息论的机制
可处理框架：保留闭式线性更新公式，便于嵌入宏观模型和实证检验

维度1：数据来源与实证策略

本文是一篇理论论文，提出了一个基于**有噪声记忆（noisy memory）**的理性疏忽模型，用以解释预期对新闻的过度反应（over-reaction）现象。

建模方法

信息约束类型： 与 Sims (2003) 的理性疏忽模型不同，本文将认知约束放在记忆精度上，而非对新观察的感知精度上。在 Sims 模型中，决策者对当期观察的感知受到噪声污染，但拥有完美的过去记忆；本文模型则假设当期观察可被完美观测，但过去信息的记忆是有噪声的。
记忆成本函数： 采用 Sims (2003) 的互信息（mutual information）作为信息成本度量，但应用对象是认知状态 $(m_t, y_t)$ 与下一期记忆状态 $m_{t+1}$ 之间的互信息 $I_t$ 。
最优记忆结构： 由于未来行动的准确性仅取决于对隐藏状态 $\mu$ 的估计精度，最优的有限记忆容量使用方式是存储当前后验均值 $\hat{\mu}_t$ ，因此记忆演化可用简洁的线性形式表达。
应用场景： 消费-储蓄的永久收入问题（consumption-smoothing problem）。

核心机制

决策者每期观察到收入 $y_t$ （服从 i.i.d. 高斯分布，均值 $\mu$ 未知），需要估计 $\mu$ 以做出消费决策。由于记忆有噪声，过去积累的关于 $\mu$ 的信息会随时间退化。这导致：

决策者对新信息赋予过高权重（因为旧信息在记忆中退化了）
当期收入冲击被过度外推为未来收入的预测
消费对收入新闻产生过度反应

维度2：理论框架

基本设定

决策者观察 $y_t \sim N(\mu, \sigma_y^2)$ ，其中 $\mu \sim N(0, \Omega)$
前瞻性移动平均的最优估计目标：

z_t^* \equiv (1-\beta) \sum_{j=0}^{\infty} \beta^j y_{t+j}

资产演化： $a_{t+1} = \beta^{-1}[a_t + y_t - c_t]$
超额消费 $z_t \equiv c_t - (1-\beta)a_t$ 即为"永久收入"估计

记忆成本最小化问题

\min \sum_{t=0}^{\infty} \beta^t \left\{ E\left[(z_t - z_t^*)^2\right] + \theta \, I_t \right\}

其中 $\theta > 0$ 为记忆精度的信息成本参数， $I_t$ 为认知状态与下一期记忆状态之间的互信息。

渐近线性系统（关键公式）

后验均值更新（增益系数表示）：

\hat{\mu}_t \equiv E[\mu | m_t, y_t] = (1-\gamma) m_t + \gamma y_t

其中 $0 < \gamma < 1$ 为增益系数（gain coefficient），取决于记忆不精确程度。

最优行动：

z_t = E[z_t^* | m_t, y_t] = (1-\beta) y_t + \beta \hat{\mu}_t

最优记忆演化（线性形式）：

m_{t+1} = \lambda \hat{\mu}_t + \omega_{t+1}

其中 $0 < \lambda < 1$ ， $\omega_{t+1}$ 为均值为零的高斯记忆噪声， $\lambda$ 和噪声方差均取决于记忆不精确程度。

预测偏差的回归系数

模型预测 Landier, Ma, and Thesmar (2018) 实验中的回归系数：

$\Delta_t^i$ 对 $\Delta_{t-1}^i$ 的回归系数应为 $\lambda(1-\gamma)$
$\Delta_t^i$ 对 $s_t$ 的回归系数应为 $\gamma$
两个系数均介于 0 和 1 之间

预测误差的序列相关

预测误差过程的序列相关系数：

\rho \equiv \lambda(1-\gamma)

介于 0 和 1 之间；预测误差 $\mu - \hat{\mu}_t^i$ 与预测修正 $\hat{\mu}_t^i - \hat{\mu}_{t-1}^i$ 之间的协方差应为 $-(1-\rho)$ 乘以预测误差方差。

维度3：核心发现

发现1：有噪声记忆导致消费过度反应

当 $\bar{\theta} > 0$ 时，消费对收入冲击的反应超过理性预期（RE）下永久收入假说所预测的水平。消费增加幅度大于 $(1-\beta)$ 倍的收入创新，但这一增加不是永久性的——消费和资产最终回归初始水平。

发现2：消费变化负自相关且可预测

消费变化在中期表现出负自相关，与 Fuster, Hebert, and Laibson (2011) 在美国非耐用消费品支出中的发现一致。
消费变化是可预测的，违反 RE 永久收入假说（Hall 1978）的预测。
即使收入过程是低阶自回归过程（甚至完全非持续），模型仍预测过度反应。

发现3：预测偏差的动态特征与实验证据一致

当期收入被过度外推为更高的未来收入预期
预测偏差（ $\hat{\mu}_t$ 偏离真实 $\mu$ ）具有持续性——暂时性收入冲击导致的预测偏差缓慢衰减
这些特征与 Landier, Ma, and Thesmar (2018) 的实验室实验数据吻合

发现4：模型同时解释共同偏差和异质性偏差

共同偏差（common bias）： 对新闻的过度反应产生系统性预测偏差
异质性偏差（idiosyncratic bias）： 不同预测者记忆中的异质噪声导致个体预测之间的差异，解释了 Fuhrer (2018) 发现的预测修正可预测性
有限记忆精度假说为这两类偏差提供了统一的简约解释

发现5：与其他过度反应模型的区别

本文机制不同于 Fuster, Hebert, and Laibson (2011) 的"自然预期"假说和 Bordalo et al. (2018) 的"诊断性预期"。本文的过度反应来源于理性疏忽框架下的最优记忆管理，而非启发式外推或概率扭曲。

维度6：与其他文献的关系

所属领域

信念形成（belief formation）、理性疏忽（rational inattention）、行为宏观经济学

关键对话文献

文献	关系
Sims (2003)	理性疏忽的奠基性工作；本文将信息约束从感知转移到记忆
Woodford (2003)	同一作者早期的不完美共同知识模型
Fuster, Hebert, & Laibson (2011)	提出"自然预期"假说解释宏观金融过度反应；本文提供替代机制
Bordalo, Gennaioli, Ma, & Shleifer (2018)	提出"诊断性预期"解释专业预测者的过度反应；本文用记忆噪声提供替代解释
Landier, Ma, & Thesmar (2018)	实验室实验发现预测过度反应的直接证据；本文模型预测与其回归系数一致
Hall (1978)	永久收入假说下消费应为鸠尾酒（martingale）；本文模型预测违背此结论
Fuhrer (2018)	发现专业预测者和家庭调查中预期的内在持续性；本文用异质记忆噪声解释
Cover & Thomas (2006)	互信息的信息论基础

方法论贡献

将理性疏忽模型中的信息瓶颈从"感知通道"重新定位到"记忆通道"
证明这一看似微小的建模差异能产生质的不同预测：从反应不足翻转为过度反应
提供了一个分析上可处理的线性高斯框架

在信念偏差研究中的位置

本文处于理性疏忽理论与预期偏差实证研究的交叉点，为实验和调查数据中观察到的过度反应现象提供了基于信息论的微观基础。

维度4：关键变量概览

模型变量：

$y_t$ ：t期收入观测值，服从 $N(\mu, \sigma_y^2)$
$\mu$ ：未知收入均值，先验 $N(0, \Omega)$
$m_t$ ：t期记忆状态（带噪声）
$\hat{\mu}_t = E[\mu | m_t, y_t]$ ：t期对均值的后验估计
$z_t^* = (1-\beta)\sum_{j=0}^{\infty}\beta^j y_{t+j}$ ：永久收入（最优消费目标）
$z_t = c_t - (1-\beta)a_t$ ：超额消费（"永久收入"估计）
$a_t$ ：t期资产
$\omega_{t+1}$ ：高斯记忆噪声

关键参数：

$\beta$ ：贴现因子
$\bar{\theta} = \theta(1-\beta)/\beta$ ：归一化记忆成本参数（核心结构参数）
$\gamma \in (0,1)$ ：当期信号增益系数 $\hat{\mu}_t = (1-\gamma)m_t + \gamma y_t$
$\lambda \in (0,1)$ ：记忆衰减系数 $m_{t+1} = \lambda \hat{\mu}_t + \omega_{t+1}$
$\rho = \lambda(1-\gamma)$ ：预测误差序列相关系数
$I_t$ ：互信息（信息论成本度量）

可观测量与对应公式：

预测修正自相关系数 = $\lambda(1-\gamma)$
预测修正对当期信号的弹性 = $\gamma$
预测误差与修正的协方差 = $-(1-\rho)\cdot\text{Var}(\mu - \hat{\mu}_t)$

维度5：局限性

抽象模型：仅在 i.i.d. 高斯收入过程下推导，未涵盖更现实的非平稳/异方差/非高斯收入过程
参数识别： $\bar{\theta}$ 的微观基础（神经认知层面的"记忆成本"）未被结构化估计；不同决策情境下应取何值缺乏指引
行动空间狭窄：仅推导消费-储蓄一个应用，未拓展到投资组合选择、资产定价等更广义的金融决策
互信息成本的合理性：使用 Sims 互信息度量是否准确反映人类记忆的真实成本结构存疑（与 Carlin et al. 2025 等替代成本函数的对比缺失）
会议论文篇幅：作为 AEA P&P 短文，未提供完整证明、稳健性检验或丰富的数值模拟
直接行为证据缺失：未直接测量被试的"记忆精度"，模型机制依赖结构推断

维度7：可拓展的研究方向

金融决策的应用：将 noisy memory 框架嵌入投资组合选择、动量/反转效应、收益外推（AssetPricing_2022_ReturnExtrapolation、Barberis_2015_XCAPM_Extrapolative）等金融模型
结构估计：用调查预测（SPF、Michigan、家庭金融调查）数据反推 $\bar{\theta}$ ，并与 Bordalo et al. 诊断性参数 $\theta$ 进行对比
实验直接检验：设计实验，外生改变记忆负荷（认知任务、时间间隔）并观察预测过度反应的强度变化
与替代记忆机制的整合：与关联记忆（Enke_Schwerter_2020_AssociativeMemory_BeliefFormation）、自我服务的选择性遗忘（Fudenberg_Lanzani_2022_SelectiveMemoryEquilibrium、RoyChowdhury_2022_SelfConfidence_MotivatedMemoryLoss）的统一框架
生命周期/记忆退化：将模型扩展到老龄化场景，预测年龄相关的过度反应增强；与投资者记忆研究（Godker_Jiao_2025_InvestorMemory、Walters_Fernbach_2021_InvestorMemory_PositivityBias）对接
宏观加总效应：研究异质 noisy memory 在DSGE中的加总含义，及其对货币政策传导的影响（与 Angeletos_Huo_2021_Myopia_Anchoring 对话）
AI类比：测试LLM在长上下文下是否表现出类似的 noisy memory 过度反应模式

关键结论

当认知约束作用于记忆而非感知时，理性疏忽产生过度反应而非反应不足：在最优有限记忆容量下，决策者必然对当期信号赋予超额权重 $\gamma > 0$ ，因为旧信息 $m_t$ 已在记忆中退化；这翻转了 Sims (2003) 标准模型的反应不足预测
统一的"信息瓶颈在记忆"假说能同时解释多类宏观/金融实证规律：永久收入假说违反、消费变化负自相关、专业预测者修正可预测性、个体预测异质持续性——这些表面上不相干的现象都可由单一参数 $\bar{\theta}$ （记忆精度成本）刻画

Silveira_Woodford_2019_NoisyMemory_Overreaction