Self-Confidence and Motivated Memory Loss: Evidence from Schools

元信息

作者: Vivek Roy-Chowdhury
年份: 2022 (February)
期刊/来源: Cambridge Working Papers in Economics (CWPE 2213)
JEL: D91, I21, J83
关键词: motivated beliefs, education, ability, recall, selective memory
数据: Beginning School Study (BSS), Baltimore City公立学校纵向追踪数据 (1982年起, 790名儿童, 20所学校)

一句话总结

利用Baltimore公立学校790名儿童的纵向调查数据，证明学生对自身数学成绩的回忆呈系统性正向偏差且随时间延迟（Spring 1个月vs Fall 3个月）显著放大；通过结构估计将该偏差分解为"自信心增强动机"（ $\lambda$ =1.27）与"现实约束成本"两个成分，提供田野情境下动机性记忆损失（motivated memory loss）的稀缺实证证据。

研究问题

学生对自身学业成绩的回忆是否系统性偏向"记得比实际更好"？
这种正向偏差是否随时间延迟而放大，从而符合"动机性记忆损失"假说而非即时信息回避假说？
哪些学生（高自信、偏好该科目、低自信？）展示更强的动机性记忆偏差？这是否符合Benabou-Tirole（动机性信念）还是Rabin-Schrag（确认偏差）的预测？
自信心更新更多依赖于实际成绩还是回忆成绩？这对教育反馈政策有何含义？
能否在结构模型中将记忆扭曲分解为自信心动机与现实约束成本两个可识别成分？

核心贡献

田野证据填补理论空白：动机性信念与记忆损失文献此前主要依赖实验室证据（Zimmermann 2020, Eil & Rao 2011, Mobius et al. 2014），本文利用BSS长期纵向数据提供罕见的真实世界、高利害情境下的证据。
识别动机性记忆损失渠道：通过Spring vs Fall自然时间变异，将2/3的Fall正向偏差归因于"信息后期记忆损失"而非"即时信息回避"，首次在田野中区分两种机制。
结构模型分解：构建Hybrid Choice Model（Ben-Akiva et al., 2002），将记忆扭曲分解为自信心动机参数 $\lambda$ 与递增的现实约束成本 $\gamma_j$ ，估计 $\lambda=1.273$ （显著正）、 $\gamma_1=-1.544$ 、 $\gamma_2=-3.253$ 、 $\gamma_3=-4.816$ （边际成本递增）。
个体内识别：用个体固定效应排除"高能力学生→好成绩→准确回忆"的截面共变干扰，识别系来自学生内部对不同成绩的差异性记忆。
关键反例对动机性信念vs确认偏差的区分：低自信学生的 $\lambda$ 仍为正（虽然小约2/3），不符合Rabin-Schrag确认偏差的"低自信偏好坏消息"预测，强力支持Benabou-Tirole动机性信念框架。
政策含义：负面反馈需要"加强"（reinforcement），干预设计需关注信息后期留存而非仅即时呈现；自信心更新主要由回忆成绩驱动而非实际成绩。

维度1：数据来源与实证策略

研究类型

非实验室实验, 而是基于田野纵向调查数据的实证研究 (observational field study)
利用BSS数据集的自然设计特征 (Spring vs. Fall调查的时间差异) 作为准自然实验

数据来源与样本

Beginning School Study (BSS): 1982年开始追踪Baltimore City公立学校790名代表性儿童队列
样本人口统计: 55%黑人, 50%女性, 61%父母未完成高中, 28%父母为无业独立收入者
调查从一年级持续到高中毕业后成年期 (1998年和2006年回访)
每年进行两次面对面访谈 (Spring和Fall)

核心变量测量

1. 实际成绩 ( $s_{it}$ )

来自学校行政记录的数学成绩单成绩
四级量表: Excellent (90-100%), Good (80-89%), Satisfactory (70-79%), Unsatisfactory (<70%)
数值编码: E=4, G=3, S=2, U=1

2. 回忆成绩 ( $\tilde{s}_{it}$ )

通过问卷直接获取: "Remember the last report card you got when school ended for the summer? You could have gotten marks like E (Excellent), G (Good), S (Satisfactory), or U (Unsatisfactory). What mark did you get in Mathematics?"
与实际成绩使用相同的 {E, G, S, U} 量表

3. 学术自信心 ( $D_{it}$ )

问题: "How smart do you think you are compared to other kids in your school this year?"
五级量表: 5 = One of the smartest, 4 = Smarter than most kids, 3 = About as smart as everybody else, 2 = Not as smart as most kids, 1 = Not very smart at all
高自信定义: $\mathbb{1}(D_{it} > 3)$

关键设计特征: Spring vs. Fall时间差异

Spring调查 (4-5月): 成绩单发放后约1个月询问回忆
Fall调查 (11月): 成绩单发放后约3个月以上询问回忆
这一设计天然产生了时间延迟的变异, 用于检验动机性记忆损失 (motivated memory loss) 的假说
Spring回忆准确率约70%, Fall回忆准确率约50%

数据处理

排除Fall '85 (四年级, 回忆准确率异常低仅40.9%)
回归样本主要覆盖6-12年级 (大多数学生11-15岁)
共约2,659个观测值 (含个体固定效应时)

实验任务详细流程

学生每学期获得数学成绩单 (学校行政系统发放)
BSS在Spring或Fall对学生进行面对面访谈
询问学生对最近一次成绩单数学成绩的回忆
同时询问学生的学术自信心自评
研究者将学生回忆与行政记录中的实际成绩进行比对
利用纵向面板结构进行个体内 (within-individual) 分析

维度2：理论框架

理论基础

动机性信念理论 (Motivated Beliefs Theory): Benabou and Tirole (2002)
核心思想: 个体有动机忽视或遗忘不利于自我形象的信息, 以维护自信心
与确认偏差 (confirmation bias, Rabin and Schrag 1999) 相区分: 动机性信念预测所有人都偏好正面信息; 确认偏差预测低自信者应偏好负面信息

Reduced Form 回归模型

模型1: 回忆错误方程
$ $\mathbb{1}(\tilde{s}_{it} \neq s_{it}) = \beta_0 + \sum_{z \in \{G,S,U\}} \beta_{1z} \mathbb{1}(s_{it} = z) + \beta_2 Fall_t + \alpha_i + \gamma_t + \epsilon_{it}$ $

因变量: 是否回忆错误 (二值)
关键自变量: 实际成绩等级虚拟变量 (基准组为Excellent)
控制: 个体固定效应 $\alpha_i$ , 学年固定效应 $\gamma_t$ , Fall虚拟变量

模型2: 记忆正向漂移方程
$ $\mathbb{1}(\tilde{s}_{it} = E) = \delta_0 + \sum_{z \in \{G,S,U\}} \delta_{1z} \mathbb{1}(s_{it} = z) + \delta_2 Fall_t + \alpha_i + \gamma_t + \epsilon_{it}$ $

因变量: 是否回忆为Excellent
用于检验Fall调查时记忆是否更趋正面

结构模型: 离散选择记忆模型

效用函数
$ $U_{z,t} = \lambda \tilde{\theta}(\tilde{s}_t = z, \Omega_{t-1}) + c(\tilde{s}_t = z, s_t) + \varepsilon_{z,t}$ $
$ $= V_{z,t} + \varepsilon_{z,t}$ $

其中:

$\lambda$ : 自信心动机参数 -- 记忆更高成绩对自信心的边际效用权重
$\tilde{\theta}(\cdot)$ : 潜在自信心函数 -- 给定回忆成绩和先验心理状态, 对能力的期望
$c(\tilde{s}_t = z, s_t)$ : 现实约束/记忆扭曲成本 -- 随回忆与实际成绩距离对称递增
$\varepsilon_{z,t}$ : Type-1 Extreme Value分布的随机项
$\Omega_{t-1}$ : 学生先前的心理状态

可估计效用形式
$ $U_{z,t} = \lambda \tilde{\theta}_{z,t} + \sum_{j=1}^{3} \gamma_j \mathbb{1}(w(z, s_{it}) = j) + \varepsilon_{z,t}$ $

其中:

$\gamma_j$ ( $j \in \{1,2,3\}$ ): 记忆扭曲距离为 $j$ 的成本参数
$w(\tilde{s}_t, s_t)$ : 回忆成绩与实际成绩之间的绝对离散距离

信念更新方程 (潜变量)
$ $\tilde{\theta}_{z,t} = \beta_1^z + \sum_{r=2}^{5} \beta_r^z \mathbb{1}(D_{t-1} = r) + \varepsilon_t^\theta$ $

四个潜变量 ( $z \in \{E, G, S, U\}$ ) 描述不同回忆成绩下自信心如何更新
通过ordered logistic模型将 $\tilde{\theta}$ 映射到可观测的 $D_t$

联合似然函数
$ $L(\tilde{s}_t = z, D_t = k | x_t) = \int_{\varepsilon_t^\theta} \frac{e^{V_{z,t}}}{\sum_{j \in \{E,G,S,U\}} e^{V_{j,t}}} \left( \frac{e^{\tau_k - x_t' \zeta}}{1 + e^{\tau_k - x_t' \zeta}} - \frac{e^{\tau_{k-1} - x_t' \zeta}}{1 + e^{\tau_{k-1} - x_t' \zeta}} \right) d\varepsilon_t^\theta$ $

属于Hybrid Choice Model类别 (Ben-Akiva et al., 2002)
通过数值积分和最大似然估计 (Apollo软件包)

信念更新的动态面板模型

采用Bartolucci and Nigro (2010) Quadratic Exponential模型
处理含滞后因变量和个体异质性的二值面板数据

维度3：核心发现

发现1: 低成绩的回忆错误率显著更高

回忆准确率: Excellent = 81%, Good = 68%, Satisfactory = 52%, Unsatisfactory = 36%
回忆错误的成绩梯度 (Table V, col.1, 基准为Excellent):
- Good: +10.5 pp** (SE = 0.041)
- Satisfactory: +26.4 pp*** (SE = 0.042)
- Unsatisfactory: +51.2 pp* (SE = 0.048)
含个体固定效应后结果稳健 (col.1 vs col.2差异极小)
Effect size: 最低等级Unsatisfactory比最高等级Excellent的回忆错误概率高出约50个百分点

发现2: 回忆错误呈正向偏斜

回忆错误主要是向上扭曲 (记住了比实际更好的成绩)
Figure I显示: 除Excellent外 (无法向上扭曲), 所有等级的回忆错误均以正向为主

发现3: 时间延迟加剧正向记忆偏差 (动机性记忆损失)

Fall (长延迟) vs. Spring (短延迟) 比较 (Figure II, 仅Good和Satisfactory):
- 准确回忆: Spring 76% vs. Fall 48% (下降28 pp)
- 正向错误 (flattering): Spring 19% vs. Fall 45% (增加26 pp)
- 负向错误 (unflattering): Spring 5% vs. Fall 7% (仅增加2 pp)
几乎所有额外的记忆衰减都集中在正向扭曲方向
约2/3的Fall正向偏差可归因于信息传递后的记忆损失
Fall系数 (Table VI, col.1): $\delta_2$ = +0.073* (SE = 0.012) -- 在Fall调查时回忆为Excellent的概率显著更高
含个体固定效应: 同一学生在Fall时记忆更趋正面

发现4: 高先验自信心和数学偏好放大动机性记忆偏差

高先验自信心 $\times$ Unsatisfactory交互项 (Table V, col.5): +0.217 (SE = 0.100)
Fall $\times$ 高先验自信心 (Table VI, col.5): +0.062 (SE = 0.028)
Fall $\times$ 数学偏好 (Table VI, col.3): +0.070* (SE = 0.023)
高自信学生和偏好数学学生展示更强的自我增强记忆偏差

发现5: 回忆成绩 (而非实际成绩) 影响自信心更新

Quadratic Exponential模型 (Table VII):
- 回忆为Satisfactory: -0.856 (SE = 0.351) (对数几率)
- 回忆为Unsatisfactory: -1.474** (SE = 0.525)
- 实际成绩系数均不显著
含义: 记住较低成绩使高自信概率下降约60% (相应比值比); 而实际成绩无统计显著影响

发现6: 结构模型参数估计 (Table VIII)

自信心动机: $\lambda$ = 1.273* (SE = 0.349) -- 显著为正, 验证动机性信念
现实约束 (记忆扭曲成本):
- $\gamma_1$ = -1.544* (SE = 0.068) -- 距离1的成本
- $\gamma_2$ = -3.253* (SE = 0.162) -- 距离2的成本
- $\gamma_3$ = -4.816* (SE = 0.347) -- 距离3的成本
- 边际成本随距离递增, 说明记忆扭曲是选择性的而非一致的

发现7: 参数异质性 (Table IX)

Spring vs. Fall: $\lambda$ 在两季无统计差异 ( $\lambda_{fall+}$ = 0.178, n.s.); 但 $\gamma_j$ 在Fall显著更小 (成本降低), 如 $\gamma_{1,fall+}$ = +0.897* -- 时间流逝降低了记忆扭曲成本, 而非提高了自信心需求
数学偏好: $\lambda_{subm+}$ = +0.620 (SE = 0.269) -- 偏好数学的学生自信心动机提高约60%, 但 $\gamma_j$ 无差异
低先验自信心: $\lambda_{\mathbb{1}(D_{t-1}<3)+}$ = +0.983 (SE = 0.388) -- 但基础 $\lambda$ 仅0.464, 低自信学生的自信心动机降低约2/3; 重要的是 $\lambda$ 仍然为正 (不符合确认偏差预测)
人口学变量 (性别、种族、父母教育) 对结构参数无显著影响

维度6：与其他文献的关系

所属领域

行为经济学 / 动机性信念 (motivated beliefs)
教育经济学 / 自信心形成
信息经济学 / 信号处理与记忆

核心贡献

田野证据填补空白: 绝大多数动机性信念研究基于实验室; 本文利用纵向田野数据提供稀缺的实证支持
识别记忆损失机制: 首次在田野情境中证明动机性信息扭曲的大部分来自事后记忆损失 (memory loss), 而非即时信息回避
个体内识别策略: 利用纵向面板和个体固定效应, 排除截面异质性的混淆 (如认知能力与成绩的联合相关)
结构模型分解: 将记忆扭曲分解为自信心增强动机 ( $\lambda$ ) 和现实约束成本 ( $\gamma_j$ ) 两个成分, 揭示异质性来源

与关键文献的关系

文献	关系
Benabou & Tirole (2002)	理论基础: 动机性信念模型, 本文结构模型的理论出发点
Rabin & Schrag (1999)	对比理论: 确认偏差模型; 本文结果不支持 (低自信者也展示自我增强偏好)
Zimmermann (2020, AER)	最直接前驱: 实验室中证明IQ测试后1个月记忆出现动机性损失; 本文将此结果推广到田野情境
Huffman et al. (2019)	田野前驱: 用截面数据证明管理者记忆偏差与过度自信相关; 本文增加了纵向维度和记忆损失渠道
Eil & Rao (2011)	实验室证据: 好消息/坏消息不对称处理; 本文在更高利害关系的田野环境中确认
Mobius et al. (2014)	实验室证据: 管理自信心; 本文提供互补的田野证据
Dizon-Ross (2019, AER)	平行研究: 父母对子女学业能力的信念偏差; 使用相同BSS数据集
Koszegi (2006)	理论: ego utility与任务选择; 本文提供记忆扭曲作为ego保护的实证

方法论定位

Bartolucci & Nigro (2010): 动态二值面板模型 (Quadratic Exponential), 处理含滞后因变量的个体异质性
Ben-Akiva et al. (2002): Hybrid Choice Model, 将潜变量嵌入离散选择框架
Hess & Palma (2019): Apollo软件包用于结构模型估计

局限性

非随机化实验, 无法完全排除虚假报告 (dishonesty) 的可能性
BSS样本为Baltimore低收入社区, 外部效度可能有限
无法完全排除部分信息扭曲是即时的 (directed cognition / information avoidance)
结构模型中省略了个体固定效应 (因计算复杂性)

政策启示

在需要传递打击自信心的负面信号时, 可能需要信号强化 (reinforcement)
反馈干预不仅要关注信息如何即时传递, 还需关注信息的后续留存
自信心低的学生可能更脆弱于负面信号, 但也更少使用动机性记忆保护

维度4：关键变量概览

变量类别	变量	测量方式	角色
核心因变量	实际数学成绩 $s_{it}$	学校行政记录，4级（E/G/S/U → 4/3/2/1）	客观基准
	回忆数学成绩 $\tilde{s}_{it}$	BSS问卷自我报告，相同4级	主因变量
	学术自信心 $D_{it}$	"How smart..."问卷，5级	信念变量
关键自变量	是否回忆错误 $\mathbb{1}(\tilde{s}_{it} \neq s_{it})$	二值	衡量错误率
	是否回忆为E $\mathbb{1}(\tilde{s}_{it}=E)$	二值	衡量正向偏差
	实际成绩等级虚拟变量	E为基准	自变量
	Fall虚拟变量	Spring（1月延迟）vs Fall（3月延迟）	时间延迟
	高先验自信心 $\mathbb{1}(D_{i,t-1}>3)$	二值	异质性
	数学偏好	BSS问卷	异质性
结构模型参数	自信心动机 $\lambda$	Hybrid Choice MLE	核心结构参数
	现实约束成本 $\gamma_1, \gamma_2, \gamma_3$	Hybrid Choice MLE	距离1/2/3的扭曲成本
	信念更新参数 $\beta_r^z$	结构方程	不同回忆下自信心更新斜率
控制变量	个体固定效应 $\alpha_i$	within-individual	排除截面异质性
	学年固定效应 $\gamma_t$	year FE	排除时间趋势
	性别、种族、父母教育、家庭背景	BSS基线	异质性
样本	6-12年级Baltimore学生	N约2659观测	个体内面板

维度5：局限性

非随机化设计：仅Spring/Fall时间差异作为准自然实验，可能与其他季节性因素（暑假、新学年压力）混淆。
Dishonesty无法完全排除：尽管访谈员鼓励诚实，仍无法完全区分"动机性记忆损失"与"动机性虚假报告"两种机制。
样本外部效度：BSS仅Baltimore市低收入社区（55%黑人、61%父母未完成高中），结果向中产阶级、其他城市/国家、其他科目（如阅读、艺术）的推广受限。
结构模型省略个体固定效应：因计算复杂性，结构估计未含个体异质性，可能存在偏差。
回忆量表与成绩单量表相同：4级离散，限制了对细微回忆扭曲的识别（如90% vs 95%）。
未直接测量记忆机制：无法区分"动机性遗忘"（主动）与"被动遗忘+正向偏差填补"（无意识），缺乏神经/认知过程数据。
信息环境异质性：不同家庭对成绩的强调程度（如父母签字、家教）可能差异巨大，但未被建模。
省略的成绩反馈渠道：除成绩单外，学生还可能从课堂、同伴比较、考试反馈中获取能力信号，这些渠道对回忆的修正作用未建模。

维度7：可拓展的研究方向

金融决策应用：将范式应用于投资者对自身投资业绩的回忆——是否系统性记得"赢得更多、输得更少"？时间延迟下偏差如何放大？（与Walters & Fernbach 2021、Gödker 2025 InvestorMemory对接）。
职场绩效与晋升：员工对历史绩效评估的回忆偏差，及其对自我效能、薪资谈判、跳槽决策的影响。
健康行为：患者对体检结果（血糖、血压、BMI）的回忆偏差，及其对健康行为坚持度的影响。
政治与媒体记忆：选民对候选人立场或新闻报道的记忆偏差，是否随意识形态距离与时间延迟放大。
干预设计：测试"反馈强化"（reinforcement，如多次提醒、视觉化、社会比较）能否降低动机性记忆损失，提高负面反馈的有效性。
神经/认知机制：结合fMRI或MEG，测量自我相关学业反馈编码与提取阶段的神经差异，找出动机性记忆损失的神经基础（与Rollwage 2020 Confidence_NeuralConfirmationBias对接）。
跨文化与跨年龄：在集体主义文化（如东亚）、不同年龄段（小学、大学、成人）中检验机制的稳健性。
AI与算法纠偏：开发学习管理系统（LMS）或健康App，自动追踪并提醒"实际vs回忆"差距，量化干预效果。
理论模型扩展：将自信心动机 $\lambda$ 嵌入Benabou-Tirole/Koszegi式动态自我控制模型，研究记忆损失对劳动供给、储蓄、教育投资的均衡影响。
机制识别：利用更精细的时间变异（1天、1周、1月、半年、1年）描绘记忆衰减曲线的形状，区分指数衰减vs动机性偏移。

关键结论

学业回忆系统性正向偏斜：低成绩学生记错率显著更高（Excellent回忆准确81%，Unsatisfactory仅36%），错误几乎全为"记得更好"方向；最低等级比最高等级的回忆错误概率高约50个百分点。
动机性记忆损失（不是即时回避）是主导机制：Spring（1月延迟）正向偏差19%，Fall（3月延迟）跃升至45%，而负向偏差仅从5%升至7%；约2/3的Fall正向偏差来自时间延迟引发的记忆损失。
高自信、偏好科目放大偏差：高先验自信×Unsatisfactory交互显著正（+0.217），Fall×数学偏好显著正（+0.070），与动机性信念的预测一致。
自信心更新依赖回忆而非实际成绩：Quadratic Exponential模型显示回忆为Satisfactory/Unsatisfactory显著降低高自信概率（对数几率-0.86 / -1.47），而实际成绩系数不显著——记忆是自信心的真正决定因素。
结构估计区分动机与现实约束： $\lambda=1.273$ （自信心动机正且显著）， $\gamma_j$ 边际成本随距离递增（-1.54, -3.25, -4.82），现实约束限制了扭曲程度；时间延迟降低 $\gamma_j$ （成本下降）而非提高 $\lambda$ 。
不支持确认偏差，支持动机性信念：低自信学生的 $\lambda$ 仍为正（虽降低约2/3），不符合Rabin-Schrag（确认偏差应预测低自信偏好坏消息）；所有人都偏好正面信息，符合Benabou-Tirole。
政策含义：负面反馈干预需"加强"（重复、可视化、长期跟踪）以对抗记忆损失；自信心提升项目可能比传授知识更有效——因为自信心由回忆驱动而非实际成绩。

RoyChowdhury_2022_SelfConfidence_MotivatedMemoryLoss

Self-Confidence and Motivated Memory Loss: Evidence from Schools

元信息

一句话总结

研究问题

核心贡献

维度1：数据来源与实证策略

研究类型

数据来源与样本

核心变量测量

关键设计特征: Spring vs. Fall时间差异

数据处理

实验任务详细流程

维度2：理论框架

理论基础

Reduced Form 回归模型

结构模型: 离散选择记忆模型

信念更新的动态面板模型

维度3：核心发现

发现1: 低成绩的回忆错误率显著更高

发现2: 回忆错误呈正向偏斜

发现3: 时间延迟加剧正向记忆偏差 (动机性记忆损失)

发现4: 高先验自信心和数学偏好放大动机性记忆偏差

发现5: 回忆成绩 (而非实际成绩) 影响自信心更新

发现6: 结构模型参数估计 (Table VIII)

发现7: 参数异质性 (Table IX)

维度6：与其他文献的关系

所属领域

核心贡献

与关键文献的关系

方法论定位

局限性

政策启示

维度4：关键变量概览

维度5：局限性

维度7：可拓展的研究方向

标签

关键结论

🔗 链接到这篇笔记