Meier_Flepp_2025_ExpectationalReferencePoints_BeliefFormation

一句话总结

利用 I/B/E/S 数据库 1984–2019 年金融分析师 EPS 预测的回归断点设计（RDD），证明专业分析师将自己的预测作为期望型参考点（expectational reference points）：当实际 EPS 恰好超过预测时，分析师后续季度的相对乐观度出现 +0.12 SD 的离散跳跃，且预测被 missed 时信念更新幅度更大，与 reference dependence 和 loss aversion 一致。

研究问题

期望（自身的盈利预测）是否作为参考点（reference point）影响金融分析师对盈利信号的感知与信念更新过程？换言之，在客观信号几乎相同的情形下，结果落在期望之上 vs. 之下是否会引起后验信念的离散跳跃？

核心贡献

方法论贡献：将回归断点设计（RDD）应用于信念更新研究，利用"预测恰好被 beat 还是 miss"的准随机性识别 reference-dependent belief updating 的因果效应，是首次在专业金融分析师的高利害田野环境中识别此类效应。
理论贡献：将 Koszegi and Rabin (2006) 的期望型参考点框架从选择行为扩展到信念形成领域，证明专业人士并非纯粹的 Bayesian 更新者。
实证贡献：发现两类清晰的 RDD 效应——方向性效应（+0.12 SD 的乐观度跳跃）和不对称效应（miss 引发更大的更新幅度，约 -0.05 个百分点的绝对乐观度差异），与 loss aversion 的预测一致。
政策与市场启示：金融分析师作为高度专业化、激励充分的市场参与者尚且表现出系统性的 reference-dependent 偏差，对高效市场假说的微观基础提出新的挑战。

维度1：数据来源与实证策略

实验设计

本文利用金融分析师的盈利预测数据，通过回归断点设计（RDD）检验期望型参考点（expectational reference points）是否影响信念形成过程。以下逐步还原研究设计的完整数据管道和识别策略。

数据来源与样本构建

数据库：数据来自 Institutional Brokers' Estimate System（I/B/E/S）数据库，包含金融分析师对上市公司的季度每股收益（EPS）预测。
时间跨度：样本期为 1984 年至 2019 年。
预测类型：聚焦于一个季度前（one-quarter-ahead）的盈利预测，即分析师在当前季度 t 对下一季度公司 EPS 的预测。
样本筛选规则：
- 要求每个分析师-公司-季度观测具有两个连续季度的预测数据（用于计算乐观度变化量）。
- 仅保留在给定季度中至少有5 名不同分析师发布预测的公司-季度观测（用于计算共识预测和相对乐观度）。
- 剔除公用事业（SIC 4900-4999）和金融服务（SIC 6000-6999）行业的公司。
- 剔除无法与 CRSP/Compustat 匹配的公司-年度。
- 剔除团队分析师代码对应的观测。
- 仅保留在该季度盈利公告前 90 天内发布的预测。
最终样本：698,824 个分析师-公司-季度观测。

变量构建

因变量：

Optimism Change（乐观度变化）：
- 首先定义 Optimism_{i,j,t} = (EPS Forecast_{i,j,t} - Consensus_{j,t}) / SD(EPS Forecast_{j,t})，即分析师 i 对公司 j 在季度 t 的第一个预测相对于共识预测的标准化偏离度。共识预测为同季度所有分析师第一个预测的均值，标准差为所有预测的标准差。
- Optimism Change_{i,j,t} = Optimism_{i,j,t} - Optimism_{i,j,t-1}，即相邻两个季度间乐观度的变化。
Absolute Optimism Change（绝对乐观度变化）：|Optimism Change_{i,j,t}|，用于检验更新的不对称性。

核心自变量（running variable）：

Rel. Dev. Est._{i,j,t-1}（相对偏离度）= (Actual_{j,t-1} - EPS Forecast_{i,j,t-1}) / Actual_{j,t-1}，即公司 j 在上一季度 t-1 的实际 EPS 与分析师 i 预测值之间的相对偏差。该值为正表示实际 EPS 超过预测（预测被"beaten"），为负表示实际 EPS 低于预测（预测被"missed"）。
Meet or Beat_{i,j,t-1}（处理变量）：当 Rel. Dev. Est._{i,j,t-1} >= 0 时取值为 1，否则为 0。即实际 EPS 恰好达到或超过分析师预测时，该分析师被归入处理组。

控制变量：Covered Firms（覆盖公司数）、Covered Industries（覆盖行业数）、Exp. Years（分析师从业年限）、Exp. Firm（跟踪该公司的年限）、Specialization（是否专注于同行业至少 5 家公司）、Forecast Age（盈利公告日与预测日的间隔天数）。

识别策略：回归断点设计（RDD）

本文的核心识别思路如下：

准随机分配的逻辑：当分析师的 EPS 预测与公司实际 EPS 非常接近时（即 Rel. Dev. Est. 接近于零），预测恰好被"beaten"还是被"missed"可视为准随机事件。在这些临界情形下，两组分析师具有几乎相同的先验信念，观察到相同的实际盈利信号，但其预期相对于结果的方向不同——一组预期恰好被超越，另一组恰好未被达到。
核心假设：在条件于与实际 EPS 的接近程度下，预测恰好落在实际值之上或之下的概率是由外生因素（而非分析师的动机或能力）决定的。因此 running variable 在断点处的准随机变动可被解释为处理效应的因果效应。
基准回归模型（方程 1）：

Optimism Change_{i,j,t} = alpha_0 + beta_1 * Meet or Beat_{i,j,t-1} + gamma_0 * P_n(Rel. Dev. Est.{i,j,t-1}) + gamma_1 * P_n(Rel. Dev. Est.{i,j,t-1}) * Meet or Beat_{i,j,t-1} + Analyst Controls_{i,j,t} + FEs + epsilon_{i,j,t}

其中 P_n 为 n 阶多项式函数，允许断点两侧具有不同斜率。基准模型使用二阶多项式（second-order polynomial）。
带宽选择：使用 uniform kernel，带宽为 running variable 正负 5 个百分点（即仅包含 Rel. Dev. Est. 在 [-5%, +5%] 范围内的观测，即分析师预测与实际 EPS 偏差不超过 5% 的情形）。基准模型下共 230,830 个观测。
固定效应结构：首选模型（specification IV）同时包含公司固定效应（firm FEs）和分析师-年度-季度固定效应（analyst-year-quarter FEs），标准误在分析师层面聚类。
稳健性检验：
- 使用 Calonico et al. (2014a) 的非参数局部多项式方法进行数据驱动的最优带宽选择和稳健置信区间估计（最优带宽约为 4%，与基准 5% 接近）。
- 在 +/-1% 至 +/-50% 的多个带宽下重新估计处理效应。
- 变更多项式阶数（线性回归）。
- 排除所有精确命中观测（预测 = 实际 EPS）。
- 排除接近共识预测的观测（乐观度处于第 45-55 百分位的分析师-公司-年度-季度观测）。
- 对预定协变量进行平衡检验（balance checks），验证断点两侧分析师特征无系统差异。
- 在多个安慰剂断点（+/-3%, +/-6%, ..., +/-15%）处进行伪造检验（falsification tests），均未发现显著断点。

理论模型

理论基准

标准 Bayesian 更新：如果分析师是理性的 Bayesian 更新者，那么拥有几乎相同先验信念、观察到相同实际盈利信号的两位分析师，应该形成几乎相同的后验信念。预测恰好被超越还是未达到不应对后续信念产生离散影响。
Reference-dependent 信息处理理论：
- Kahneman and Tversky (1979) 和 Koszegi and Rabin (2006) 的理论指出，个体的期望可作为参考点，结果相对于期望的偏离方向会影响感知。
- Gagnon-Bartsch and Bushong (2022) 和 Bushong and Gagnon-Bartsch (2023) 的实验研究表明，期望型参考点可诱导对公司业绩的不同感知，从而影响信念更新。结果超出期望时被感知为更正面，未达期望时被感知为更负面，即使信号的内在价值相同。
- 这意味着信念更新过程在参考点处会出现离散跳跃（discontinuity），而非 Bayesian 模型预测的平滑变化。

关键假说

假说 1（方向性效应）：预测恰好被超越的分析师（Meet or Beat = 1）在后续季度会变得相对更乐观，即 beta_1 > 0。这是因为超越期望的结果被感知为更正面的信号。
假说 2（不对称性）：预测恰好未被达到的分析师比预测恰好被超越的分析师更新幅度更大（Absolute Optimism Change 更大）。这与 loss aversion 一致——负面偏离（未达期望）相比正面偏离（超出期望）会引发更大的感知反应，导致更强烈的信念调整。

可能的机制

作者在讨论中提出了几种可能的底层机制，但无法在数据中加以区分：

Outcome bias / 结果过度加权：分析师可能过度加权结果的方向（超出或低于期望），将之错误归因于信号的内在信息价值。
Misattribution of reference-dependent utility：基于 Gagnon-Bartsch and Bushong (2022) 的模型，分析师可能将结果与期望比较产生的 elation（欣喜）或 disappointment（失望）感受错误归因于公司业绩的内在特质。
Reference-dependent (in)attention：分析师可能在期望未被达到时投入更多注意力和认知资源，导致更大幅度的更新；而期望被超越时则较少关注，导致更小的更新。

核心发现

主要结果

乐观度的离散跳跃（Optimism Change）：
- 在 RDD 图形中（Fig. 1），在断点（Rel. Dev. Est. = 0）处，乐观度变化出现清晰可见的向上跳跃。
- 回归结果（Table 2）：Meet or Beat 的系数在所有四个模型设定中均显著为正。在首选模型（specification IV，包含 firm FEs 和 analyst-year-quarter FEs）中，系数为 +0.120（p < 0.01）。
- 效应大小：约相当于控制组均值（Optimism Change 在整体样本中接近 0）的 40% 的增量。即预测恰好被超越的分析师在后续季度的相对乐观度比预测恰好未达到的分析师高出约 0.12 个标准差单位。
更新的不对称性（Absolute Optimism Change）：
- RDD 图形（Fig. 3-4）显示，在断点处，Absolute Optimism Change 出现清晰的向下跳跃。
- 回归结果（Table 3）：Meet or Beat 的系数在所有设定中均显著为负。首选模型中系数为 -0.047（p < 0.01）。
- 含义：预测恰好未被达到的分析师的信念变化绝对值比预测恰好被超越的分析师大约 4.6 至 5.6 个百分点，即负面参考依赖感知引发更强烈的信念更新，与 loss aversion 的不对称预测一致。

稳健性检验结果

数据驱动的带宽选择（Table 4）：使用 Calonico et al. (2014a) 的 rdrobust 方法，最优带宽约为 4%，结论不变且效应量略有增大。
多带宽敏感性（Fig. 5-6）：在 +/-1% 到 +/-50% 的带宽范围内，处理效应方向和显著性总体一致，但在极窄带宽（+/-1%）下估计较不精确。
排除精确命中观测（Table 5, Panel A）：剔除所有预测精确等于实际 EPS 的观测后（排除 66,663 个观测），结果稳健。
排除接近共识的预测（Table 5, Panel B）：剔除乐观度处于第 45-55 百分位的观测后（排除 69,882 个观测），结果稳健。这排除了分析师和公司通过 earnings management 操纵处理状态的可能性。
平衡检验（Table 6）：对 6 个预定协变量（Covered Firms、Covered Industries、Exp. Years、Exp. Firm、Specialization、Forecast Age）进行 RDD 平衡检验，除 Forecast Age 存在弱显著外，其余均无显著差异。
安慰剂断点检验（Fig. 9-10）：在 +/-3% 至 +/-15% 的安慰剂断点处未发现系统性的处理效应。
事后分析——预测误差（Table A2）：预测恰好未被达到的分析师表现出更大的预测误差，这与 reference-dependent inattention 的机制更为一致（但在最严格设定中不显著），暗示 misattribution 和 inattention 两种机制可能共同作用。

与其他文献的关系

Koszegi_Rabin_2007_ReferenceDependentRisk：本文的理论基础之一。Koszegi and Rabin (2006) 提出期望作为参考点的模型，本文将此框架从选择行为领域扩展到信念形成领域，提供了期望型参考点影响信息处理的田野证据。
Barberis_2015_XCAPM_Extrapolative：Barberis (2013, 2015) 将 reference-dependent preferences 确定为金融决策中的关键概念。本文进一步表明 reference dependence 不仅影响投资选择，还影响信息处理和信念更新过程。
Frydman_Nave_2017_ExtrapolativeBeliefs_Perceptual_Economic：与本文均关注信念形成中的行为偏差。Frydman and Nave 研究外推性信念的感知基础，本文则关注期望如何作为参考点扭曲对新信息的感知。
Grosshans_Zeisberger_2025_InvestorBeliefs_TradingActions：两篇文章均研究金融市场参与者的信念偏差。Grosshans and Zeisberger 关注投资者信念与交易行为的关系，本文则聚焦专业分析师的信念更新过程如何受参考点影响。
Fan_InferenceForecastGap_BeliefUpdating：均涉及信念更新中的偏差。Fan 的工作关注推断与预测之间的差距，本文则揭示了信念更新中因参考点导致的离散跳跃现象。
Malmendier_ExperienceEffects_Finance：Malmendier 关注个人经历对金融信念的长期影响，本文则关注短期内期望与结果的比较如何影响即时信念更新，两者共同说明信念形成受非理性因素的多维度影响。
Giglio_2021_FiveFacts_BeliefsPortfolios：Giglio et al. 记录了投资者信念的若干经验事实，本文为理解这些信念模式提供了一个微观机制——期望型参考点可导致信念更新的系统性偏差。
与 Bushong and Gagnon-Bartsch (2023) 以及 Gagnon-Bartsch and Bushong (2022) 的实验室实验互为补充：前者在实验室中发现 reference-dependent perception 影响信念更新，本文在高利害关系的专业环境中提供了一致的田野证据。
与 Kieren and Weber (2024)、Kieren et al. (2022) 的信念更新实验相关：这些实验研究了期望型参考点和 loss aversion 在实验室中对信念更新的影响，本文提供了互补的大样本田野证据。

维度2：理论框架

详见上文"理论模型"部分。核心理论对照：

Bayesian 基准：相同先验 + 相同信号 → 相同后验，预测断点处不应出现离散跳跃。
Reference-dependent perception（Koszegi-Rabin 2006；Gagnon-Bartsch & Bushong 2022）：期望作为参考点扭曲对结果的感知，超过期望被感知为更正面信号、未达期望被感知为更负面信号 → 后验信念在断点处出现离散跳跃。
Loss aversion 的不对称性：负面偏离（miss）相比正面偏离（beat）引发更大的感知反应 → |信念变化| 在断点左侧（miss）更大。

维度3：核心发现

详见上文"核心发现"部分。三条关键经验事实：

方向性 RDD 效应：在 Rel. Dev. Est. = 0 处，Optimism Change 出现 +0.12 SD 的离散向上跳跃（p<0.01，首选 specification IV）。
不对称 RDD 效应：在断点处，Absolute Optimism Change 出现约 -0.05 SD 的离散向下跳跃，即 miss 一侧的信念更新幅度系统性大于 beat 一侧，与 loss aversion 一致。
机制启示：事后预测误差分析（Table A2）显示 miss 一侧分析师后续预测误差更大，更接近 reference-dependent inattention 机制；但 misattribution 机制亦无法排除。

维度4：关键变量概览

变量	定义	在分析中的角色
Optimism_{i,j,t}	(EPS Forecast - Consensus) / SD(Forecast)	标准化乐观度
Optimism Change_{i,j,t}	Optimism_{i,j,t} − Optimism_{i,j,t-1}	主因变量（方向性效应）
\|Optimism Change\|	上述变量的绝对值	主因变量（不对称性）
Rel. Dev. Est._{i,j,t-1}	(Actual − Forecast) / Actual	running variable
Meet or Beat_{i,j,t-1}	1 if Rel. Dev. Est. ≥ 0	处理变量（断点指示）
Forecast Error	分析师后续预测的绝对误差	机制检验变量
控制变量组	Covered Firms/Industries、Exp. Years/Firm、Specialization、Forecast Age	分析师特征控制
固定效应	Firm FEs + Analyst-Year-Quarter FEs	控制时变与不变异质性

维度5：局限性

机制识别不完全：作者在三种潜在机制（outcome bias、misattribution of reference-dependent utility、reference-dependent inattention）之间无法清晰区分，仅事后预测误差分析提供间接线索。
外部效度边界：样本仅限于美国 I/B/E/S 覆盖的公司和分析师，结果是否推广到其他金融市场参与者（如 buy-side 分析师、机构投资者）尚未直接检验。
参考点的内生性：本文将分析师自身预测视为参考点，但参考点可能更复杂（如 consensus、上一季度盈利、行业基准），这些替代参考点可能与本文识别的效应交织。
效应规模解释：+0.12 SD 的乐观度跳跃的经济意义（如对股价、预测准确性、资源分配的影响）未做完整定量评估。
RDD 的局部识别属性：识别效应仅适用于断点附近（Rel. Dev. Est. 接近 0 的分析师），无法外推到大幅 beat 或 miss 的情形。
earnings management 的潜在污染：尽管作者通过排除接近共识预测的观测进行了稳健性检验，但公司端的盈利操纵仍可能产生残余影响。

维度6：与其他文献的关系

详见上文"与其他文献的关系"部分。核心定位：

理论根基：Koszegi_Rabin_2007_ReferenceDependentRisk（参考点理论的形式化）。
行为金融基础：Barberis_2015_XCAPM_Extrapolative、Barberis_PsychologyBased_AssetPricing（reference-dependent preferences 在资产定价中的角色）。
信念偏差的相关研究：Frydman_Nave_2017_ExtrapolativeBeliefs_Perceptual_Economic、Grosshans_2018_AllsWell_ReturnsAchieved、Grosshans_Zeisberger_2025_InvestorBeliefs_TradingActions、Fan_InferenceForecastGap_BeliefUpdating。
经验事实文献：Giglio_2021_FiveFacts_BeliefsPortfolios（投资者信念的 stylized facts）。
经验依赖学习：Malmendier_ExperienceEffects_Finance、Malmendier_2020_InvestorExperiences_MarketDynamics（长期经验影响 vs. 本文的短期参考点比较）。
信念更新实验文献：Kieren_Mertes_2024_InformationPartitioning_Beliefs、Heidhues_Koszegi_2023_MisinterpretingYourself（实验室证据与本文田野证据互为补充）。
社会学习与误学习相关：GagnonBartsch_HeterogeneousTastes_SocialMisLearning（与本文同属 Gagnon-Bartsch 研究脉络）。

维度7：可拓展的研究方向

机制识别：设计实验或利用更细的 textual data（如分析师报告文本）区分 outcome bias、misattribution 与 reference-dependent inattention。
替代参考点：检验 consensus 预测、历史 EPS、行业基准等多重参考点的相对作用，并研究它们何时占主导。
市场后果：将分析师的 reference-dependent 偏差与股价反应、盈利公告 drift、跨分析师协同行为相联系，量化对市场效率的影响。
跨市场扩展：将相同 RDD 方法应用于其他金融环境（外汇分析师、宏观预测者、信用评级师）和其他文化/制度背景。
理论模型化：基于本文证据，构建一个内生 reference-dependent learning 的均衡模型，分析其对信息聚合与价格发现的影响。
干预实验：检验 debiasing 训练（如让分析师事先意识到自身预测可能成为参考点）能否减弱该效应。
跨职业比较：比较高经验/高激励分析师与新手分析师的偏差大小，检验经验或市场训练是否减弱 reference dependence。

关键结论

即使是高度专业化、有强经济激励的金融分析师，其信念更新过程也并非纯粹 Bayesian——自身预测作为期望型参考点会在结果落点附近产生约 +0.12 SD 的离散乐观度跳跃。
信念更新表现出 loss-aversion 式的不对称性：预测被 missed 时的更新幅度系统性大于被 beat 时，揭示信念形成本质上是 reference-dependent 的认知过程。这一发现挑战了"专业训练能消除行为偏差"的传统观点，为理解金融市场中的预测偏误、盈利公告 drift 等现象提供了新的微观基础。