Enke_2020_WYSIATI_CorrelationNeglect

更新于 2026/7/5

What You See Is All There Is

元数据

  • 作者: Benjamin Enke
  • 单位: Harvard University, Department of Economics
  • 年份: 2020 (CESifo Working Paper No. 8131)
  • 期刊/来源: CESifo Working Papers
  • JEL: D030, D800, D840
  • 关键词: bounded rationality, mental models, complexity, beliefs, selection neglect, WYSIATI

一句话总结

通过实验室实验证明大量人面对内生样本选择问题时遵循"WYSIATI"启发式(What You See Is All There Is),完全忽略未观察信号并直接用可见样本均值作为总体估计;这种忽视并非源于对选择机制的概念困难,而是因为未观察信号根本未进入心智模型,且其频率随计算复杂度内生增加,可被简单注意力提示(nudge)减少约50%。

研究问题

  1. 当存在内生的样本选择(即可见信号是被信息源条件性筛选过的)时,被试能否进行贝叶斯更新,正确推断未观察信号的条件期望?
  2. 如果被试系统性地忽视样本选择,这种忽视的根源是什么——是对选择问题的概念性困难(Theory B),还是更一般的"未观察信号未进入心智模型"(Theory A)?
  3. 忽视是固定的个人特质,还是随环境复杂度内生变化的参数?反馈、注意力提示等干预能否减少忽视?
  4. 忽视在人群中如何分布——连续分布还是离散类型?

核心贡献

  1. 干净的因果识别: 在已知数据生成过程下首次系统实验研究样本选择忽视,构建Selected与Control两种处理使信息内容完全相同(用粗略消息提供贝叶斯条件期望),仅信号呈现方式不同。
  2. 类型分布发现: 发现人群中是双峰类型分布——60%被试可被刻画为完全贝叶斯(chi=0)或完全忽视(chi=1),可识别类型中87%要么完全理性要么完全忽视,几乎无中间类型。这对"smooth bias"建模假设构成挑战。
  3. 机制识别: 通过Random处理(消除选择问题但保留未观察信号)证明忽视不是对选择问题的概念困难,而是更一般的WYSIATI倾向;通过Complex/Simple/Few处理证明忽视参数随计算复杂度内生变化(不应建模为固定外生参数)。
  4. 政策含义: 简单的注意力提示(nudge "请注意未展示的抽签")减少忽视约50%,为去偏干预提供实验证据;反馈则无效。
  5. 理论联系: 为Kahneman (2011) 的"WYSIATI"启发式提供严格实验证据;扩展不完整心智模型理论(Esponda & Pouzo, Eyster & Rabin, Jehiel, Schwartzstein, Gabaix, Spiegler等)的实证基础。

核心论点(一句话)

大量实验参与者在面对样本选择问题时,遵循"你看到的就是全部"(WYSIATI) 启发式,完全忽略未观察到的信号,直接用可见样本均值估计总体均值;这种忽视并非源于对选择问题的概念性困难,而主要是因为未观察信号根本未进入决策者的心智模型,且错误心智模型的频率随计算复杂度内生增加。


维度1:实验设计分析

实验平台与被试

  • 地点: University of Bonn, BonnEconLab
  • 软件: z-Tree (Fischbacher, 2007)
  • 招募: hroot (Bock et al., 2014)
  • 被试规模: 共10个处理条件,总计约711名被试(详见Table 3)
    • Selected: 74人;Control: 40人;Sequential: 75人;Feedback: 75人
    • Random: 75人;Complex: 75人;Simple: 75人;Few: 75人
    • Nudge: 72人;Selected replication: 75人
  • 时长: 约50分钟/场次

基本任务结构(Selected处理组详细流程)

实验核心是一个信念诱导任务,被试估计一个未知的"真实状态" theta。

Stage 0 -- 真实状态生成:

  • 计算机从离散均匀分布 X = {50, 70, 90, 110, 130, 150} 中有放回地抽取6个信号 s_k
  • 真实状态 theta = 六个信号的均值(即 theta = sum(s_k)/6)

Stage 1 -- 首信号呈现:

  • 被试观察到6个信号中随机选取的1个信号

Stage 2 -- 二元初始猜测:

  • 被试基于首信号提供激励相容的二元猜测 b_1,判断 theta 高于还是低于100
  • b_1 属于 {low, high}

Stage 3 -- 信息源呈现额外信号(关键操作差异所在):

  • Selected处理组: 信息源有"预算约束",其行为取决于被试的 b_1
    • 若 b_1 = high(猜高于100):信息源展示所有高于100的信号,但至少展示3个
    • 若 b_1 = low(猜低于100):信息源展示所有低于100的信号,但至少展示3个
    • 例:b_1 = high且仅2个信号>100,则展示这2个加1个随机选的<100信号,共3个
    • 未被展示的信号称为"未观察信号"(被试不可见)
  • Control处理组: 信息内容完全相同,但呈现方式不同
    • 被试看到Selected组能看到的所有信号
    • 同时也看到Selected组看不到的信号的粗略版本(coarse version)
    • 粗略版本规则:若未观察信号属于 {50,70,90},显示为70;若属于 {110,130,150},显示为130
    • 这些粗略消息等于贝叶斯条件期望,因此两组信息内容完全相同

Stage 4 -- 连续信念报告:

  • 被试给出关于 theta 的点估计 b_2,取值范围 [50, 150],最多两位小数

任务周期

  • 每个周期包含两个屏幕:第一屏看首信号并给 b_1;第二屏看信息源消息并给 b_2
  • 基线设计中被试同时完成两个任务("变量A"和"变量B"),每周期完成2个任务
  • 共4个周期,即8个信念形成任务
  • 所有被试面对相同的信号实现(Table 2列出全部8组信号配置)

激励机制

  • 16个决策中随机选1个支付
  • b_2(连续信念)被选中的概率90%,b_1(二元猜测)被选中的概率10%
  • b_1正确得18欧元,否则得0
  • b_2使用二次评分规则:pi_i^j = max{0; 18 - 0.2 * (b_i^j - theta^j)^2}
  • 出场费:Feedback组10欧元,其他组6欧元

理解检验

  • 多选题形式的控制问题(如:"假设你首次猜测高于100,信息源一定会向你展示哪些抽签?")
  • 仅在正确回答所有控制问题后才能进入实验
  • 实验者可通过控制室监控屏幕,对有困难的被试当面解释或排除

后续处理组设计

处理组 核心变化 目的
Sequential 与Selected相同但8个任务逐一呈现(非两两同屏) 检验同时呈现是否驱动忽视
Feedback 先做6个练习任务(含反馈),再做8个Selected任务 检验反馈能否减少忽视
Random 信息源随机选择展示信号(非条件于b_1);真实状态=8个抽签均值 消除样本选择问题,保留未观察信号
Complex 信号空间 = {70,...,70,104,114,128,136,148,150}(复杂数字) 增加计算复杂度
Simple 信号空间 = {70,...,70,130,...,130}(简单二值) 降低计算复杂度
Few 与Complex相同信号空间,但真实状态=2个抽签均值(非6个) 减少信号数量
Nudge 与Selected相同,但屏幕上显示提示:"请注意信息源未展示的抽签" 注意力干预
Selected replication Selected的精确复制,与Nudge同场进行 为Nudge提供组内基准

维度2:理论模型

贝叶斯基准

设 Z(b_1) 为被试屏幕上可见信号集合,N = |Z(b_1)|。贝叶斯后验信念为:

b_B = \frac{\left[\sum_{k=1}^{N} s_{k \in Z(b_1)}\right] + (6-N) \cdot E[s_{k \notin Z(b_1)} | b_1]}{6}

其中第二项是贝叶斯对未观察信号的条件期望推断(当 b_1 = high 时,未观察信号期望为70;当 b_1 = low 时为130)。

忽视基准1:完全WYSIATI(full neglect)

b_{N,1} = \frac{\sum_{k=1}^{N} s_{k \in Z(b_1)}}{N}

直接用可见信号的样本均值估计总体均值,完全忽略未观察信号的存在。

忽视基准2:知道有未观察信号但忽视选择性

b_{N,2} = \frac{\left[\sum_{k=1}^{6} s_{k \in Z(b_1)}\right] + (6-N) E[s_{k \notin Z(b_1)}]}{6}

知道存在未观察信号,但用无条件期望 E[s_k] = 100 代替条件期望(不理解选择机制)。

忽视参数 chi 的估计

信念 b 可表示为贝叶斯信念与完全忽视的加权平均加噪声:

b = (1 - \chi) b_B + \chi \cdot b_{N,1} + \epsilon = b_B + \chi \cdot d + \epsilon

其中:

  • chi 属于 [0, 1],chi = 0 为完全贝叶斯,chi = 1 为完全忽视
  • d = [(6-N)/6] * (可见信号均值 - 未观察信号条件期望),为扭曲项
  • epsilon 为均值为零的计算噪声

个体-任务层面的忽视参数估计:

\hat{\chi}_i^j = \frac{b_i^j - b_B^j}{d^j} = \frac{6(b_i^j - b_B^j)}{(6-N^j)(\bar{s}_{k \in Z(b_1)}^j - E[s_{k \notin Z(b_1)}^j | b_{i,1}^j])}

支付函数

\pi_i^j = \max\{0;\; 18 - 0.2 \times (b_i^j - \theta^j)^2\}

维度3:核心发现

主效应:Selected vs. Control

指标 数值 显著性
Selected处理差异(中位回归,无控制) chi差异 = 0.40 p < 0.01
Selected处理差异(中位回归,含控制) chi差异 = 0.50 p < 0.01
Selected处理差异(OLS winsorized,含控制) chi差异 = 0.60 p < 0.01
Selected处理差异(OLS trimmed,含控制) chi差异 = 0.54 p < 0.01
所有8个任务的Wilcoxon检验 均至少p < 0.10,通常p < 0.01 --
  • Selected组:中位/平均忽视参数约 chi = 0.49(Selected组),chi_median = 0.42(Sequential组)
  • Control组:信念接近贝叶斯基准,80%被试被分类为 chi_i = 0

类型分布(双峰结构)

  • 60%的被试可被最佳刻画为完全贝叶斯(chi_i = 0)或完全忽视(chi_i = 1)
  • 在具有稳定可识别类型的被试中,**87%**要么完全理性要么完全忽视
  • 极少有中间类型(部分忽视)

收入差异

  • Selected组期望利润 = 6.33欧元 vs. Control组 = 10.32欧元(仅信念任务部分)
  • 实际总收入:Control = 17.56欧元 vs. Selected = 12.73欧元

稳健性处理

处理 忽视中位数 忽视均值 与基准比较
Sequential 0.42 0.42 略低于Selected但不显著不同
Feedback -- 与Selected无差异 反馈不能减少忽视

机制检验结果

Random处理(消除选择问题,保留未观察信号):

  • 行为与Selected非常相似,类型分布统计上无法区分
  • 含义:忽视并非仅因对选择问题的概念困难,而是更一般的WYSIATI倾向

复杂度处理(Complex vs. Simple vs. Few):

比较 系数(中位回归) 含义
Simple vs. Complex -0.29** (SE=0.12) 到 -0.26*** (SE=0.10) 信号空间简化减少忽视约0.25-0.29个chi单位
Few vs. Complex -0.29** (SE=0.12) 到 -0.24** (SE=0.10) 信号数量减少降低忽视约0.2-0.3个chi单位
Simple中位忽视 0(均值0.13) --
Few中位忽视 0(均值0.22) --
Complex中位忽视 显著高于0 --

Nudge处理(注意力提示):

  • Nudge vs. Selected replication:减少忽视约 0.20-0.40 个chi单位(p < 0.05至p < 0.01)
  • Selected replication中位/均值忽视 = 0.50
  • Nudge中位忽视 = 0.10,均值 = 0.30
  • Nudge减少忽视约50%

忽视的相关因素

  • 高中成绩好 -> 忽视更低(系数 -0.13***,中位回归)
  • 反应时间长 -> 忽视更低(系数 -0.25***,中位回归)
  • 但平均反应时间仅48秒,要将信念从完全忽视移动到贝叶斯需增加约4分钟反应时间

维度6:与其他文献的关系

本文所属文献领域

  • 信念更新中的统计推理错误: Benjamin (2018) 综述
  • 样本选择忽视: Koehler & Mercer (2009) 共同基金广告; Brenner, Koehler & Tversky (1996)
  • 信息处理与相关性忽视: Enke & Zimmermann (2019, RES) 是作者此前关于信念形成中关联忽视的工作
  • 不完整心智模型理论: Esponda & Pouzo (2016); Eyster & Rabin (2010); Jehiel (2005); Schwartzstein (2014); Gabaix (2014); Spiegler (2016, 2017); Gagnon-Bartsch, Rabin & Schwartzstein (2018)
  • 朴素直觉统计学家: Fiedler & Juslin (2006); Juslin et al. (2007) -- 心理学中关于人们天真使用样本矩估计总体参数的文献
  • 内生样本选择实验: Esponda & Vespa (2018, QE); Jin, Luca & Martin (2018); Araujo et al. (2018); Charness et al. (2018)

本文核心贡献(相对于已有文献的增量)

  1. 首次在已知数据生成过程下系统实验研究样本选择忽视,提供干净的因果识别
  2. 发现双峰类型分布:人群中非贝叶斯/完全贝叶斯的二元分类,而非连续分布的忽视程度
  3. 深入机制分析:通过三组比较静态实验区分"错误心智模型"(Theory A)vs."概念/计算困难"(Theory B),证据主要支持Theory A
  4. 证明忽视参数是内生的:受环境计算复杂度影响,不应被建模为固定的外生参数
  5. 简单注意力提示(nudge)可减少约50%的忽视,为去偏策略提供实验证据

与Kahneman (2011) 的联系

  • 标题直接引用Kahneman "Thinking, Fast and Slow" 中的WYSIATI概念
  • 本文为该心理学启发式提供了严格的实验经济学证据
  • 将WYSIATI从心理学隐喻提升为可量化的信念更新偏差参数

本文的局限性

  • 实验室环境中的抽象任务,外部效度有待验证
  • 两个忽视基准(b_{N,1} 与 b_{N,2})高度相关(rho = 0.99),难以完全区分
  • 被试群体为大学生,可能不代表一般人群
  • 任务中的选择规则对被试完全透明,现实中选择机制往往不透明

维度4:变量概览

自变量

  • 处理组(10种 between-subjects): Selected, Control, Sequential, Feedback, Random, Complex, Simple, Few, Nudge, Selected replication
  • 可见信号集合 Z(b_1): 由信息源根据被试初始猜测 b_1 条件性筛选
  • 可见信号数 N = |Z(b_1)|: 取决于真实状态分布与 b_1
  • 信号空间复杂度: 基线{50,70,90,110,130,150},Complex为{70,...,70,104,114,128,136,148,150},Simple为{70,130}二值
  • 信号总数(6 vs 2): Few处理为2个抽签

因变量

  • 二元初始猜测 b_1: {low, high}(关于 theta 是否高于100)
  • 连续点估计 b_2: 取值 [50, 150]
  • 个体-任务忽视参数 chi_i^j: = (b_i^j - b_B^j) / d^j,[0, 1]区间
  • 类型分类: 完全贝叶斯(chi=0)vs 完全忽视(chi=1)vs 中间类型
  • 反应时间

关键基准变量

  • 贝叶斯后验 b_B: 基于可见信号 + 未观察信号的条件期望(70 if b_1=high, 130 if b_1=low)
  • 完全忽视基准 b_{N,1}: 可见信号样本均值
  • 部分忽视基准 b_{N,2}: 知道未观察信号存在但用无条件期望100代替
  • 扭曲项 d: = [(6-N)/6] × (可见均值 - 未观察条件期望)

控制/识别变量

  • 真实状态 theta: 信号均值(跨处理组保持配对相同信号实现)
  • 被试个体特征: 高中成绩、专业、性别、年龄
  • 理解检验通过情况
  • 任务顺序与决策周期: 4个周期 × 2个任务 = 8个信念形成任务

任务时间结构

  1. Stage 0:抽取6个信号(被试不可见)
  2. Stage 1:呈现1个首信号
  3. Stage 2:被试给 b_1(二元猜测)
  4. Stage 3:信息源条件呈现额外信号(Selected)或全部信号+粗略版本(Control)
  5. Stage 4:被试给 b_2(连续点估计)

维度5:局限性

实验设计层面

  1. 抽象任务的外部效度: 实验室中抽签和均值估计任务高度抽象,与真实情境(如评估广告中的产品评分)的外部效度有待验证
  2. 选择规则透明性: 实验中信息源的选择规则对被试完全透明(指令明确说明"信息源会根据你的猜测展示信号"),现实中样本选择机制往往不透明,效应可能更强或更弱
  3. 基准变量高度共线: b_{N,1} 与 b_{N,2} 相关系数 rho = 0.99,难以完全区分"完全WYSIATI"与"知道未观察信号但用无条件期望"这两种忽视模式
  4. 大学生样本: 来自Bonn大学学生池,可能不代表一般人群(专业人员、低教育群体的忽视模式可能不同)
  5. 激励强度: 二次评分规则下平均决策支付有限,可能不足以激励被试投入足够认知努力

理论解释层面

  1. 类型识别的稳健性: 双峰分类基于有限观察(每被试8个任务),类型识别可能受任务实现的随机性影响
  2. 未直接观察心智模型: 未通过过程追踪(眼动、verbal protocols)直接验证"未观察信号未进入心智模型"的机制假设
  3. 不区分注意力 vs 推理: "WYSIATI"可能是注意力分配问题,也可能是推理能力问题;本设计无法完全区分
  4. 复杂度的多维性: Complex条件同时改变了数字易处理性和心算难度,未拆解何种复杂度成分驱动效应

结果稳健性层面

  1. Feedback无效的解释: 6个练习任务的反馈不足以训练贝叶斯更新,但更长时间或更结构化的反馈是否有效未检验
  2. Nudge的持久性: Nudge减少50%忽视的效应是否在重复任务后衰减未知
  3. 跨任务异质性: 个体在不同任务中的忽视参数可能不稳定,类型分类可能掩盖任务级波动

维度7:可拓展的研究方向

方向A:机制深化

  1. 过程追踪: 用眼动追踪、鼠标追踪、verbal protocols直接观察被试在Selected条件下是否注意到"信号缺失",验证心智模型假说
  2. 神经成像: fMRI比较Selected与Control被试在信念报告时的脑区激活(DLPFC的工作记忆负荷、ACC的冲突检测)
  3. 反应时间分解: 用扩散模型(drift-diffusion model)拆解"快速WYSIATI"与"缓慢贝叶斯"的认知过程

方向B:异质性与边界

  1. 专家 vs 新手: 统计学家、计量经济学家、贝叶斯研究者是否仍表现WYSIATI;专家训练的迁移性
  2. 跨文化: 不同教育系统下WYSIATI的频率差异
  3. 儿童与老人: 发展轨迹与认知衰退中的WYSIATI模式
  4. 极高激励: 如果决策支付为$1000级别,WYSIATI是否消失

方向C:现实场景应用

  1. 金融投资: 投资者评估基金/股票时如何忽视幸存者偏差(survivorship bias);与 EvenTov_Lourie_2025_AI_RetailInvestorBehavior 关联
  2. 医疗决策: 患者评估治疗效果时忽视未发表的负面试验
  3. 招聘: HR评估候选人时忽视未观察特质的条件期望
  4. 政治: 选民评估政策效果时忽视反事实

方向D:理论扩展

  1. 结构估计应用: 将 chi 参数纳入投资、消费、保险等决策模型,量化WYSIATI的福利损失
  2. 市场均衡: 当大量决策者有 chi > 0 时,市场如何均衡——是否产生系统性资产误定价
  3. 与相关性忽视整合: WYSIATI(忽略未观察信号)vs 相关性忽视(误把相关信号当独立信号),二者是否同源;参见 Enke_Zimmermann_2019_CorrelationNeglect_BeliefFormation
  4. 与认知不确定性整合: 高认知不确定性是否增加WYSIATI;参见 Enke_Graeber_2019_CognitiveUncertainty_WPEnke_Graeber_2023_CognitiveUncertainty
  5. 与联想记忆整合: WYSIATI是否本质上是associative memory中的检索失败;参见 Enke_Schwerter_2020_AssociativeMemory_BeliefFormation

方向E:去偏干预

  1. 更强的Nudge: 视觉化未观察信号(如"灰色框"显示缺失数据),或要求被试明确报告"如果未观察到的信号也展示,结果会怎样"
  2. 教育干预: 短期统计训练能否提高对WYSIATI的免疫力
  3. 结构化反馈: 不仅给被试"对错"反馈,还显示贝叶斯基准和忽视基准的对比
  4. 信息呈现设计: 重新设计信息呈现界面(如"已展示3/6"标识)能否减少WYSIATI

关键图表索引

图表 内容 核心信息
Table 2 8个任务的信号配置及贝叶斯/忽视基准 实验设计的完整参数
Table 4 各任务中两处理组的中位/均值信念 Selected信念系统偏向忽视基准
Table 5 Selected vs. Control回归分析 处理效应0.40-0.60个chi单位
Table 6 Complex vs. Simple vs. Few回归 复杂度降低减少忽视约0.2-0.3
Table 7 Nudge vs. Selected replication回归 Nudge减少忽视约50%
Figure 1 跨处理组的忽视中位/均值比较 Control接近0,Selected/Sequential/Feedback约0.4
Figure 2 忽视类型分布直方图 双峰结构:chi=0和chi=1
Figure 3 Random处理组类型分布 与Selected无法区分,支持WYSIATI
Figure 4 机制处理组跨处理比较 Complex最高,Simple/Few/Nudge显著更低

标签

#belief_updating #selection_neglect #WYSIATI #mental_models #bounded_rationality #experimental_economics #cognitive_complexity #sample_selection #naive_statistician #nudge #Enke

关键结论

  1. WYSIATI是普遍的信念形成偏差: 在Selected处理下,约一半被试完全忽略未观察信号(chi接近1),相比Control组的近贝叶斯行为(chi接近0),处理效应达 0.40-0.60 个 chi 单位(p<0.01),导致期望利润损失约35%(6.33欧 vs 10.32欧)。这一效应在所有8个任务中均显著。
  2. 双峰类型分布而非连续偏差: 60%的被试可被刻画为完全贝叶斯或完全忽视,可识别类型中87%为极端类型,几乎无"部分忽视"中间类型。这对将忽视建模为连续/平滑参数的标准做法构成挑战,提示存在质性的"心智模型差异"。
  3. 机制是错误的心智模型而非概念困难: Random处理(消除选择问题但保留未观察信号)的行为与Selected无法区分,证明忽视不是对样本选择机制的概念困难,而是更一般的"未观察信号根本未进入心智模型"。这支持Theory A(错误心智模型)而非Theory B(概念/计算困难)。
  4. 忽视参数是内生的: Complex vs Simple vs Few的对比显示信号空间复杂度增加显著提升忽视(约0.25-0.30个chi单位),证明 chi 不应被建模为固定个人特质,而是随环境计算复杂度内生变化的参数。
  5. 去偏干预的混合效果: 反馈无效(Feedback与Selected无差异),但简单注意力提示("请注意未展示的抽签")减少忽视约50%,证明注意力分配是关键瓶颈。这对政策设计有直接启示——成本极低的提示干预可显著改善决策质量。