What You See Is All There Is

元数据

作者: Benjamin Enke
单位: Harvard University, Department of Economics
年份: 2020 (CESifo Working Paper No. 8131)
期刊/来源: CESifo Working Papers
JEL: D030, D800, D840
关键词: bounded rationality, mental models, complexity, beliefs, selection neglect, WYSIATI

一句话总结

通过实验室实验证明大量人面对内生样本选择问题时遵循"WYSIATI"启发式（What You See Is All There Is），完全忽略未观察信号并直接用可见样本均值作为总体估计；这种忽视并非源于对选择机制的概念困难，而是因为未观察信号根本未进入心智模型，且其频率随计算复杂度内生增加，可被简单注意力提示（nudge）减少约50%。

研究问题

当存在内生的样本选择（即可见信号是被信息源条件性筛选过的）时，被试能否进行贝叶斯更新，正确推断未观察信号的条件期望？
如果被试系统性地忽视样本选择，这种忽视的根源是什么——是对选择问题的概念性困难（Theory B），还是更一般的"未观察信号未进入心智模型"（Theory A）？
忽视是固定的个人特质，还是随环境复杂度内生变化的参数？反馈、注意力提示等干预能否减少忽视？
忽视在人群中如何分布——连续分布还是离散类型？

核心贡献

干净的因果识别： 在已知数据生成过程下首次系统实验研究样本选择忽视，构建Selected与Control两种处理使信息内容完全相同（用粗略消息提供贝叶斯条件期望），仅信号呈现方式不同。
类型分布发现： 发现人群中是双峰类型分布——60%被试可被刻画为完全贝叶斯（chi=0）或完全忽视（chi=1），可识别类型中87%要么完全理性要么完全忽视，几乎无中间类型。这对"smooth bias"建模假设构成挑战。
机制识别： 通过Random处理（消除选择问题但保留未观察信号）证明忽视不是对选择问题的概念困难，而是更一般的WYSIATI倾向；通过Complex/Simple/Few处理证明忽视参数随计算复杂度内生变化（不应建模为固定外生参数）。
政策含义： 简单的注意力提示（nudge "请注意未展示的抽签"）减少忽视约50%，为去偏干预提供实验证据；反馈则无效。
理论联系： 为Kahneman (2011) 的"WYSIATI"启发式提供严格实验证据；扩展不完整心智模型理论（Esponda & Pouzo, Eyster & Rabin, Jehiel, Schwartzstein, Gabaix, Spiegler等）的实证基础。

核心论点（一句话）

大量实验参与者在面对样本选择问题时，遵循"你看到的就是全部"(WYSIATI) 启发式，完全忽略未观察到的信号，直接用可见样本均值估计总体均值；这种忽视并非源于对选择问题的概念性困难，而主要是因为未观察信号根本未进入决策者的心智模型，且错误心智模型的频率随计算复杂度内生增加。

维度1：实验设计分析

实验平台与被试

地点: University of Bonn, BonnEconLab
软件: z-Tree (Fischbacher, 2007)
招募: hroot (Bock et al., 2014)
被试规模: 共10个处理条件，总计约711名被试（详见Table 3）
- Selected: 74人；Control: 40人；Sequential: 75人；Feedback: 75人
- Random: 75人；Complex: 75人；Simple: 75人；Few: 75人
- Nudge: 72人；Selected replication: 75人
时长: 约50分钟/场次

基本任务结构（Selected处理组详细流程）

实验核心是一个信念诱导任务，被试估计一个未知的"真实状态" theta。

Stage 0 -- 真实状态生成:

计算机从离散均匀分布 X = {50, 70, 90, 110, 130, 150} 中有放回地抽取6个信号 s_k
真实状态 theta = 六个信号的均值（即 theta = sum(s_k)/6）

Stage 1 -- 首信号呈现:

被试观察到6个信号中随机选取的1个信号

Stage 2 -- 二元初始猜测:

被试基于首信号提供激励相容的二元猜测 b_1，判断 theta 高于还是低于100
b_1 属于 {low, high}

Stage 3 -- 信息源呈现额外信号（关键操作差异所在）:

Selected处理组: 信息源有"预算约束"，其行为取决于被试的 b_1
- 若 b_1 = high（猜高于100）：信息源展示所有高于100的信号，但至少展示3个
- 若 b_1 = low（猜低于100）：信息源展示所有低于100的信号，但至少展示3个
- 例：b_1 = high且仅2个信号>100，则展示这2个加1个随机选的<100信号，共3个
- 未被展示的信号称为"未观察信号"（被试不可见）
Control处理组: 信息内容完全相同，但呈现方式不同
- 被试看到Selected组能看到的所有信号
- 同时也看到Selected组看不到的信号的粗略版本（coarse version）
- 粗略版本规则：若未观察信号属于 {50,70,90}，显示为70；若属于 {110,130,150}，显示为130
- 这些粗略消息等于贝叶斯条件期望，因此两组信息内容完全相同

Stage 4 -- 连续信念报告:

被试给出关于 theta 的点估计 b_2，取值范围 [50, 150]，最多两位小数

任务周期

每个周期包含两个屏幕：第一屏看首信号并给 b_1；第二屏看信息源消息并给 b_2
基线设计中被试同时完成两个任务（"变量A"和"变量B"），每周期完成2个任务
共4个周期，即8个信念形成任务
所有被试面对相同的信号实现（Table 2列出全部8组信号配置）

激励机制

16个决策中随机选1个支付
b_2（连续信念）被选中的概率90%，b_1（二元猜测）被选中的概率10%
b_1正确得18欧元，否则得0
b_2使用二次评分规则：pi_i^j = max{0; 18 - 0.2 * (b_i^j - theta^j)^2}
出场费：Feedback组10欧元，其他组6欧元

理解检验

多选题形式的控制问题（如："假设你首次猜测高于100，信息源一定会向你展示哪些抽签？"）
仅在正确回答所有控制问题后才能进入实验
实验者可通过控制室监控屏幕，对有困难的被试当面解释或排除

后续处理组设计

处理组	核心变化	目的
Sequential	与Selected相同但8个任务逐一呈现（非两两同屏）	检验同时呈现是否驱动忽视
Feedback	先做6个练习任务（含反馈），再做8个Selected任务	检验反馈能否减少忽视
Random	信息源随机选择展示信号（非条件于b_1）；真实状态=8个抽签均值	消除样本选择问题，保留未观察信号
Complex	信号空间 = {70,...,70,104,114,128,136,148,150}（复杂数字）	增加计算复杂度
Simple	信号空间 = {70,...,70,130,...,130}（简单二值）	降低计算复杂度
Few	与Complex相同信号空间，但真实状态=2个抽签均值（非6个）	减少信号数量
Nudge	与Selected相同，但屏幕上显示提示："请注意信息源未展示的抽签"	注意力干预
Selected replication	Selected的精确复制，与Nudge同场进行	为Nudge提供组内基准

维度2：理论模型

贝叶斯基准

设 Z(b_1) 为被试屏幕上可见信号集合，N = |Z(b_1)|。贝叶斯后验信念为：

b_B = \frac{\left[\sum_{k=1}^{N} s_{k \in Z(b_1)}\right] + (6-N) \cdot E[s_{k \notin Z(b_1)} | b_1]}{6}

其中第二项是贝叶斯对未观察信号的条件期望推断（当 b_1 = high 时，未观察信号期望为70；当 b_1 = low 时为130）。

忽视基准1：完全WYSIATI（full neglect）

b_{N,1} = \frac{\sum_{k=1}^{N} s_{k \in Z(b_1)}}{N}

直接用可见信号的样本均值估计总体均值，完全忽略未观察信号的存在。

忽视基准2：知道有未观察信号但忽视选择性

b_{N,2} = \frac{\left[\sum_{k=1}^{6} s_{k \in Z(b_1)}\right] + (6-N) E[s_{k \notin Z(b_1)}]}{6}

知道存在未观察信号，但用无条件期望 E[s_k] = 100 代替条件期望（不理解选择机制）。

忽视参数 chi 的估计

信念 b 可表示为贝叶斯信念与完全忽视的加权平均加噪声：

b = (1 - \chi) b_B + \chi \cdot b_{N,1} + \epsilon = b_B + \chi \cdot d + \epsilon

其中：

chi 属于 [0, 1]，chi = 0 为完全贝叶斯，chi = 1 为完全忽视
d = [(6-N)/6] * (可见信号均值 - 未观察信号条件期望)，为扭曲项
epsilon 为均值为零的计算噪声

个体-任务层面的忽视参数估计：

\hat{\chi}_i^j = \frac{b_i^j - b_B^j}{d^j} = \frac{6(b_i^j - b_B^j)}{(6-N^j)(\bar{s}_{k \in Z(b_1)}^j - E[s_{k \notin Z(b_1)}^j | b_{i,1}^j])}

支付函数

\pi_i^j = \max\{0;\; 18 - 0.2 \times (b_i^j - \theta^j)^2\}

维度3：核心发现

主效应：Selected vs. Control

指标	数值	显著性
Selected处理差异（中位回归，无控制）	chi差异 = 0.40	p < 0.01
Selected处理差异（中位回归，含控制）	chi差异 = 0.50	p < 0.01
Selected处理差异（OLS winsorized，含控制）	chi差异 = 0.60	p < 0.01
Selected处理差异（OLS trimmed，含控制）	chi差异 = 0.54	p < 0.01
所有8个任务的Wilcoxon检验	均至少p < 0.10，通常p < 0.01	--

Selected组：中位/平均忽视参数约 chi = 0.49（Selected组），chi_median = 0.42（Sequential组）
Control组：信念接近贝叶斯基准，80%被试被分类为 chi_i = 0

类型分布（双峰结构）

60%的被试可被最佳刻画为完全贝叶斯（chi_i = 0）或完全忽视（chi_i = 1）
在具有稳定可识别类型的被试中，**87%**要么完全理性要么完全忽视
极少有中间类型（部分忽视）

收入差异

Selected组期望利润 = 6.33欧元 vs. Control组 = 10.32欧元（仅信念任务部分）
实际总收入：Control = 17.56欧元 vs. Selected = 12.73欧元

稳健性处理

处理	忽视中位数	忽视均值	与基准比较
Sequential	0.42	0.42	略低于Selected但不显著不同
Feedback	--	与Selected无差异	反馈不能减少忽视

机制检验结果

Random处理（消除选择问题，保留未观察信号）:

行为与Selected非常相似，类型分布统计上无法区分
含义：忽视并非仅因对选择问题的概念困难，而是更一般的WYSIATI倾向

复杂度处理（Complex vs. Simple vs. Few）:

比较	系数（中位回归）	含义
Simple vs. Complex	-0.29 (SE=0.12) 到 -0.26* (SE=0.10)	信号空间简化减少忽视约0.25-0.29个chi单位
Few vs. Complex	-0.29 (SE=0.12) 到 -0.24 (SE=0.10)	信号数量减少降低忽视约0.2-0.3个chi单位
Simple中位忽视	0（均值0.13）	--
Few中位忽视	0（均值0.22）	--
Complex中位忽视	显著高于0	--

Nudge处理（注意力提示）:

Nudge vs. Selected replication：减少忽视约 0.20-0.40 个chi单位（p < 0.05至p < 0.01）
Selected replication中位/均值忽视 = 0.50
Nudge中位忽视 = 0.10，均值 = 0.30
Nudge减少忽视约50%

忽视的相关因素

高中成绩好 -> 忽视更低（系数 -0.13***，中位回归）
反应时间长 -> 忽视更低（系数 -0.25***，中位回归）
但平均反应时间仅48秒，要将信念从完全忽视移动到贝叶斯需增加约4分钟反应时间

维度6：与其他文献的关系

本文所属文献领域

信念更新中的统计推理错误: Benjamin (2018) 综述
样本选择忽视: Koehler & Mercer (2009) 共同基金广告; Brenner, Koehler & Tversky (1996)
信息处理与相关性忽视: Enke & Zimmermann (2019, RES) 是作者此前关于信念形成中关联忽视的工作
不完整心智模型理论: Esponda & Pouzo (2016); Eyster & Rabin (2010); Jehiel (2005); Schwartzstein (2014); Gabaix (2014); Spiegler (2016, 2017); Gagnon-Bartsch, Rabin & Schwartzstein (2018)
朴素直觉统计学家: Fiedler & Juslin (2006); Juslin et al. (2007) -- 心理学中关于人们天真使用样本矩估计总体参数的文献
内生样本选择实验: Esponda & Vespa (2018, QE); Jin, Luca & Martin (2018); Araujo et al. (2018); Charness et al. (2018)

本文核心贡献（相对于已有文献的增量）

首次在已知数据生成过程下系统实验研究样本选择忽视，提供干净的因果识别
发现双峰类型分布：人群中非贝叶斯/完全贝叶斯的二元分类，而非连续分布的忽视程度
深入机制分析：通过三组比较静态实验区分"错误心智模型"（Theory A）vs."概念/计算困难"（Theory B），证据主要支持Theory A
证明忽视参数是内生的：受环境计算复杂度影响，不应被建模为固定的外生参数
简单注意力提示（nudge）可减少约50%的忽视，为去偏策略提供实验证据

与Kahneman (2011) 的联系

标题直接引用Kahneman "Thinking, Fast and Slow" 中的WYSIATI概念
本文为该心理学启发式提供了严格的实验经济学证据
将WYSIATI从心理学隐喻提升为可量化的信念更新偏差参数

本文的局限性

实验室环境中的抽象任务，外部效度有待验证
两个忽视基准（b_{N,1} 与 b_{N,2}）高度相关（rho = 0.99），难以完全区分
被试群体为大学生，可能不代表一般人群
任务中的选择规则对被试完全透明，现实中选择机制往往不透明

维度4：变量概览

自变量

处理组（10种 between-subjects）： Selected, Control, Sequential, Feedback, Random, Complex, Simple, Few, Nudge, Selected replication
可见信号集合 Z(b_1)： 由信息源根据被试初始猜测 b_1 条件性筛选
可见信号数 N = |Z(b_1)|： 取决于真实状态分布与 b_1
信号空间复杂度： 基线{50,70,90,110,130,150}，Complex为{70,...,70,104,114,128,136,148,150}，Simple为{70,130}二值
信号总数（6 vs 2）： Few处理为2个抽签

因变量

二元初始猜测 b_1： {low, high}（关于 theta 是否高于100）
连续点估计 b_2： 取值 [50, 150]
个体-任务忽视参数 chi_i^j： = (b_i^j - b_B^j) / d^j，[0, 1]区间
类型分类： 完全贝叶斯（chi=0）vs 完全忽视（chi=1）vs 中间类型
反应时间

关键基准变量

贝叶斯后验 b_B： 基于可见信号 + 未观察信号的条件期望（70 if b_1=high, 130 if b_1=low）
完全忽视基准 b_{N,1}： 可见信号样本均值
部分忽视基准 b_{N,2}： 知道未观察信号存在但用无条件期望100代替
扭曲项 d： = [(6-N)/6] × (可见均值 - 未观察条件期望)

控制/识别变量

真实状态 theta： 信号均值（跨处理组保持配对相同信号实现）
被试个体特征： 高中成绩、专业、性别、年龄
理解检验通过情况
任务顺序与决策周期： 4个周期 × 2个任务 = 8个信念形成任务

任务时间结构

Stage 0：抽取6个信号（被试不可见）
Stage 1：呈现1个首信号
Stage 2：被试给 b_1（二元猜测）
Stage 3：信息源条件呈现额外信号（Selected）或全部信号+粗略版本（Control）
Stage 4：被试给 b_2（连续点估计）

维度5：局限性

实验设计层面

抽象任务的外部效度： 实验室中抽签和均值估计任务高度抽象，与真实情境（如评估广告中的产品评分）的外部效度有待验证
选择规则透明性： 实验中信息源的选择规则对被试完全透明（指令明确说明"信息源会根据你的猜测展示信号"），现实中样本选择机制往往不透明，效应可能更强或更弱
基准变量高度共线： b_{N,1} 与 b_{N,2} 相关系数 rho = 0.99，难以完全区分"完全WYSIATI"与"知道未观察信号但用无条件期望"这两种忽视模式
大学生样本： 来自Bonn大学学生池，可能不代表一般人群（专业人员、低教育群体的忽视模式可能不同）
激励强度： 二次评分规则下平均决策支付有限，可能不足以激励被试投入足够认知努力

理论解释层面

类型识别的稳健性： 双峰分类基于有限观察（每被试8个任务），类型识别可能受任务实现的随机性影响
未直接观察心智模型： 未通过过程追踪（眼动、verbal protocols）直接验证"未观察信号未进入心智模型"的机制假设
不区分注意力 vs 推理： "WYSIATI"可能是注意力分配问题，也可能是推理能力问题；本设计无法完全区分
复杂度的多维性： Complex条件同时改变了数字易处理性和心算难度，未拆解何种复杂度成分驱动效应

结果稳健性层面

Feedback无效的解释： 6个练习任务的反馈不足以训练贝叶斯更新，但更长时间或更结构化的反馈是否有效未检验
Nudge的持久性： Nudge减少50%忽视的效应是否在重复任务后衰减未知
跨任务异质性： 个体在不同任务中的忽视参数可能不稳定，类型分类可能掩盖任务级波动

维度7：可拓展的研究方向

方向A：机制深化

过程追踪： 用眼动追踪、鼠标追踪、verbal protocols直接观察被试在Selected条件下是否注意到"信号缺失"，验证心智模型假说
神经成像： fMRI比较Selected与Control被试在信念报告时的脑区激活（DLPFC的工作记忆负荷、ACC的冲突检测）
反应时间分解： 用扩散模型（drift-diffusion model）拆解"快速WYSIATI"与"缓慢贝叶斯"的认知过程

方向B：异质性与边界

专家 vs 新手： 统计学家、计量经济学家、贝叶斯研究者是否仍表现WYSIATI；专家训练的迁移性
跨文化： 不同教育系统下WYSIATI的频率差异
儿童与老人： 发展轨迹与认知衰退中的WYSIATI模式
极高激励： 如果决策支付为$1000级别，WYSIATI是否消失

方向C：现实场景应用

金融投资： 投资者评估基金/股票时如何忽视幸存者偏差（survivorship bias）；与 EvenTov_Lourie_2025_AI_RetailInvestorBehavior 关联
医疗决策： 患者评估治疗效果时忽视未发表的负面试验
招聘： HR评估候选人时忽视未观察特质的条件期望
政治： 选民评估政策效果时忽视反事实

方向D：理论扩展

结构估计应用： 将 chi 参数纳入投资、消费、保险等决策模型，量化WYSIATI的福利损失
市场均衡： 当大量决策者有 chi > 0 时，市场如何均衡——是否产生系统性资产误定价
与相关性忽视整合： WYSIATI（忽略未观察信号）vs 相关性忽视（误把相关信号当独立信号），二者是否同源；参见 Enke_Zimmermann_2019_CorrelationNeglect_BeliefFormation
与认知不确定性整合： 高认知不确定性是否增加WYSIATI；参见 Enke_Graeber_2019_CognitiveUncertainty_WP 与 Enke_Graeber_2023_CognitiveUncertainty
与联想记忆整合： WYSIATI是否本质上是associative memory中的检索失败；参见 Enke_Schwerter_2020_AssociativeMemory_BeliefFormation

方向E：去偏干预

更强的Nudge： 视觉化未观察信号（如"灰色框"显示缺失数据），或要求被试明确报告"如果未观察到的信号也展示，结果会怎样"
教育干预： 短期统计训练能否提高对WYSIATI的免疫力
结构化反馈： 不仅给被试"对错"反馈，还显示贝叶斯基准和忽视基准的对比
信息呈现设计： 重新设计信息呈现界面（如"已展示3/6"标识）能否减少WYSIATI

关键图表索引

图表	内容	核心信息
Table 2	8个任务的信号配置及贝叶斯/忽视基准	实验设计的完整参数
Table 4	各任务中两处理组的中位/均值信念	Selected信念系统偏向忽视基准
Table 5	Selected vs. Control回归分析	处理效应0.40-0.60个chi单位
Table 6	Complex vs. Simple vs. Few回归	复杂度降低减少忽视约0.2-0.3
Table 7	Nudge vs. Selected replication回归	Nudge减少忽视约50%
Figure 1	跨处理组的忽视中位/均值比较	Control接近0，Selected/Sequential/Feedback约0.4
Figure 2	忽视类型分布直方图	双峰结构：chi=0和chi=1
Figure 3	Random处理组类型分布	与Selected无法区分，支持WYSIATI
Figure 4	机制处理组跨处理比较	Complex最高，Simple/Few/Nudge显著更低

关键结论

WYSIATI是普遍的信念形成偏差： 在Selected处理下，约一半被试完全忽略未观察信号（chi接近1），相比Control组的近贝叶斯行为（chi接近0），处理效应达 0.40-0.60 个 chi 单位（p<0.01），导致期望利润损失约35%（6.33欧 vs 10.32欧）。这一效应在所有8个任务中均显著。
双峰类型分布而非连续偏差： 60%的被试可被刻画为完全贝叶斯或完全忽视，可识别类型中87%为极端类型，几乎无"部分忽视"中间类型。这对将忽视建模为连续/平滑参数的标准做法构成挑战，提示存在质性的"心智模型差异"。
机制是错误的心智模型而非概念困难： Random处理（消除选择问题但保留未观察信号）的行为与Selected无法区分，证明忽视不是对样本选择机制的概念困难，而是更一般的"未观察信号根本未进入心智模型"。这支持Theory A（错误心智模型）而非Theory B（概念/计算困难）。
忽视参数是内生的： Complex vs Simple vs Few的对比显示信号空间复杂度增加显著提升忽视（约0.25-0.30个chi单位），证明 chi 不应被建模为固定个人特质，而是随环境计算复杂度内生变化的参数。
去偏干预的混合效果： 反馈无效（Feedback与Selected无差异），但简单注意力提示（"请注意未展示的抽签"）减少忽视约50%，证明注意力分配是关键瓶颈。这对政策设计有直接启示——成本极低的提示干预可显著改善决策质量。

Enke_2020_WYSIATI_CorrelationNeglect