The Precision of Subjective Data and the Explanatory Power of Economic Models

元数据

作者: Tilman Drerup, Benjamin Enke, Hans-Martin von Gaudecker
年份: 2017
期刊: Journal of Econometrics
DOI: 10.1016/j.jeconom.2017.06.017
JEL: C35, C51, G11
关键词: Measurement Error, Subjective Expectations, Stock Market Participation

一句话总结

利用 LISS 面板 2,072 个荷兰家庭的激励兼容主观预期数据 + Klein-Vella 半参数双指标模型，证明经济模型 (主观预期 + 风险偏好 + 交易成本) 对股市参与的解释力强烈依赖于个体信念精确度——精确度高的家庭呈现教科书式行为，而精确度低的家庭则像在用经验法则。

研究问题

为什么主观预期对股市参与的统计解释力如此有限？——经典文献 (Ameriks-Kezdi 等) 中 belief moments 的 elasticity 总是被"大幅衰减"
这种衰减究竟是测量误差，还是反映了真实的决策模式异质性？——部分家庭按经济模型思考，另一部分依赖直觉 / 经验法则 / 家人建议
能否用主观数据本身的精确度作为"经济推理倾向"的代理，从而识别异质性而不强加参数链接函数？
传统 Probit/Logit 是否因强加单指标线性结构而错过了精确度调节经济模型解释力的核心模式？

核心贡献

方法创新：将 Klein-Vella (2009) 半参数双指标模型应用于家庭金融——双指标 (经济模型指标 + 数据精确度指标) 通过非参数链接函数 h(·,·) 决定参与概率，无需对交互形式做假设
5 类信念精确度代理变量：定量 (两次信念测量绝对差异)、自评信心、任务难易度自评，构成多维测量
激励兼容信念引出：Hossain-Okui (2013) 二值化评分规则；球分配法 + 一月后点估计的双重测量
核心实证发现：在精确度第 90 百分位，经济模型解释力跨越 50pp；第 10 百分位仅 25pp——量化了"主观数据质量调节经济模型适用性"
三条证据反驳测量误差解释：(a) 球分配法权重=1 时 R² 最大，加点估计无帮助；(b) 信念不精确家庭参与率系统更低；(c) 实验文献已显示金融素养高者对预期反应更强
概念重构：将"主观预期低质量"从计量误差 (要清洗) 重新定义为有信息含量的信号 (反映决策模式)，为家庭金融、健康经济学、教育决策等使用主观数据的领域提供新视角

维度1：实验设计分析

研究设计

类型: 基于调查与激励实验的实证研究（非实验室实验，而是大规模在线调查 + 激励兼容的信念引出）
数据来源: 荷兰LISS面板（Longitudinal Internet Studies for the Social Sciences），由荷兰统计局人口登记册抽取的概率样本
样本: 2,072个荷兰家庭（金融财富超过1,000欧元的家庭），数据收集于2013年8-9月
因变量: 股市参与（二值变量，=1 若持有股票/债券/基金/期权），样本中约25%的家庭持有风险资产

信念引出方法

主观预期引出: 采用Delavande and Rohwedder (2008)的球分配法（ball allocation procedure），让受试者对AEX指数一年期收益率构建8-bin直方图，拟合对数正态分布获得个体水平的 $\mu^{AEX}_{t+1}$ 和 $\sigma^{AEX}_{t+1}$
点估计: 一个月后（9月）再次询问AEX收益率的点估计，用两次测量之间的绝对差异作为精确度的定量代理
激励机制: 采用Hossain and Okui (2013)的二值化评分规则（binarized scoring rule），每十人随机抽取一人支付，最高100欧元，平均39.66欧元
风险偏好: 采用Falk et al. (2014)"偏好调查模块"的变体，包含质性自我评估和假设性二元彩票选择

精确度代理变量（5类）

定量指标: 两次信念测量（球分配法均值 vs. 点估计）之间的绝对差异（均值11.20，标准差13.57）
信心指标: AEX收益率估计和储蓄账户收益率估计的自评信心（0-10滑块量表）
任务评估: 实验任务的简易程度和清晰程度（五点量表）

计量方法

核心模型: Klein and Vella (2009)半参数双指标（semiparametric double index）二元选择模型
第一指标: 经济模型指标（economic model index），包含主观预期、风险厌恶、交易成本代理
第二指标: 主观数据精确度指标（subjective data precision index），包含信念精确度代理变量
两指标通过非参数链接函数 $h(\cdot, \cdot)$ 映射到股市参与概率
估计方法: 多阶段局部平滑核密度估计 + 半参数最大似然（收敛速度 $\sqrt{N}$ ）
识别条件: 每个指标至少排除另一指标中的一个连续变量；各指标内一个系数标准化
辅助分析: OLS分组回归（按信念差异中位数分样本）作为直觉展示

维度2：理论模型

理论框架：家庭股市参与的经济模型

基于Campbell and Viceira (2002)的投资组合选择模型。家庭最大化期望幂效用：

\theta^{opt} = \arg\max_{\theta} \left\{ \frac{E_t[W_{t+1}(\theta)^{1-\gamma}]}{1-\gamma} \right\} \quad s.t. \quad 0 \leq \theta \leq 1

经对数正态近似和一阶Taylor展开后，最优风险资产份额为：

\theta^{opt} = \frac{\mu^{risky}_{t+1} - \mu^{safe}_{t+1} + \frac{1}{2}(\sigma^{risky}_{t+1})^2}{\gamma (\sigma^{risky}_{t+1})^2}

其中 $\mu^{risky}_{t+1}$ 为风险资产预期收益率， $\mu^{safe}_{t+1}$ 为安全资产预期收益率， $\sigma^{risky}_{t+1}$ 为风险资产收益率标准差， $\gamma$ 为相对风险厌恶系数。

股市参与决策

结合交易成本 $f(X^{ta})$ 和随机扰动 $\varepsilon$ ：

Y \equiv \mathbf{1}\{\theta > 0\} = \begin{cases} 1 & \text{if } \theta^{opt}(\mu^{risky}_{t+1} - \mu^{safe}_{t+1}, \sigma^{risky}_{t+1}, \gamma) - f(X^{ta}) > \varepsilon \\ 0 & \text{otherwise} \end{cases}

核心假说：异质决策模式

部分家庭确实按经济模型思考（结合预期与偏好做决策），其信念测量精确
另一部分家庭依赖家人建议、直觉或经验法则（如"100减年龄"规则），不需要频繁反思股市前景，因此信念测量不精确
后者的 $\varepsilon$ 方差随信念精确度降低而增大（异方差性），且可能有群体特定的均值偏移

半参数双指标模型

P(Y=1 \mid X^{mod}\beta^{mod}, X^{sdp}\beta^{sdp}) = h(X^{mod}\beta^{mod}, X^{sdp}\beta^{sdp})

其中 $h(\cdot,\cdot)$ 为未知的非参数链接函数。通过Bayes定理将其表示为密度比：

P(Y=1 \mid X^{mod}\beta^{mod}, X^{sdp}\beta^{sdp}) = \frac{f_{Y=1}(X^{mod}\beta^{mod}, X^{sdp}\beta^{sdp}) \cdot P(Y=1)}{f(X^{mod}\beta^{mod}, X^{sdp}\beta^{sdp})}

半参数最大似然估计量：

(\hat{\beta}^{mod}_{ml}, \hat{\beta}^{sdp}_{ml}) = \arg\max_{\beta^{mod}, \beta^{sdp}} \sum_{i=1}^{N} \hat{\tau}_i \left[ Y_i \cdot \log \hat{P}_i(\beta^{mod}, \beta^{sdp}) + (1-Y_i) \cdot \log(1 - \hat{P}_i(\beta^{mod}, \beta^{sdp})) \right]

其中 $\hat{\tau}_i$ 为平滑修剪函数，防止密度估计过小。

维度3：核心发现

OLS分组回归的直觉结果（Table 2）

信念精确组（两次测量差异低于中位数，N=1,041）：
- 主观预期均值 $\mu^{AEX}_{t+1}$ 系数 = 0.012***（SE=0.003）
- 主观预期标准差 $\sigma^{AEX}_{t+1}$ 系数 = -0.007*（SE=0.004）
- 风险厌恶系数 = -0.078***（SE=0.013）
- Adj. pseudo R^2 = 25.6%
信念不精确组（差异高于中位数，N=1,031）：
- 主观预期均值系数 = 0.003*（SE=0.002），缩小为精确组的1/4
- 主观预期标准差系数 = -0.001（不显著）
- 风险厌恶系数 = -0.043***（SE=0.011），约为精确组的55%
- Adj. pseudo R^2 = 23.9%
交易成本代理变量（财富、收入等）在两组中方向和大小相似

双指标模型主要结果

链接函数 $h(\cdot,\cdot)$ 的形态（Figure 2）：

预测的股市参与概率在两个指标上均单调递增
效应高度非线性且存在强交互作用
在主观数据精确度第90百分位处：随经济模型指标变化，参与概率从约20%攀升至70%（变化幅度>50个百分点）
在主观数据精确度第10百分位处：随经济模型指标变化，参与概率仅从约5%变化至约30%（最高不超过30%），变化幅度仅约25个百分点
两条线的差异（50pp vs. 25pp）量化了精确度对经济模型解释力的调节作用

平均偏效应（Table 4，连续变量为1标准差变化，二值变量为0到1）：

变量	经济模型通道	精确度通道	组合效应
主观预期超额收益率	+3.4pp	--	+3.4pp
主观预期标准差	-1.4pp	--	-1.4pp
风险厌恶	-3.8pp	--	-3.8pp
信念测量绝对差异	--	-1.4pp	-1.4pp
AEX收益率信心	--	+1.4pp	+1.4pp
高财富（>30000欧元）	+24.7pp	+11.9pp	+37.3pp
高学历	+1.7pp	+8.0pp	+9.8pp

稳健性检验（均支持主要结论）

去除交易成本代理变量：结果基本不变
仅使用均值信念：核心模式依然存在（精确度低时关系平坦，高时敏感）
替代信念度量（Philips N.V.股票收益率）：信念矩偏效应较弱，但交互模式不变
分解风险厌恶度量：金融领域风险厌恶最为重要
控制金融素养：精确度代理变量效应大小基本不变
替代信念分布矩的计算方式（均匀分布/样条插值）：结果高度一致
两指标相关系数 = 0.63

反对纯测量误差解释的三条证据

对两次信念度量取凸组合，最大R^2在球分配法均值权重=1时达到，加入点估计无帮助（若为经典测量误差则取平均应改善拟合）
信念不精确家庭的股市参与率更低（若仅为注意力不足导致的随机误差，参与率应无方向性差异）
实验证据（Armantier et al. 2015; Huck et al. 2014）显示金融素养高者对预期反应更强

维度6：与其他文献的关系

本文在文献中的位置

本文处于主观预期测量、家庭金融和异质决策模式三个文献的交叉点。

与主观预期文献的关系

Manski (2004) 和 Hurd (2009) 记录了主观预期数据中的广泛质量问题（焦点回答、违反概率律、高无回答率），本文将这些"问题"重新解释为有信息含量的信号
Ameriks, Kezdi et al. (2016) 发现主观预期对股票持有有统计显著但"大幅衰减"的解释力，本文提供了衰减的机制解释
Kleinjans and van Soest (2014) 记录了信念聚集在焦点值的现象，本文将其归因于部分受试者确实没有深思熟虑的预期

与家庭金融文献的关系

Campbell and Viceira (2002): 提供投资组合选择的理论基准
Vissing-Jorgensen (2002): 交易成本解释股市非参与
Haliassos and Bertaut (1995): 记录大量家庭不参与股市的事实
von Gaudecker (2015): 记录近半数荷兰人口依赖家人/朋友/专业人士的建议做金融决策

与决策异质性文献的关系

Ameriks and Zeldes (2004): 简单经验法则（如100减年龄）
Kahneman (2011): 直觉式快思考 vs. 审慎式慢思考
Binswanger and Salm (2014): 认知能力在概率使用中的角色
Choi et al. (2014): 社会经济地位高者的偏好测量更一致

方法论贡献

Klein and Vella (2009) 半参数双指标模型的新应用场景：将经济理论的解释力与主观数据精确度以非参数方式交互
相较于标准Probit/Logit，该方法的优势在于允许两指标间高度非线性交互，避免对链接函数施加参数限制

对后续研究的启示

主观数据的"低质量"可能不是测量误差问题，而是反映了决策过程的结构性异质性
信念精确度可作为"经济推理倾向"（propensity to use economic reasoning）的代理变量
该方法可推广至任何使用主观数据的场景，前提是有个体层面的精确度信息

维度4：变量概览

因变量

变量	类型	取值	备注
Y (Stock Market Participation)	二值	=1 若持股票/债券/基金/期权	样本 ~25% 参与

经济模型指标 X^mod 的成分

变量	来源	量纲
μ^AEX_{t+1} (主观预期超额收益率)	球分配法拟合对数正态	% / 年
σ^AEX_{t+1} (主观预期标准差)	球分配法拟合对数正态	% / 年
风险厌恶 γ	Falk et al. (2014) 偏好模块	多维量表
交易成本代理	财富、收入、教育	欧元 / 类别

主观数据精确度指标 X^sdp 的成分

类别	变量	量纲
定量	两次信念测量 (μ^AEX vs 一月后点估计) 的绝对差异	百分点（mean 11.20, sd 13.57）
信心	AEX 收益率自评信心	0-10 滑块
信心	储蓄账户收益率自评信心	0-10 滑块
任务评估	任务简易程度	1-5
任务评估	任务清晰程度	1-5

估计与识别

方法：Klein-Vella (2009) 半参数双指标 ML，多阶段局部平滑核 + 修剪
识别条件：每个指标至少排除另一个指标中的一个连续变量；各指标内一个系数标准化为 1
链接函数：h(·,·) 非参数估计，可显示二维 surface
收敛速度： $\sqrt{N}$ （半参数）

关键样本特征

数据：LISS Panel 2013 年 8-9 月，N = 2,072 家庭（财富 > 1000 EUR）
平均激励支付 39.66 EUR，最高 100 EUR
两指标相关系数：0.63

模型公式

投资组合最优份额：θ^opt = (μ^risky − μ^safe + 0.5σ²) / (γσ²)
参与决策：Y = 1{θ^opt − f(X^ta) > ε}

维度5：局限性

横截面 + 短期跟踪：仅 1 个月间隔的两次信念测量，无法识别信念稳定性 vs 经济推理倾向 vs 注意力波动
单次激励：每 10 人抽 1 人，可能不足以激励所有被试认真做题
单一资产 (AEX)：仅 AEX 一年期收益，未测量个体对其他资产 (债券、外汇、房地产) 的预期
球分配法的认知负担：8-bin 直方图本身可能被低金融素养者误解，导致测得"精确度"混淆了认知能力与决策模式
半参数估计的样本要求：N=2072 对二维核密度估计偏小，估计 surface 在边缘处可能不稳定
未观察直接决策模式：无法直接观察"用经验法则"vs"用经济模型"的家庭，仅能间接推断
荷兰特定：LISS 仅荷兰，股市参与率 (~25%) 和金融素养水平不具普遍代表性
未刻画动态学习：无法识别精确度是稳定特质还是可改善的状态变量
Klein-Vella 模型对识别条件敏感：依赖排除约束，对哪个变量进入哪个指标的选择有主观判断空间
未测试政策含义：未直接评估"教育干预提升信念精确度→改变股市参与"的因果链
风险厌恶测量与经济模型推断混淆：γ 测量本身可能依赖被试的"经济推理倾向"，与精确度内生相关

维度7：可拓展的研究方向

将本框架推广到其他主观数据应用：
- 通胀预期 → 储蓄行为
- 健康风险预期 → 保险购买
- 教育回报预期 → 教育投资
- 死亡率预期 → 退休规划
动态版本：用面板数据估计精确度的时变性，研究金融教育、市场冲击、信息暴露如何改变精确度
金融素养实验干预：随机分配金融教育，看精确度是否提升 + 经济模型解释力是否上升 → 因果识别
机器学习识别决策模式：用 unsupervised clustering 直接识别"经济模型者"vs"经验法则者" mixture types，与精确度指标的对应关系
与认知不确定性研究对接：精确度指标与 Enke_Graeber_2023_CognitiveUncertainty 的 cognitive uncertainty 度量有潜在对应——可比较两类测量的预测力
信念形成过程：用过程追踪 / 反应时数据测量被试在球分配法中的认知投入，分离"无心"vs"无知"
结构估计 mixture 模型：将"经济模型 type"+"启发式 type"明确建模为离散 type 混合，估计各 type 比例及其行为参数
跨国比较：在不同国家 LISS 类似面板上重做，研究精确度异质性的文化 / 制度根源
政策含义量化：模拟"全面提高信念精确度"对总股市参与率的反事实影响，评估金融教育政策成本效益
与社交学习对接：将"依赖家人建议"的家庭子样本与社交网络数据匹配，研究信息扩散对精确度的作用
行为后果异质性：除参与决策外，扩展到资产配置、再平衡频率、错误交易行为，看精确度调节是否同样存在
机器学习预测精确度：用人口学 + 行为变量预测个体精确度，构造 instrument
跨资产 spillover：用本框架研究被试对一个资产的"经济推理倾向"是否扩展到其他资产决策
与情绪/确认偏误结合：信念精确度与 confirmation bias 强度 (e.g. Dickinson_2022_PoliticalIdeology_ConfirmationBias) 的关系

关键结论

决策模式异质性是真实的：不是测量误差，部分家庭真的按经济模型 (预期 + 偏好 + 成本) 思考，另一部分依赖直觉 / 家人建议 / 经验法则
精确度可作为"经济推理倾向"的代理：信念精确度高的家庭，主观预期对参与的弹性是低精确度家庭的 4 倍 (μ^AEX 系数 0.012 vs 0.003)
链接函数高度非线性：在精确度第 90 百分位，经济模型指标可解释 50pp 的参与概率差异；第 10 百分位仅 25pp
三条证据排除测量误差解释：球分配法权重=1 时 R² 最大；信念不精确家庭参与率系统更低；金融素养高者对预期反应更强 (来自实验文献)
方法论意义：Klein-Vella 半参数双指标模型是处理"主观数据质量异质性"的强力工具，不需要参数链接函数即可识别精确度调节效应
政策含义：单纯提高信念测量质量 (e.g. 复杂调查) 可能改善预测，但若决策模式异质本身是结构性的，则需金融教育干预改变决策过程而非数据
将"低质量数据"重新定义：主观预期数据中的焦点回答、违反概率律、回答缺失等"问题"是有信息含量的信号，而非待清理的噪声 — 为整个主观预期文献提供新视角

Drerup_Enke_2017_SubjectiveDataPrecision