Choosing The Best Incentives for Belief Elicitation with an Application to Political Protests

Authors: Nathan Canen, Anujit Chakraborty
Year: 2022 (arXiv: 2210.12549)
Journal: Working Paper
JEL: C81, C93, D74, P00
Keywords: Belief Elicitation, Experimental Designs, Identification, Political Protests

一句话总结

证明三种常用的信念引出激励方案（误差带奖励/二次损失/绝对值损失）会引出信念分布的不同统计量（众数/均值/中位数），并通过重新分析 Cantoni et al. (2019) 的香港抗议田野实验，展示当研究者将引出的众数信念误读为均值信念时，可能错误地拒绝战略互补性假设——约 34.8% 的被试其均值与众数会向相反方向更新。

研究问题

实践中常用的"猜对就给钱"激励方案（被试猜测在真实值 ±Δ 内即获奖）究竟引出的是信念分布的哪个统计量？这一选择在多大程度上影响下游识别策略（如检验战略互补性）？当信念分布不对称时，是否存在一种激励机制能更可靠地引出"行为相关的"均值信念？

核心贡献

理论严密化：首次系统性地形式化证明三种激励方案各自引出众数 (Claim 1)、均值 (Claim 2)、中位数 (Claim 3)，澄清了实证文献长期未明示的假设。
可识别性反例：构造解析与数值反例，证明在战略互补性 (SC) 真实成立的情况下，使用众数引出方案仍可能产生看似拒绝 SC 的回归结果。
量化影响：对 Cantoni et al. (2019) 数据的蒙特卡洛分析显示约 34.8% 被试均值与众数反向更新，问题并非边缘个案。
方法论建议：推荐二次损失支付规则 $B - A(x-r)^2$ 作为引出均值信念的标准方案，因为下游战略互动模型 (线性最佳反应) 通常依赖均值。
实证替代解释：在不否定 Cantoni et al. (2019) 回归数字的前提下，提供"原结果与 SC 兼容"的替代解释。

维度1：实验设计分析

核心研究问题

不同的信念引出（belief elicitation）激励机制如何影响被试报告的信念类型（众数/均值/中位数），以及这种差异如何影响实证结论的识别？

本文性质

本文是一篇方法论/理论论文，不是自己做实验，而是：

理论上证明不同激励方案引出信念分布的不同统计量
重新分析 Cantoni et al. (2019) 的香港抗议实验数据，展示方法论问题的实证后果

三种信念引出方案对比

方案	支付规则	引出的统计量	代表性论文
方案1：误差带奖励	猜测值在真实值 +/- Delta 百分点内获得固定奖金	众数（Mode）	Cantoni et al. (2019), Chen & Yang (2019), Bursztyn et al. (2020)
方案2：二次损失函数	支付 B - A(x-r)^2，其中 r 为报告值，x 为真实值	均值（Mean）	作者推荐
方案3：绝对值损失	支付 B - A\|x-r\|	中位数（Median）	--

Cantoni et al. (2019) 原始实验流程（本文重新分析的对象）

背景： 2016年香港七一反威权游行，HKUST本科生田野实验

Part 1（6月24日，游行前一周）：

招募：向HKUST全体本科生发邮件，1741人回应（1576人为香港本地学生）
报酬：平均HK$205（约US$25）
两个问题：
- (i) 自身参与意愿："Are you planning to participate in the July 1st march in 2016?" （四选项：Yes / 大概率 / 不大可能 / No）
- (ii) 信念引出："Please guess what percentage of the participants from HKUST of this study plan to participate..."，猜测在真实值 +/- 2百分点内获HK$10奖金
结果：16.9%表示计划参加（四舍五入为17%）

Part 2（6月30日，游行前一天）：

1303名学生完成第二次在线问卷，每人HK$25
处理组（随机分配） 获得信息干预："Based on last week's survey, the true percentage of survey participants who plan to attend the July 1st march is 17%."
控制组仅被提醒Part 1的回答
所有人可更新信念报告，同样的 +/- 2百分点激励

Part 3（7月15日，游行后两周）：

1234名香港本地学生完成，每人HK$25
核心结果变量："Did you attend the July 1, 2016 March?"

关键方法论问题

Cantoni et al. (2019) 使用的是方案1（误差带奖励，Delta=2），因此根据本文Claim 1，利润最大化的被试应报告其信念分布的众数而非均值。但原作者将引出的信念解释为均值信念，用于检验战略互补性。

维度2：理论模型

Claim 1：误差带方案引出众数

设 f 为单峰密度函数，m = argmax_x f(x) 为众数，delta = Delta/100。

(i) 若 f 为离散分布且支撑点间距 > delta，则利润最大化报告恰好是 m
(ii) 若 f 可微且单峰（f'(x) <= 0 对 x >= m，f'(x) >= 0 对 x <= m），则最优报告在 [m - delta, m + delta] 内
(iii) 局部单峰的更一般条件下同样成立

证明核心： 期望收益 = integral_{x-delta}^{x+delta} f(y)dy，其导数 C = f(x+delta) - f(x-delta)。在 x+delta <= m 时 C > 0（应增大报告），在 x-delta >= m 时 C < 0（应减小报告），故最优报告在众数附近。

Claim 2：二次损失方案引出均值

被试报告 r 获得支付 B - A(x-r)^2。利润最大化报告为：

r^* = \arg\max_{r \in [0,1]} \int_0^1 (B - A(x-r)^2) f(x)dx = \bar{x} = \int_0^1 x f(x) dx

证明： 等价于最小化 integral (x-r)^2 f(x)dx，展开后与 r 相关的项为 (x_bar - r)^2，故最优报告为均值。这是均方误差最小化的标准结果。

Claim 3：绝对值损失方案引出中位数

被试报告 r 获得支付 B - A|x-r|。

(i) 若 f 连续，integral_0^M f(s)ds = integral_M^1 f(s)ds，则 M 为最优报告
(ii) 若 f 离散，sum_{s_i <= M} f(s_i) = sum_{s_i >= M} f(s_i)，则 M 为最优报告

核心行为方程

个体 i 的参与决策（线性最佳反应）：

P_i = \delta_1 + \delta_2 \mathbb{E}_i P_{-i} + \varepsilon_i

delta_2 > 0：战略互补（Strategic Complements, SC）
delta_2 < 0：战略替代（Strategic Substitutes）
关键：参与决策基于均值信念 E_i P_{-i}，但误差带方案引出的是众数信念

Claim 6：均值与众数可反向更新

假设个体先验信念 p ~ Beta(alpha_i, beta_i)，观察到样本比例 x_hat = 0.17（n=1234）后：

先验均值 mu_i = alpha_i / (alpha_i + beta_i)
先验众数 m_i = (alpha_i - 1) / (alpha_i + beta_i - 2)

任何初始信念满足 mu_i > 0.1707 且 m_i < 0.1698（或反之）的被试，在观察到 x_hat = 0.17 后，其均值与众数必然向相反方向更新。

数值校准的分层模型

将 Cantoni et al. (2019) 的数据解释为异质 Beta 分布的众数：

alpha_i - 1 ~ chi^2(l), beta_i - 1 ~ chi^2(q)，独立
则众数的跨个体分布为 Beta(l/2, q/2)
MLE估计：l/2 = 0.172, q/2 = 1.192（全样本）
对应 E(alpha_i) = 2, Var(alpha_i) = 6; E(beta_i) = 4, Var(beta_i) = 10

维度3：核心发现

理论推导的实证含义

1. 众数与均值的反向更新问题

Figure 1 的校准示例：信念 ~ Beta(1.5, 4)
- 先验众数 = 0.142，先验均值 = 0.273
- 信息干预揭示真实值 = 0.17
- 后验众数上升（向0.17靠近），但后验均值下降（远离0.17）
- 因此使用众数引出方案的研究者会观察到与均值信念方向相反的效应

2. 风格化模型的定量结果（Table 1）

		先验	后验
Group 1 (b^1)	mean	0.1645	0.17
	mode	0.30	0.17
Group 2 (b^2)	mean	0.10	0.127
	mode	0.05	0.17

Group 1：均值从0.1645上升到0.17（超过参与阈值0.165），众数从0.30下降到0.17
观察者看到：引出信念下降（0.30->0.17）的组反而参与了抗议 => 错误拒绝SC

3. 蒙特卡洛模拟的关键发现（Effect Size）

从估计的联合分布中抽取 R = 100,000 组参数
34.8%的被试其均值与众数向相反方向更新
条件：众数在真实值0.17的 +/- 2百分点内比均值有更多概率质量
含义：原始研究中超过三分之一的被试可能报告了与其均值信念更新方向相反的信念变化

4. 模型拟合度（Table 3）

矩	模型估计	数据
平均众数	0.144	0.140
众数方差	0.032	0.024

模型拟合合理，虽然方差略有高估。

对 Cantoni et al. (2019) 结论的替代解释

原文结论：增加他人参与信念的被试反而降低了自身参与意愿 => 拒绝战略互补性
本文论点：该结论依赖于将引出的众数信念等同于均值信念的隐含假设
若信念分布不对称，众数上升可能伴随均值下降，因此原始发现完全兼容战略互补性
本文不是要推翻原始回归结果，而是指出激励方案的选择允许替代解释

维度6：与其他文献的关系

学科领域

实验经济学方法论 / 政治经济学

在信念引出文献中的位置

上游（信念引出方法论）： 本文贡献于 proper scoring rules 文献，但关注的是"近似正确即获奖"这类实践中常见但理论性质不同的方案
同级方法论论文： Danz & Vesterlund (2022) 讨论 BIC 引出问题；Haaland & Roth (2023) 讨论信息实验设计
下游应用文献（被重新分析）：
- Cantoni et al. (2019, QJE)：香港抗议的战略互补性
- Bursztyn et al. (2020, AER)：沙特妇女就业的社会规范
- Chen & Yang (2019, AER)：媒体审查
- Hager et al. (2022a, APSR)：抗议动员
- Jarke-Neuert et al. (2021)：气候抗议中的搭便车

核心贡献

首次系统证明表面相似的信念引出方案（误差带 vs 二次损失 vs 绝对值损失）引出信念分布的不同统计量
构建了具体的反例：在战略互补性成立的情况下，使用众数引出方案仍可能产生看似拒绝SC的回归结果
提供实证量化：约34.8%的被试可能受此问题影响
政策建议：推荐使用二次损失函数方案 B - A(x-r)^2 来引出均值信念

局限性

理论框架假设被试严格利润最大化，未考虑有限理性
数值练习依赖 Beta 分布假设和参数化先验结构
未能直接在实验中验证被试是否确实报告众数（因为是二次分析而非新实验）
34.8%的估计来自简化设定，真实比例可能不同

与本项目的关联

本文对实验信念研究的核心启示：激励方案的微小差异可能根本改变所引出信念的含义。在设计信念引出任务时，必须明确研究问题需要的是信念分布的哪个统计量（均值/众数/中位数），并选择相应的激励机制。使用"猜对就给钱"的方案看似直观，但实际引出的是众数而非均值，这在信念分布不对称时会导致严重的识别问题。

Tags: #belief_elicitation #experimental_design #incentive_design #strategic_complementarity #political_protest #methodology #mode_vs_mean

维度4：变量概览

变量	类型	说明
$r$	被试报告	引出的信念报告值
$f(x)$	个体信念分布	关于他人参与比例 $x$ 的主观分布
$\bar{x}$ / 众数 / 中位数	分布统计量	三种引出方案的对应目标值
$\Delta$ (误差带)	实验设计参数	Cantoni et al. 中 $\Delta = 2$ 百分点
$A, B$	激励参数	二次损失/绝对损失方案的支付参数
$P_i$	行为变量	个体 $i$ 的实际抗议参与决策
$\mathbb{E}_i P_{-i}$	关键解释变量	个体对他人参与率的均值信念
$\delta_2$	待估参数	战略互补/替代系数
$\alpha_i, \beta_i$	个体参数	Beta 信念分布的形状参数
处理组/控制组	实验分组	是否获得"真实参与率17%"信息
真实参与率 $\hat{x} = 0.17$	信息干预内容	来自 Part 1 的样本统计量

维度5：局限性

理性最大化假设：理论框架假设被试严格利润最大化报告，未考虑有限理性、模糊厌恶、近似最优 (epsilon-best) 等行为偏离。
二次分析约束：未在新实验中直接验证被试是否确实报告众数；34.8% 的反向更新比例依赖 Beta 先验和参数化设定。
单峰分布假设：Claim 1 (众数引出) 需要单峰性，多峰信念下激励反应更复杂，实证识别更困难。
忽略报告成本：未建模认知报告成本——找到精确众数 / 均值 / 中位数本身需要计算努力，可能导致对所有方案都报告"近似"值。
二次损失的实操问题：方案 2 引出均值，但需要支付为 $B - A(x-r)^2$ ，其支付函数对被试不直观，可能导致被试不理解机制——即使理论上识别均值，行为响应不一定。
未讨论奖金水平的影响：所有比较假设激励足够大以驱动严格优化，但 HK$10 是否足以诱发精确报告值得商榷。
二元参与决策：分析的最佳反应方程 $P_i = \delta_1 + \delta_2 \mathbb{E}_i P_{-i} + \varepsilon_i$ 是线性的，因此只依赖均值；非线性最佳反应（如阈值模型、协调博弈）下可能依赖众数或其他统计量，激励方案选择应据此调整。

维度6：与其他文献的关系（补充）

同主题方法论：Danz_Vesterlund_2022_BeliefElicitation_BIC 讨论 BDM/BIC 引出机制中被试对复杂支付规则的误解，与本文揭示的"激励方案隐含目标统计量"问题互补——两者共同警示信念引出的隐性陷阱。
信息实验设计：Haaland_Roth_2023_DesigningInformationExperiments 系统讨论信息处理实验设计，本文的批评直接适用于该框架下的信念测量环节。
区间信念：Peeters_2017_IntervalBeliefs_Elicitation 关注引出整个信念分布而非点估计，是绕过本文问题的另一路径。
方法论比较：Wang_Zhang_2020_BeliefElicitation_Methods 对比不同信念引出方法的实操表现。
认知不确定性：Enke_Graeber_2023_CognitiveUncertainty 关注被试对自身信念的不确定性——若被试认为分布很宽，激励方案差异更显著。
信念精度：Drerup_Enke_2017_SubjectiveDataPrecision 讨论主观数据精度——与本文一致，提示实证研究者需明确"我们到底在测什么"。

维度7：可拓展的研究方向

三方案 horse race 实验：在同一被试样本中随机分配三种激励方案，直接测量引出值的系统性差异，验证理论预测。
金融市场资产价格信念：将本文逻辑应用于资产收益预期调查（如 Michigan/UBS/Gallup investor surveys），多数采用类"区间猜测"激励——重新解读其结论可能改变股权溢价之谜的若干实证基础。
政策预期信念：央行通胀预期调查 (FOMC SEP, ECB SPF) 通常无明确激励或采用模糊规则——研究激励改革对预期测量的影响。
结合认知不确定性：在引出信念的同时引出"信念的信念精度"，研究当被试报告自己很不确定时，三方案差异是否扩大。
多峰信念识别：开发能识别多峰信念分布的引出机制，特别是政治极化议题中的双峰信念结构。
机器学习识别"被试在用哪种统计量"：基于报告序列与真实分布的关系反向推断被试的实际报告策略，做实证验证。
替代损失函数的稳健性：探索其他评分规则（quadratic scoring rule, log score, Brier score）的引出性质与稳健性边界。

关键结论

三种实践中常用的信念引出激励方案——误差带奖励、二次损失、绝对值损失——分别引出信念分布的众数、均值、中位数，这些差异不是技术细节，而是直接影响实证识别的关键设计选择。
在 Cantoni et al. (2019) 香港抗议数据上，约 34.8% 被试的均值与众数信念会向相反方向更新；这意味着将"猜测+误差带"方案的报告解释为均值信念可能产生根本性识别错误，使得"看似拒绝战略互补性"的结果完全兼容于真实的战略互补结构。研究者在采用线性最佳反应模型时应优先采用二次损失支付规则。

Canen_2022_BeliefElicitation_Incentives

Choosing The Best Incentives for Belief Elicitation with an Application to Political Protests

一句话总结

研究问题

核心贡献

维度1：实验设计分析

核心研究问题

本文性质

三种信念引出方案对比

Cantoni et al. (2019) 原始实验流程（本文重新分析的对象）

关键方法论问题

维度2：理论模型

Claim 1：误差带方案引出众数

Claim 2：二次损失方案引出均值

Claim 3：绝对值损失方案引出中位数

核心行为方程

Claim 6：均值与众数可反向更新

数值校准的分层模型

维度3：核心发现

理论推导的实证含义

对 Cantoni et al. (2019) 结论的替代解释

维度6：与其他文献的关系

学科领域

在信念引出文献中的位置

核心贡献

局限性

与本项目的关联

维度4：变量概览

维度5：局限性

维度6：与其他文献的关系（补充）

维度7：可拓展的研究方向

关键结论

🔗 链接到这篇笔记