Beliefs and Actions in the Trust Game: Creating Instrumental Variables to Estimate the Causal Effect

元数据

作者: Miguel A. Costa-Gomes, Steffen Huck, Georg Weizsacker
期刊: Games and Economic Behavior, 88, 298-309
年份: 2014
DOI: http://dx.doi.org/10.1016/j.geb.2014.10.006
关键词: Social capital, Trust game, Instrumental variables, Belief elicitation
JEL: C72, C81, C91, D84

一句话总结

通过在连续信任博弈中引入一个仅 trustor 知道实现值、trustee 仅知分布的外生随机偏移 $z\in[-0.20, 0.20]$ ，把 $z$ 作为对 trustor 一阶信念的"实验室人造工具变量"（labs-as-IV），用 IV-Tobit 估计出信念对转移份额的因果平均边际效应约 0.5（即信念上升 10pp，信任行为上升约 7pp）——首次为信任行为提供 belief-as-cause 的因果证据，并为"实验解释变量内生性"问题提供方法论范式。

研究问题

实质问题：在信任博弈中，实证文献广泛报告 trustor 一阶信念（关于 trustee 回传比例）与 trustor 转移行为高度正相关。这种相关性多大程度上反映"信念因果驱动行动"，多大程度上是遗漏变量（社会规范、互惠倾向、风险偏好）共同决定？
方法论问题：能否在实验室内人为创设满足相关性、外生性、排除限制的工具变量，从而直接识别"信念→行动"的因果效应？这一方法能否推广到其他实验中解释变量本身具内生性的场景？

核心贡献

实质贡献：用 IV-Tobit 给出信念对信任行为的因果平均边际效应约 0.5，证明信念是信任的实质性 driver（而非纯相关），且 IV 与 OLS 估计差异不显著说明此情境下内生性偏误并不严重——但 IV 提供了真正的因果可信度。
方法论贡献：提出 lab-as-IV 框架——通过对 trustee 行动结果加一个 trustor 可观测、trustee 仅知分布的外生扰动 $z$ ，使 $z$ 成为 trustor 信念 $b_1$ 的有效工具变量。该方法可推广到任意"决策者信念被另一方行为生成"的实验。
诊断与稳健性：信念对 $z$ 的斜率 0.841（理论值 1，95% CI 包含 1）证明被试理性使用 $z$ ；Kolmogorov-Smirnov 检验显示 Condition I 与 Condition NI 行为分布无差异，证明工具变量"非侵入性"——这两类检验是 lab-as-IV 必须的可信度检验。
同时博弈设计：用同时行动版本剔除互惠动机干扰，让信念-行动关系成为"纯粹"的信任-期望联系。
理论补充（Appendix A）：构建一个带社会规范与随机惩罚的 2×2 mini trust game，证明在贝叶斯纳什均衡中信念-行动相关性可纯由共同 omitted factor 驱动，从而为 IV 方法提供独立的理论必要性。

维度1：实验设计分析

核心研究问题

信念（beliefs）与行动（actions）之间的相关性是否反映了因果关系？即：trustor 对 trustee 回报行为的一阶信念（first-order beliefs）是否因果地驱动了 trustor 的信任决策？

实验任务：连续信任博弈（Continuous Trust Game）

基本博弈结构：

两名玩家各自初始拥有 100 点
Trustor（"Participant X"）选择转移份额 $a_1 \in [0.2, 0.8]$ ，即转移 20-80 点
转移金额在传输过程中三倍化，trustee 账户中因此有 160-340 点
Trustee（"Participant Y"）同时选择回传份额 $a_2 \in [0.2, 0.8]$ （相对份额，非绝对金额）
关键：trustee 不知道 trustor 的具体转移额，只知道自己账户的总额
博弈为同时行动（simultaneous-move），避免互惠动机的干扰

工具变量（Instrument）的创设

核心创新 -- shift z：

工具变量 $z$ 是一个外生随机偏移，改变 trustee 的实际回传份额
$z$ 从均匀分布的 41 个格点 $\{-0.20, -0.19, ..., 0, ..., 0.19, 0.20\}$ 上等概率抽取
Trustee 的实际回传份额变为 $\tilde{a}_2 = a_2 + z$ （"adjusted transfer share"）
信息结构关键：
- Trustor 被告知 $z$ 的存在、分布和具体实现值
- Trustee 被告知 $z$ 的存在和分布，但不知道 $z$ 的具体值
- Trustee 的行为因此不受 $z$ 影响（满足外生性）

举例说明：
若 trustor 转移 $a_1=0.5$ （50点），中间账户为 trustor 50点、trustee 250点；trustee 选择 $a_2=0.25$ ， $z=0.05$ ，则实际回传份额为 $0.3$ （=0.25+0.05），trustor 最终125点，trustee 最终175点。

信念引出

Trustor 在做出行动后，报告对 trustee "adjusted transfer share" $\tilde{a}_2 = a_2 + z$ 的信念 $b_1$
采用二次评分规则（Quadratic Scoring Rule）激励相容地引出信念均值：
$ $\pi_b = A - c(\tilde{a}_2 - b_1)^2$ $
参数设置： $A = c = 250$ 点
在风险中性假设下，报告主观分布均值是最优策略

实验条件

条件	York	UCL	总计
Condition I（有工具变量）	124	120	244
Condition NI（无工具变量，控制组）	94	96	190
总计	218	216	434

每位被试在同一 session 中玩两个博弈（连续信任博弈 + 二元信任博弈），加一个信念引出任务
以 2.5 便士/点的汇率兑换现金，平均支付约 13.17 英镑
实验时长约 90 分钟
地点：University College London 和 University of York

实验流程

被试被随机分配为 trustor 或 trustee
同时做出各自的行动决策（trustor 选 $a_1$ ，trustee 选 $a_2$ ）
决策时双方均不知道后续有信念引出环节
Trustor 在做出决策后报告信念 $b_1$
在 Condition I 中，trustor 在知道 $z$ 的值后再报告信念
收集人口统计学信息（教育、收入、认知能力等）
实验结束后才收取报酬离场

维度2：理论模型

核心识别策略

结构方程（Tobit 模型）：

a_{1i}^* = \beta_0 + \beta_1 b_{1i} + \beta_2 \mathbf{x}_i + u_i \tag{2}

其中 $a_{1i}^*$ 是潜变量，观测值 $a_{1i}$ 在 0.2 和 0.8 处双侧截断（censored）：

a_{1i} = \begin{cases} 0.2 & \text{if } a_{1i}^* < 0.2 \\ a_{1i}^* & \text{if } 0.2 \le a_{1i}^* \le 0.8 \\ 0.8 & \text{if } a_{1i}^* > 0.8 \end{cases}

线性投影（排除限制的基础）：

a_1 = \beta_0 + \beta_1 b_1 + u \tag{1}

工具变量逻辑

外生性： $z$ 由计算机独立随机生成，与所有其他变量独立
相关性（第一阶段）： $z$ 直接加到 trustee 的回传份额上，进入 trustor 的信念 $b_1$ （因 $b_1$ 是关于 $\tilde{a}_2 = a_2 + z$ 的信念）
排除限制： $z$ 仅通过影响信念 $b_1$ 来影响 trustor 的行动 $a_1$ ； $z$ 是 $b_1$ 所关于的统计量的组成部分，不以其他方式进入交互

信念对 z 的响应验证

Tobit 回归显示信念 $b_1$ 对 $z$ 的斜率为 0.841（标准误 0.116），与理论预测值 1 在统计上不可区分（95% CI: [0.610, 1.072]）。79.5% 的 $(b_1, z)$ 观测值落在斜率为1的直线上，表明被试理性地将 $z$ 加到其对 $a_2$ 的基础信念上。

Appendix A 的理论示例

构建了一个 $2 \times 2$ mini trust game，加入社会规范和随机惩罚机制，证明即使在贝叶斯纳什均衡中，信念与行动的强相关性也可能源于遗漏变量（如社会规范感知、惩罚概率），而非因果关系。这为使用 IV 方法提供了理论动机。

维度3：核心发现

描述性统计（Table 2）

变量	Condition NI	Condition I
Trustor 转移份额均值	0.427 (0.218)	0.435 (0.226)
Trustee 转移份额均值	0.306 (0.144)	0.303 (0.150)
Trustor 信念（关于 $\tilde{a}_2$ ）	--	0.330 (0.185)
Trustor 信念（关于 $a_2$ ）	0.350 (0.132)	--
Shift $z$ 均值	--	-0.008 (0.121)

两个条件下行为分布无显著差异（Kolmogorov-Smirnov 检验），证明工具变量的引入不具侵入性
仅 4% 的 trustor 报告了"不可接受"的信念（ $b_1 - z$ 不在 $[0.2, 0.8]$ 区间内）

主要回归结果

Table 3 -- Condition NI（朴素 OLS/Tobit 基准）：

模型	信念对转移份额的平均边际效应	标准误
Tobit（无控制）	0.722	0.126
Tobit（有控制）	0.890	0.123

Table 4 -- Condition I（IV Tobit vs. 朴素 Tobit）：

模型	估计方法	信念的平均边际效应	标准误	N	$\bar{R}^2$
(1)	Tobit	0.489	0.102	117	0.149
(2)	Tobit + 控制	0.536	0.104	116	0.254
(3)	IV Tobit	0.519	0.171	117	0.149
(4)	IV Tobit + 控制	0.513	0.190	116	0.254

核心发现总结

因果效应的大小：IV 估计的信念对行动的平均边际效应（proportional effect）约为 0.5，即信念每增加10个百分点，trustor 的转移份额平均增加约 7.2 个百分点（考虑截断效应后的边际效应）
IV vs. OLS 比较：IV 估计（0.519）与朴素 Tobit 估计（0.489-0.722）在统计上不显著不同，表明内生性问题并不严重，但 IV 结果为因果推断提供了更可靠的基础
潜变量斜率系数：IV Tobit 的潜变量斜率为 1.004（标准误 0.389），与 Condition NI 的 1.317（标准误 0.288）差异不显著（t=0.647）
缩减形式（Reduced Form）： $a_1$ 对 $z$ 的 Tobit 回归平均边际效应为 0.422（标准误 0.168），显著不为零
第一阶段强度：信念对 $z$ 的斜率 0.841，F 统计量隐含的第一阶段强度充足
无侵入性：Condition I 和 NI 之间的行为分布无显著差异，排除了工具变量引入对行为的扭曲

Effect Size 解读

信念变化1个标准差（约0.13-0.18），trustor 转移份额变化约 0.07-0.09（约占转移份额标准差的 30-40%）
这一因果效应是实质性的：信念确实是信任行为的重要驱动因素

维度6：与其他文献的关系

在信念-行动因果关系文献中的位置

首次在信任博弈实验中提供一阶信念因果驱动行动的证据（此前仅有相关性证据）
此前文献（Fehr et al. 2003; Bellemare and Kroger 2007; Sapienza et al. 2013; Naef and Schupp 2009）报告了信念与信任之间的强相关，但无法排除遗漏变量偏误
方法论上借鉴了 Ham et al. (2005) 和 Gill and Prowse (2014) 在实验室中创设外生工具变量的先驱工作

与结构模型文献的关系

Bellemare, Kroger and van Soest (2008, 2011a) 使用结构计量模型估计信念与行动的协方差
Smith (2013) 研究公共品博弈中信念的工具变量
本文方法更直接：无需完整结构模型，仅需标准线性 IV 假设

与信任博弈实验文献的关系

基于 Berg et al. (1995) 连续信任博弈的同时行动版本
前身工作为 Costa-Gomes et al. (2010)，该版本中二元信任博弈的工具变量未通过侵入性检验
与 Cox (2004) 等用随机替换对手行动的方法不同：本文操纵的是 trustee 的行动结果，而非替换 trustee 本身

方法论贡献

提出了实验室中创设人工工具变量的一般性方法论框架
可推广至其他解释变量本身具有内生性的实验场景（如态度问卷、幸福感报告、神经数据等）
强调该方法可与结构模型估计结合使用

主要局限

因果效应仅在实验室清洁环境中建立，外部效度需谨慎
线性 IV 规约受样本量限制，非线性模型的统计检验力不足
工具变量仅操纵信念的一个维度（均值），未涉及信念分布的其他特征

维度4：变量概览

类型	变量	定义 / 取值	测量方式
内生解释变量	Trustor 一阶信念 $b_1$	关于 trustee 调整后回传份额 $\tilde{a}_2 = a_2 + z$ 的均值，∈[0,1]	二次评分规则（QSR）， $\pi_b = 250 - 250(\tilde{a}_2 - b_1)^2$
工具变量	Shift $z$	41 个等距格点 {−0.20, −0.19, …, 0.20} 等概率抽取	计算机随机生成；trustor 见值，trustee 仅知分布
因变量（潜变量）	Trustor 转移份额 $a_1^*$	∈ ℝ；观测值在 [0.2, 0.8] 双侧截断	决策实验记录
因变量（观测）	Trustor 转移份额 $a_1$	∈ [0.2, 0.8]，对应 20–80 点	决策实验记录
对手行动	Trustee 回传份额 $a_2$	∈ [0.2, 0.8]	决策实验记录
派生变量	调整回传份额 $\tilde{a}_2$	$a_2 + z$	计算
处理变量	Condition	I（有 IV）/ NI（无 IV，控制组）	被试间随机分配
控制变量	人口学	年龄、性别、教育、收入、专业	实验后问卷
控制变量	认知能力	CRT 等测量	实验后任务
控制变量	学校固定效应	York / UCL	设计
信念质量诊断	$b_1$ 对 $z$ 斜率	理论值 1；估计 0.841 (SE 0.116)	Tobit 回归
工具变量诊断	行为分布无差异	KS 检验 Condition I vs. NI	非参检验
激励机制	兑换比	2.5 便士/点；平均报酬 £13.17	实验设计
样本量	总计	434（Condition I: 244；NI: 190；York 218 + UCL 216）	招募记录

维度5：局限性

样本量限制非线性识别：IV-Tobit 在 N=117 下可识别平均边际效应，但非线性 IV 模型（如 IV-probit、control function）的统计检验力不足；潜变量斜率 IV 估计的标准误大（0.389）。
工具变量仅操纵信念均值： $z$ 进入信念分布的均值，未触及高阶矩（方差、偏度、模糊度）——不能识别 ambiguity attitude 或风险偏好对信任的因果效应。
同时博弈设计排除互惠：虽然这有利于识别 belief→action 通道，但也意味着结果不能直接外推到序贯博弈（trustee 看到 $a_1$ 后再回传），而后者更接近真实信任情境。
被试理解工具变量的认知负担：4% trustor 报告"不可接受"信念（ $b_1 - z \notin [0.2, 0.8]$ ），且斜率显著低于 1（0.841）——说明部分被试未完全理解或未完全应用 $z$ 。这一非完美第一阶段对 IV 估计有效性的影响未做敏感性分析。
信念在行动后引出：避免信念测量影响决策，但牺牲了"决策时信念"的直接观测——被试在做决策时的内部信念可能与事后报告的 $b_1$ 不完全一致（参见 Danz_Vesterlund_2022_BeliefElicitation_BIC 关于信念引出激励问题的讨论）。
外部效度：实验室连续信任博弈的几何抽象远离真实经济信任情境（如借贷、雇佣关系）；学生样本（York+UCL）有代表性局限。
二次评分规则的风险中性假设：QSR 在风险中性下激励相容，但若被试风险规避，引出的可能不是均值；Hossain-Okui binary scoring 等替代方法未被使用。
未刻画异质性：信念-行动因果效应的强度可能因社会规范认同、性别、文化背景异质——文中给出的是平均效应，未做条件异质处理。

维度7：可拓展的研究方向

多维信念识别：用多个独立工具变量（操纵 $z$ 的方差、偏度）识别二阶信念、模糊厌恶、风险态度对信任的独立因果贡献。
序贯博弈情境下的因果识别：在序贯版本（trustee 见 $a_1$ ）中创设新工具变量，分离 belief vs. reciprocity-driven channels。
跨域复制：将 lab-as-IV 方法移植到公共品博弈（参考 Smith 2013）、最后通牒、合作博弈，建立 belief-as-cause 在亲社会行为中的普遍性证据。
政策与现场实验：把 $z$ 的设计推广到现场——例如 P2P 借贷平台展示对借款人回款率的随机扰动信号，识别信念冲击对放贷决策的因果效应。
结合神经测量：在 IV 设计上叠加 fMRI/眼动，刻画信念被工具变量推动时大脑信号通道（信念表征 vs. 价值评估）。
机器学习 IV：使用 deep IV / double ML 方法处理小样本下的非线性识别问题，提升异质效应估计的精度。
信念引出方法稳健性：用 binary scoring rule（Hossain_Okui）或 BIC 机制（Danz_Vesterlund_2022_BeliefElicitation_BIC）替换 QSR，检验 IV 估计对引出方法的稳健性。
结构-IV 整合：把 lab-as-IV 与结构估计（Bellemare_2023_StructuralModels_ExperimentalData）结合，用 IV 矩条件辅助识别结构参数，解决传统结构估计中信念-偏好混淆问题。
跨文化比较：在高/低社会信任国家重复实验，检验 belief-as-cause 效应大小的文化敏感性。
动态信任：多回合信任博弈中追踪信念-行动因果关系如何随历史展开演化。

维度6（与其他文献的关系）补充双链

信念引出方法论：Canen_2022_BeliefElicitation_Incentives、Danz_Vesterlund_2022_BeliefElicitation_BIC、Harrison_2017_ScoringRules_SubjectiveProbability、Offerman_2009_TruthSerum_ScoringRules、Peeters_2017_IntervalBeliefs_Elicitation、Wang_Zhang_2020_BeliefElicitation_Methods——本文 QSR 引出方式属于此谱系。
实验数据结构估计：Bellemare_2023_StructuralModels_ExperimentalData——可与本文 IV 方法形成互补。
信念-行为因果识别在其他领域：Grosshans_Zeisberger_2025_InvestorBeliefs_TradingActions（投资行为中的信念-交易因果链条）。
战略意识与认知：Fehr_Huck_2016_StrategicAwareness_CognitiveAbility（同一 Huck 作者的相关博弈认知研究）。

关键结论

信念是信任的因果驱动：lab-as-IV 估计显示 trustor 一阶信念每上升 10pp，信任转移上升约 7pp，且 IV 与朴素 Tobit 估计在统计上无显著差异——说明在精心设计的同时信任博弈中，belief-action 相关性确实主要由信念因果驱动而非遗漏变量混淆。
lab-as-IV 是新的可推广方法论范式：通过对对手行动结果加一个仅决策者可观测的外生扰动，并辅以"行为分布不变性"与"第一阶段斜率接近理论值"两类诊断，研究者可在任意涉及信念中介的实验中复用此设计——填补了实验经济学中"解释变量内生性"的方法论空白。

CostaGomes_2014_Beliefs_TrustGame_IV