CostaGomes_2014_Beliefs_TrustGame_IV

更新于 2026/7/5

Beliefs and Actions in the Trust Game: Creating Instrumental Variables to Estimate the Causal Effect

元数据

  • 作者: Miguel A. Costa-Gomes, Steffen Huck, Georg Weizsacker
  • 期刊: Games and Economic Behavior, 88, 298-309
  • 年份: 2014
  • DOI: http://dx.doi.org/10.1016/j.geb.2014.10.006
  • 关键词: Social capital, Trust game, Instrumental variables, Belief elicitation
  • JEL: C72, C81, C91, D84

一句话总结

通过在连续信任博弈中引入一个仅 trustor 知道实现值、trustee 仅知分布的外生随机偏移 z\in[-0.20, 0.20],把 z 作为对 trustor 一阶信念的"实验室人造工具变量"(labs-as-IV),用 IV-Tobit 估计出信念对转移份额的因果平均边际效应约 0.5(即信念上升 10pp,信任行为上升约 7pp)——首次为信任行为提供 belief-as-cause 的因果证据,并为"实验解释变量内生性"问题提供方法论范式。

研究问题

  1. 实质问题:在信任博弈中,实证文献广泛报告 trustor 一阶信念(关于 trustee 回传比例)与 trustor 转移行为高度正相关。这种相关性多大程度上反映"信念因果驱动行动",多大程度上是遗漏变量(社会规范、互惠倾向、风险偏好)共同决定?
  2. 方法论问题:能否在实验室内人为创设满足相关性、外生性、排除限制的工具变量,从而直接识别"信念→行动"的因果效应?这一方法能否推广到其他实验中解释变量本身具内生性的场景?

核心贡献

  1. 实质贡献:用 IV-Tobit 给出信念对信任行为的因果平均边际效应约 0.5,证明信念是信任的实质性 driver(而非纯相关),且 IV 与 OLS 估计差异不显著说明此情境下内生性偏误并不严重——但 IV 提供了真正的因果可信度。
  2. 方法论贡献:提出 lab-as-IV 框架——通过对 trustee 行动结果加一个 trustor 可观测、trustee 仅知分布的外生扰动 z,使 z 成为 trustor 信念 b_1 的有效工具变量。该方法可推广到任意"决策者信念被另一方行为生成"的实验。
  3. 诊断与稳健性:信念对 z 的斜率 0.841(理论值 1,95% CI 包含 1)证明被试理性使用 z;Kolmogorov-Smirnov 检验显示 Condition I 与 Condition NI 行为分布无差异,证明工具变量"非侵入性"——这两类检验是 lab-as-IV 必须的可信度检验。
  4. 同时博弈设计:用同时行动版本剔除互惠动机干扰,让信念-行动关系成为"纯粹"的信任-期望联系。
  5. 理论补充(Appendix A):构建一个带社会规范与随机惩罚的 2×2 mini trust game,证明在贝叶斯纳什均衡中信念-行动相关性可纯由共同 omitted factor 驱动,从而为 IV 方法提供独立的理论必要性。

维度1:实验设计分析

核心研究问题

信念(beliefs)与行动(actions)之间的相关性是否反映了因果关系?即:trustor 对 trustee 回报行为的一阶信念(first-order beliefs)是否因果地驱动了 trustor 的信任决策?

实验任务:连续信任博弈(Continuous Trust Game)

基本博弈结构:

  • 两名玩家各自初始拥有 100 点
  • Trustor("Participant X")选择转移份额 a_1 \in [0.2, 0.8],即转移 20-80 点
  • 转移金额在传输过程中三倍化,trustee 账户中因此有 160-340 点
  • Trustee("Participant Y")同时选择回传份额 a_2 \in [0.2, 0.8](相对份额,非绝对金额)
  • 关键:trustee 不知道 trustor 的具体转移额,只知道自己账户的总额
  • 博弈为同时行动(simultaneous-move),避免互惠动机的干扰

工具变量(Instrument)的创设

核心创新 -- shift z:

  • 工具变量 z 是一个外生随机偏移,改变 trustee 的实际回传份额
  • z 从均匀分布的 41 个格点 \{-0.20, -0.19, ..., 0, ..., 0.19, 0.20\} 上等概率抽取
  • Trustee 的实际回传份额变为 \tilde{a}_2 = a_2 + z("adjusted transfer share")
  • 信息结构关键
    • Trustor 被告知 z 的存在、分布和具体实现值
    • Trustee 被告知 z 的存在和分布,但不知道 z 的具体值
    • Trustee 的行为因此不受 z 影响(满足外生性)

举例说明:
若 trustor 转移 a_1=0.5(50点),中间账户为 trustor 50点、trustee 250点;trustee 选择 a_2=0.25z=0.05,则实际回传份额为 0.3(=0.25+0.05),trustor 最终125点,trustee 最终175点。

信念引出

  • Trustor 在做出行动后,报告对 trustee "adjusted transfer share" \tilde{a}_2 = a_2 + z 的信念 b_1
  • 采用二次评分规则(Quadratic Scoring Rule)激励相容地引出信念均值:
    $\pi_b = A - c(\tilde{a}_2 - b_1)^2$
  • 参数设置:A = c = 250
  • 在风险中性假设下,报告主观分布均值是最优策略

实验条件

条件 York UCL 总计
Condition I(有工具变量) 124 120 244
Condition NI(无工具变量,控制组) 94 96 190
总计 218 216 434
  • 每位被试在同一 session 中玩两个博弈(连续信任博弈 + 二元信任博弈),加一个信念引出任务
  • 以 2.5 便士/点的汇率兑换现金,平均支付约 13.17 英镑
  • 实验时长约 90 分钟
  • 地点:University College London 和 University of York

实验流程

  1. 被试被随机分配为 trustor 或 trustee
  2. 同时做出各自的行动决策(trustor 选 a_1,trustee 选 a_2
  3. 决策时双方均不知道后续有信念引出环节
  4. Trustor 在做出决策后报告信念 b_1
  5. 在 Condition I 中,trustor 在知道 z 的值后再报告信念
  6. 收集人口统计学信息(教育、收入、认知能力等)
  7. 实验结束后才收取报酬离场

维度2:理论模型

核心识别策略

结构方程(Tobit 模型):

a_{1i}^* = \beta_0 + \beta_1 b_{1i} + \beta_2 \mathbf{x}_i + u_i \tag{2}

其中 a_{1i}^* 是潜变量,观测值 a_{1i} 在 0.2 和 0.8 处双侧截断(censored):

a_{1i} = \begin{cases} 0.2 & \text{if } a_{1i}^* < 0.2 \\ a_{1i}^* & \text{if } 0.2 \le a_{1i}^* \le 0.8 \\ 0.8 & \text{if } a_{1i}^* > 0.8 \end{cases}

线性投影(排除限制的基础):

a_1 = \beta_0 + \beta_1 b_1 + u \tag{1}

工具变量逻辑

  • 外生性z 由计算机独立随机生成,与所有其他变量独立
  • 相关性(第一阶段)z 直接加到 trustee 的回传份额上,进入 trustor 的信念 b_1(因 b_1 是关于 \tilde{a}_2 = a_2 + z 的信念)
  • 排除限制z 仅通过影响信念 b_1 来影响 trustor 的行动 a_1zb_1 所关于的统计量的组成部分,不以其他方式进入交互

信念对 z 的响应验证

Tobit 回归显示信念 b_1z 的斜率为 0.841(标准误 0.116),与理论预测值 1 在统计上不可区分(95% CI: [0.610, 1.072])。79.5% 的 (b_1, z) 观测值落在斜率为1的直线上,表明被试理性地将 z 加到其对 a_2 的基础信念上。

Appendix A 的理论示例

构建了一个 2 \times 2 mini trust game,加入社会规范和随机惩罚机制,证明即使在贝叶斯纳什均衡中,信念与行动的强相关性也可能源于遗漏变量(如社会规范感知、惩罚概率),而非因果关系。这为使用 IV 方法提供了理论动机。


维度3:核心发现

描述性统计(Table 2)

变量 Condition NI Condition I
Trustor 转移份额均值 0.427 (0.218) 0.435 (0.226)
Trustee 转移份额均值 0.306 (0.144) 0.303 (0.150)
Trustor 信念(关于 \tilde{a}_2 -- 0.330 (0.185)
Trustor 信念(关于 a_2 0.350 (0.132) --
Shift z 均值 -- -0.008 (0.121)
  • 两个条件下行为分布无显著差异(Kolmogorov-Smirnov 检验),证明工具变量的引入不具侵入性
  • 仅 4% 的 trustor 报告了"不可接受"的信念(b_1 - z 不在 [0.2, 0.8] 区间内)

主要回归结果

Table 3 -- Condition NI(朴素 OLS/Tobit 基准):

模型 信念对转移份额的平均边际效应 标准误
Tobit(无控制) 0.722 0.126
Tobit(有控制) 0.890 0.123

Table 4 -- Condition I(IV Tobit vs. 朴素 Tobit):

模型 估计方法 信念的平均边际效应 标准误 N \bar{R}^2
(1) Tobit 0.489 0.102 117 0.149
(2) Tobit + 控制 0.536 0.104 116 0.254
(3) IV Tobit 0.519 0.171 117 0.149
(4) IV Tobit + 控制 0.513 0.190 116 0.254

核心发现总结

  1. 因果效应的大小:IV 估计的信念对行动的平均边际效应(proportional effect)约为 0.5,即信念每增加10个百分点,trustor 的转移份额平均增加约 7.2 个百分点(考虑截断效应后的边际效应)
  2. IV vs. OLS 比较:IV 估计(0.519)与朴素 Tobit 估计(0.489-0.722)在统计上不显著不同,表明内生性问题并不严重,但 IV 结果为因果推断提供了更可靠的基础
  3. 潜变量斜率系数:IV Tobit 的潜变量斜率为 1.004(标准误 0.389),与 Condition NI 的 1.317(标准误 0.288)差异不显著(t=0.647)
  4. 缩减形式(Reduced Form)a_1z 的 Tobit 回归平均边际效应为 0.422(标准误 0.168),显著不为零
  5. 第一阶段强度:信念对 z 的斜率 0.841,F 统计量隐含的第一阶段强度充足
  6. 无侵入性:Condition I 和 NI 之间的行为分布无显著差异,排除了工具变量引入对行为的扭曲

Effect Size 解读

  • 信念变化1个标准差(约0.13-0.18),trustor 转移份额变化约 0.07-0.09(约占转移份额标准差的 30-40%)
  • 这一因果效应是实质性的:信念确实是信任行为的重要驱动因素

维度6:与其他文献的关系

在信念-行动因果关系文献中的位置

  • 首次在信任博弈实验中提供一阶信念因果驱动行动的证据(此前仅有相关性证据)
  • 此前文献(Fehr et al. 2003; Bellemare and Kroger 2007; Sapienza et al. 2013; Naef and Schupp 2009)报告了信念与信任之间的强相关,但无法排除遗漏变量偏误
  • 方法论上借鉴了 Ham et al. (2005) 和 Gill and Prowse (2014) 在实验室中创设外生工具变量的先驱工作

与结构模型文献的关系

  • Bellemare, Kroger and van Soest (2008, 2011a) 使用结构计量模型估计信念与行动的协方差
  • Smith (2013) 研究公共品博弈中信念的工具变量
  • 本文方法更直接:无需完整结构模型,仅需标准线性 IV 假设

与信任博弈实验文献的关系

  • 基于 Berg et al. (1995) 连续信任博弈的同时行动版本
  • 前身工作为 Costa-Gomes et al. (2010),该版本中二元信任博弈的工具变量未通过侵入性检验
  • 与 Cox (2004) 等用随机替换对手行动的方法不同:本文操纵的是 trustee 的行动结果,而非替换 trustee 本身

方法论贡献

  • 提出了实验室中创设人工工具变量的一般性方法论框架
  • 可推广至其他解释变量本身具有内生性的实验场景(如态度问卷、幸福感报告、神经数据等)
  • 强调该方法可与结构模型估计结合使用

主要局限

  • 因果效应仅在实验室清洁环境中建立,外部效度需谨慎
  • 线性 IV 规约受样本量限制,非线性模型的统计检验力不足
  • 工具变量仅操纵信念的一个维度(均值),未涉及信念分布的其他特征

维度4:变量概览

类型 变量 定义 / 取值 测量方式
内生解释变量 Trustor 一阶信念 b_1 关于 trustee 调整后回传份额 \tilde{a}_2 = a_2 + z 的均值,∈[0,1] 二次评分规则(QSR),\pi_b = 250 - 250(\tilde{a}_2 - b_1)^2
工具变量 Shift z 41 个等距格点 {−0.20, −0.19, …, 0.20} 等概率抽取 计算机随机生成;trustor 见值,trustee 仅知分布
因变量(潜变量) Trustor 转移份额 a_1^* ∈ ℝ;观测值在 [0.2, 0.8] 双侧截断 决策实验记录
因变量(观测) Trustor 转移份额 a_1 ∈ [0.2, 0.8],对应 20–80 点 决策实验记录
对手行动 Trustee 回传份额 a_2 ∈ [0.2, 0.8] 决策实验记录
派生变量 调整回传份额 \tilde{a}_2 a_2 + z 计算
处理变量 Condition I(有 IV)/ NI(无 IV,控制组) 被试间随机分配
控制变量 人口学 年龄、性别、教育、收入、专业 实验后问卷
控制变量 认知能力 CRT 等测量 实验后任务
控制变量 学校固定效应 York / UCL 设计
信念质量诊断 b_1z 斜率 理论值 1;估计 0.841 (SE 0.116) Tobit 回归
工具变量诊断 行为分布无差异 KS 检验 Condition I vs. NI 非参检验
激励机制 兑换比 2.5 便士/点;平均报酬 £13.17 实验设计
样本量 总计 434(Condition I: 244;NI: 190;York 218 + UCL 216) 招募记录

维度5:局限性

  1. 样本量限制非线性识别:IV-Tobit 在 N=117 下可识别平均边际效应,但非线性 IV 模型(如 IV-probit、control function)的统计检验力不足;潜变量斜率 IV 估计的标准误大(0.389)。
  2. 工具变量仅操纵信念均值z 进入信念分布的均值,未触及高阶矩(方差、偏度、模糊度)——不能识别 ambiguity attitude 或风险偏好对信任的因果效应。
  3. 同时博弈设计排除互惠:虽然这有利于识别 belief→action 通道,但也意味着结果不能直接外推到序贯博弈(trustee 看到 a_1 后再回传),而后者更接近真实信任情境。
  4. 被试理解工具变量的认知负担:4% trustor 报告"不可接受"信念(b_1 - z \notin [0.2, 0.8]),且斜率显著低于 1(0.841)——说明部分被试未完全理解或未完全应用 z。这一非完美第一阶段对 IV 估计有效性的影响未做敏感性分析。
  5. 信念在行动后引出:避免信念测量影响决策,但牺牲了"决策时信念"的直接观测——被试在做决策时的内部信念可能与事后报告的 b_1 不完全一致(参见 Danz_Vesterlund_2022_BeliefElicitation_BIC 关于信念引出激励问题的讨论)。
  6. 外部效度:实验室连续信任博弈的几何抽象远离真实经济信任情境(如借贷、雇佣关系);学生样本(York+UCL)有代表性局限。
  7. 二次评分规则的风险中性假设:QSR 在风险中性下激励相容,但若被试风险规避,引出的可能不是均值;Hossain-Okui binary scoring 等替代方法未被使用。
  8. 未刻画异质性:信念-行动因果效应的强度可能因社会规范认同、性别、文化背景异质——文中给出的是平均效应,未做条件异质处理。

维度7:可拓展的研究方向

  1. 多维信念识别:用多个独立工具变量(操纵 z 的方差、偏度)识别二阶信念、模糊厌恶、风险态度对信任的独立因果贡献。
  2. 序贯博弈情境下的因果识别:在序贯版本(trustee 见 a_1)中创设新工具变量,分离 belief vs. reciprocity-driven channels。
  3. 跨域复制:将 lab-as-IV 方法移植到公共品博弈(参考 Smith 2013)、最后通牒、合作博弈,建立 belief-as-cause 在亲社会行为中的普遍性证据。
  4. 政策与现场实验:把 z 的设计推广到现场——例如 P2P 借贷平台展示对借款人回款率的随机扰动信号,识别信念冲击对放贷决策的因果效应。
  5. 结合神经测量:在 IV 设计上叠加 fMRI/眼动,刻画信念被工具变量推动时大脑信号通道(信念表征 vs. 价值评估)。
  6. 机器学习 IV:使用 deep IV / double ML 方法处理小样本下的非线性识别问题,提升异质效应估计的精度。
  7. 信念引出方法稳健性:用 binary scoring rule(Hossain_Okui)或 BIC 机制(Danz_Vesterlund_2022_BeliefElicitation_BIC)替换 QSR,检验 IV 估计对引出方法的稳健性。
  8. 结构-IV 整合:把 lab-as-IV 与结构估计(Bellemare_2023_StructuralModels_ExperimentalData)结合,用 IV 矩条件辅助识别结构参数,解决传统结构估计中信念-偏好混淆问题。
  9. 跨文化比较:在高/低社会信任国家重复实验,检验 belief-as-cause 效应大小的文化敏感性。
  10. 动态信任:多回合信任博弈中追踪信念-行动因果关系如何随历史展开演化。

维度6(与其他文献的关系)补充双链

关键结论

  1. 信念是信任的因果驱动:lab-as-IV 估计显示 trustor 一阶信念每上升 10pp,信任转移上升约 7pp,且 IV 与朴素 Tobit 估计在统计上无显著差异——说明在精心设计的同时信任博弈中,belief-action 相关性确实主要由信念因果驱动而非遗漏变量混淆。
  2. lab-as-IV 是新的可推广方法论范式:通过对对手行动结果加一个仅决策者可观测的外生扰动,并辅以"行为分布不变性"与"第一阶段斜率接近理论值"两类诊断,研究者可在任意涉及信念中介的实验中复用此设计——填补了实验经济学中"解释变量内生性"的方法论空白。

标签

#trust_game #beliefs #instrumental_variables #causal_inference #belief_elicitation #experimental_economics #quadratic_scoring_rule #endogeneity #first_order_beliefs