CostaGomes_2014_Beliefs_TrustGame_IV
Beliefs and Actions in the Trust Game: Creating Instrumental Variables to Estimate the Causal Effect
元数据
- 作者: Miguel A. Costa-Gomes, Steffen Huck, Georg Weizsacker
- 期刊: Games and Economic Behavior, 88, 298-309
- 年份: 2014
- DOI: http://dx.doi.org/10.1016/j.geb.2014.10.006
- 关键词: Social capital, Trust game, Instrumental variables, Belief elicitation
- JEL: C72, C81, C91, D84
一句话总结
通过在连续信任博弈中引入一个仅 trustor 知道实现值、trustee 仅知分布的外生随机偏移 z\in[-0.20, 0.20],把 z 作为对 trustor 一阶信念的"实验室人造工具变量"(labs-as-IV),用 IV-Tobit 估计出信念对转移份额的因果平均边际效应约 0.5(即信念上升 10pp,信任行为上升约 7pp)——首次为信任行为提供 belief-as-cause 的因果证据,并为"实验解释变量内生性"问题提供方法论范式。
研究问题
- 实质问题:在信任博弈中,实证文献广泛报告 trustor 一阶信念(关于 trustee 回传比例)与 trustor 转移行为高度正相关。这种相关性多大程度上反映"信念因果驱动行动",多大程度上是遗漏变量(社会规范、互惠倾向、风险偏好)共同决定?
- 方法论问题:能否在实验室内人为创设满足相关性、外生性、排除限制的工具变量,从而直接识别"信念→行动"的因果效应?这一方法能否推广到其他实验中解释变量本身具内生性的场景?
核心贡献
- 实质贡献:用 IV-Tobit 给出信念对信任行为的因果平均边际效应约 0.5,证明信念是信任的实质性 driver(而非纯相关),且 IV 与 OLS 估计差异不显著说明此情境下内生性偏误并不严重——但 IV 提供了真正的因果可信度。
- 方法论贡献:提出 lab-as-IV 框架——通过对 trustee 行动结果加一个 trustor 可观测、trustee 仅知分布的外生扰动 z,使 z 成为 trustor 信念 b_1 的有效工具变量。该方法可推广到任意"决策者信念被另一方行为生成"的实验。
- 诊断与稳健性:信念对 z 的斜率 0.841(理论值 1,95% CI 包含 1)证明被试理性使用 z;Kolmogorov-Smirnov 检验显示 Condition I 与 Condition NI 行为分布无差异,证明工具变量"非侵入性"——这两类检验是 lab-as-IV 必须的可信度检验。
- 同时博弈设计:用同时行动版本剔除互惠动机干扰,让信念-行动关系成为"纯粹"的信任-期望联系。
- 理论补充(Appendix A):构建一个带社会规范与随机惩罚的 2×2 mini trust game,证明在贝叶斯纳什均衡中信念-行动相关性可纯由共同 omitted factor 驱动,从而为 IV 方法提供独立的理论必要性。
维度1:实验设计分析
核心研究问题
信念(beliefs)与行动(actions)之间的相关性是否反映了因果关系?即:trustor 对 trustee 回报行为的一阶信念(first-order beliefs)是否因果地驱动了 trustor 的信任决策?
实验任务:连续信任博弈(Continuous Trust Game)
基本博弈结构:
- 两名玩家各自初始拥有 100 点
- Trustor("Participant X")选择转移份额 a_1 \in [0.2, 0.8],即转移 20-80 点
- 转移金额在传输过程中三倍化,trustee 账户中因此有 160-340 点
- Trustee("Participant Y")同时选择回传份额 a_2 \in [0.2, 0.8](相对份额,非绝对金额)
- 关键:trustee 不知道 trustor 的具体转移额,只知道自己账户的总额
- 博弈为同时行动(simultaneous-move),避免互惠动机的干扰
工具变量(Instrument)的创设
核心创新 -- shift z:
- 工具变量 z 是一个外生随机偏移,改变 trustee 的实际回传份额
- z 从均匀分布的 41 个格点 \{-0.20, -0.19, ..., 0, ..., 0.19, 0.20\} 上等概率抽取
- Trustee 的实际回传份额变为 \tilde{a}_2 = a_2 + z("adjusted transfer share")
- 信息结构关键:
- Trustor 被告知 z 的存在、分布和具体实现值
- Trustee 被告知 z 的存在和分布,但不知道 z 的具体值
- Trustee 的行为因此不受 z 影响(满足外生性)
举例说明:
若 trustor 转移 a_1=0.5(50点),中间账户为 trustor 50点、trustee 250点;trustee 选择 a_2=0.25,z=0.05,则实际回传份额为 0.3(=0.25+0.05),trustor 最终125点,trustee 最终175点。
信念引出
- Trustor 在做出行动后,报告对 trustee "adjusted transfer share" \tilde{a}_2 = a_2 + z 的信念 b_1
- 采用二次评分规则(Quadratic Scoring Rule)激励相容地引出信念均值:
$\pi_b = A - c(\tilde{a}_2 - b_1)^2$ - 参数设置:A = c = 250 点
- 在风险中性假设下,报告主观分布均值是最优策略
实验条件
| 条件 | York | UCL | 总计 |
|---|---|---|---|
| Condition I(有工具变量) | 124 | 120 | 244 |
| Condition NI(无工具变量,控制组) | 94 | 96 | 190 |
| 总计 | 218 | 216 | 434 |
- 每位被试在同一 session 中玩两个博弈(连续信任博弈 + 二元信任博弈),加一个信念引出任务
- 以 2.5 便士/点的汇率兑换现金,平均支付约 13.17 英镑
- 实验时长约 90 分钟
- 地点:University College London 和 University of York
实验流程
- 被试被随机分配为 trustor 或 trustee
- 同时做出各自的行动决策(trustor 选 a_1,trustee 选 a_2)
- 决策时双方均不知道后续有信念引出环节
- Trustor 在做出决策后报告信念 b_1
- 在 Condition I 中,trustor 在知道 z 的值后再报告信念
- 收集人口统计学信息(教育、收入、认知能力等)
- 实验结束后才收取报酬离场
维度2:理论模型
核心识别策略
结构方程(Tobit 模型):
其中 a_{1i}^* 是潜变量,观测值 a_{1i} 在 0.2 和 0.8 处双侧截断(censored):
线性投影(排除限制的基础):
工具变量逻辑
- 外生性:z 由计算机独立随机生成,与所有其他变量独立
- 相关性(第一阶段):z 直接加到 trustee 的回传份额上,进入 trustor 的信念 b_1(因 b_1 是关于 \tilde{a}_2 = a_2 + z 的信念)
- 排除限制:z 仅通过影响信念 b_1 来影响 trustor 的行动 a_1;z 是 b_1 所关于的统计量的组成部分,不以其他方式进入交互
信念对 z 的响应验证
Tobit 回归显示信念 b_1 对 z 的斜率为 0.841(标准误 0.116),与理论预测值 1 在统计上不可区分(95% CI: [0.610, 1.072])。79.5% 的 (b_1, z) 观测值落在斜率为1的直线上,表明被试理性地将 z 加到其对 a_2 的基础信念上。
Appendix A 的理论示例
构建了一个 2 \times 2 mini trust game,加入社会规范和随机惩罚机制,证明即使在贝叶斯纳什均衡中,信念与行动的强相关性也可能源于遗漏变量(如社会规范感知、惩罚概率),而非因果关系。这为使用 IV 方法提供了理论动机。
维度3:核心发现
描述性统计(Table 2)
| 变量 | Condition NI | Condition I |
|---|---|---|
| Trustor 转移份额均值 | 0.427 (0.218) | 0.435 (0.226) |
| Trustee 转移份额均值 | 0.306 (0.144) | 0.303 (0.150) |
| Trustor 信念(关于 \tilde{a}_2) | -- | 0.330 (0.185) |
| Trustor 信念(关于 a_2) | 0.350 (0.132) | -- |
| Shift z 均值 | -- | -0.008 (0.121) |
- 两个条件下行为分布无显著差异(Kolmogorov-Smirnov 检验),证明工具变量的引入不具侵入性
- 仅 4% 的 trustor 报告了"不可接受"的信念(b_1 - z 不在 [0.2, 0.8] 区间内)
主要回归结果
Table 3 -- Condition NI(朴素 OLS/Tobit 基准):
| 模型 | 信念对转移份额的平均边际效应 | 标准误 |
|---|---|---|
| Tobit(无控制) | 0.722 | 0.126 |
| Tobit(有控制) | 0.890 | 0.123 |
Table 4 -- Condition I(IV Tobit vs. 朴素 Tobit):
| 模型 | 估计方法 | 信念的平均边际效应 | 标准误 | N | \bar{R}^2 |
|---|---|---|---|---|---|
| (1) | Tobit | 0.489 | 0.102 | 117 | 0.149 |
| (2) | Tobit + 控制 | 0.536 | 0.104 | 116 | 0.254 |
| (3) | IV Tobit | 0.519 | 0.171 | 117 | 0.149 |
| (4) | IV Tobit + 控制 | 0.513 | 0.190 | 116 | 0.254 |
核心发现总结
- 因果效应的大小:IV 估计的信念对行动的平均边际效应(proportional effect)约为 0.5,即信念每增加10个百分点,trustor 的转移份额平均增加约 7.2 个百分点(考虑截断效应后的边际效应)
- IV vs. OLS 比较:IV 估计(0.519)与朴素 Tobit 估计(0.489-0.722)在统计上不显著不同,表明内生性问题并不严重,但 IV 结果为因果推断提供了更可靠的基础
- 潜变量斜率系数:IV Tobit 的潜变量斜率为 1.004(标准误 0.389),与 Condition NI 的 1.317(标准误 0.288)差异不显著(t=0.647)
- 缩减形式(Reduced Form):a_1 对 z 的 Tobit 回归平均边际效应为 0.422(标准误 0.168),显著不为零
- 第一阶段强度:信念对 z 的斜率 0.841,F 统计量隐含的第一阶段强度充足
- 无侵入性:Condition I 和 NI 之间的行为分布无显著差异,排除了工具变量引入对行为的扭曲
Effect Size 解读
- 信念变化1个标准差(约0.13-0.18),trustor 转移份额变化约 0.07-0.09(约占转移份额标准差的 30-40%)
- 这一因果效应是实质性的:信念确实是信任行为的重要驱动因素
维度6:与其他文献的关系
在信念-行动因果关系文献中的位置
- 首次在信任博弈实验中提供一阶信念因果驱动行动的证据(此前仅有相关性证据)
- 此前文献(Fehr et al. 2003; Bellemare and Kroger 2007; Sapienza et al. 2013; Naef and Schupp 2009)报告了信念与信任之间的强相关,但无法排除遗漏变量偏误
- 方法论上借鉴了 Ham et al. (2005) 和 Gill and Prowse (2014) 在实验室中创设外生工具变量的先驱工作
与结构模型文献的关系
- Bellemare, Kroger and van Soest (2008, 2011a) 使用结构计量模型估计信念与行动的协方差
- Smith (2013) 研究公共品博弈中信念的工具变量
- 本文方法更直接:无需完整结构模型,仅需标准线性 IV 假设
与信任博弈实验文献的关系
- 基于 Berg et al. (1995) 连续信任博弈的同时行动版本
- 前身工作为 Costa-Gomes et al. (2010),该版本中二元信任博弈的工具变量未通过侵入性检验
- 与 Cox (2004) 等用随机替换对手行动的方法不同:本文操纵的是 trustee 的行动结果,而非替换 trustee 本身
方法论贡献
- 提出了实验室中创设人工工具变量的一般性方法论框架
- 可推广至其他解释变量本身具有内生性的实验场景(如态度问卷、幸福感报告、神经数据等)
- 强调该方法可与结构模型估计结合使用
主要局限
- 因果效应仅在实验室清洁环境中建立,外部效度需谨慎
- 线性 IV 规约受样本量限制,非线性模型的统计检验力不足
- 工具变量仅操纵信念的一个维度(均值),未涉及信念分布的其他特征
维度4:变量概览
| 类型 | 变量 | 定义 / 取值 | 测量方式 |
|---|---|---|---|
| 内生解释变量 | Trustor 一阶信念 b_1 | 关于 trustee 调整后回传份额 \tilde{a}_2 = a_2 + z 的均值,∈[0,1] | 二次评分规则(QSR),\pi_b = 250 - 250(\tilde{a}_2 - b_1)^2 |
| 工具变量 | Shift z | 41 个等距格点 {−0.20, −0.19, …, 0.20} 等概率抽取 | 计算机随机生成;trustor 见值,trustee 仅知分布 |
| 因变量(潜变量) | Trustor 转移份额 a_1^* | ∈ ℝ;观测值在 [0.2, 0.8] 双侧截断 | 决策实验记录 |
| 因变量(观测) | Trustor 转移份额 a_1 | ∈ [0.2, 0.8],对应 20–80 点 | 决策实验记录 |
| 对手行动 | Trustee 回传份额 a_2 | ∈ [0.2, 0.8] | 决策实验记录 |
| 派生变量 | 调整回传份额 \tilde{a}_2 | a_2 + z | 计算 |
| 处理变量 | Condition | I(有 IV)/ NI(无 IV,控制组) | 被试间随机分配 |
| 控制变量 | 人口学 | 年龄、性别、教育、收入、专业 | 实验后问卷 |
| 控制变量 | 认知能力 | CRT 等测量 | 实验后任务 |
| 控制变量 | 学校固定效应 | York / UCL | 设计 |
| 信念质量诊断 | b_1 对 z 斜率 | 理论值 1;估计 0.841 (SE 0.116) | Tobit 回归 |
| 工具变量诊断 | 行为分布无差异 | KS 检验 Condition I vs. NI | 非参检验 |
| 激励机制 | 兑换比 | 2.5 便士/点;平均报酬 £13.17 | 实验设计 |
| 样本量 | 总计 | 434(Condition I: 244;NI: 190;York 218 + UCL 216) | 招募记录 |
维度5:局限性
- 样本量限制非线性识别:IV-Tobit 在 N=117 下可识别平均边际效应,但非线性 IV 模型(如 IV-probit、control function)的统计检验力不足;潜变量斜率 IV 估计的标准误大(0.389)。
- 工具变量仅操纵信念均值:z 进入信念分布的均值,未触及高阶矩(方差、偏度、模糊度)——不能识别 ambiguity attitude 或风险偏好对信任的因果效应。
- 同时博弈设计排除互惠:虽然这有利于识别 belief→action 通道,但也意味着结果不能直接外推到序贯博弈(trustee 看到 a_1 后再回传),而后者更接近真实信任情境。
- 被试理解工具变量的认知负担:4% trustor 报告"不可接受"信念(b_1 - z \notin [0.2, 0.8]),且斜率显著低于 1(0.841)——说明部分被试未完全理解或未完全应用 z。这一非完美第一阶段对 IV 估计有效性的影响未做敏感性分析。
- 信念在行动后引出:避免信念测量影响决策,但牺牲了"决策时信念"的直接观测——被试在做决策时的内部信念可能与事后报告的 b_1 不完全一致(参见 Danz_Vesterlund_2022_BeliefElicitation_BIC 关于信念引出激励问题的讨论)。
- 外部效度:实验室连续信任博弈的几何抽象远离真实经济信任情境(如借贷、雇佣关系);学生样本(York+UCL)有代表性局限。
- 二次评分规则的风险中性假设:QSR 在风险中性下激励相容,但若被试风险规避,引出的可能不是均值;Hossain-Okui binary scoring 等替代方法未被使用。
- 未刻画异质性:信念-行动因果效应的强度可能因社会规范认同、性别、文化背景异质——文中给出的是平均效应,未做条件异质处理。
维度7:可拓展的研究方向
- 多维信念识别:用多个独立工具变量(操纵 z 的方差、偏度)识别二阶信念、模糊厌恶、风险态度对信任的独立因果贡献。
- 序贯博弈情境下的因果识别:在序贯版本(trustee 见 a_1)中创设新工具变量,分离 belief vs. reciprocity-driven channels。
- 跨域复制:将 lab-as-IV 方法移植到公共品博弈(参考 Smith 2013)、最后通牒、合作博弈,建立 belief-as-cause 在亲社会行为中的普遍性证据。
- 政策与现场实验:把 z 的设计推广到现场——例如 P2P 借贷平台展示对借款人回款率的随机扰动信号,识别信念冲击对放贷决策的因果效应。
- 结合神经测量:在 IV 设计上叠加 fMRI/眼动,刻画信念被工具变量推动时大脑信号通道(信念表征 vs. 价值评估)。
- 机器学习 IV:使用 deep IV / double ML 方法处理小样本下的非线性识别问题,提升异质效应估计的精度。
- 信念引出方法稳健性:用 binary scoring rule(Hossain_Okui)或 BIC 机制(Danz_Vesterlund_2022_BeliefElicitation_BIC)替换 QSR,检验 IV 估计对引出方法的稳健性。
- 结构-IV 整合:把 lab-as-IV 与结构估计(Bellemare_2023_StructuralModels_ExperimentalData)结合,用 IV 矩条件辅助识别结构参数,解决传统结构估计中信念-偏好混淆问题。
- 跨文化比较:在高/低社会信任国家重复实验,检验 belief-as-cause 效应大小的文化敏感性。
- 动态信任:多回合信任博弈中追踪信念-行动因果关系如何随历史展开演化。
维度6(与其他文献的关系)补充双链
- 信念引出方法论:Canen_2022_BeliefElicitation_Incentives、Danz_Vesterlund_2022_BeliefElicitation_BIC、Harrison_2017_ScoringRules_SubjectiveProbability、Offerman_2009_TruthSerum_ScoringRules、Peeters_2017_IntervalBeliefs_Elicitation、Wang_Zhang_2020_BeliefElicitation_Methods——本文 QSR 引出方式属于此谱系。
- 实验数据结构估计:Bellemare_2023_StructuralModels_ExperimentalData——可与本文 IV 方法形成互补。
- 信念-行为因果识别在其他领域:Grosshans_Zeisberger_2025_InvestorBeliefs_TradingActions(投资行为中的信念-交易因果链条)。
- 战略意识与认知:Fehr_Huck_2016_StrategicAwareness_CognitiveAbility(同一 Huck 作者的相关博弈认知研究)。
关键结论
- 信念是信任的因果驱动:lab-as-IV 估计显示 trustor 一阶信念每上升 10pp,信任转移上升约 7pp,且 IV 与朴素 Tobit 估计在统计上无显著差异——说明在精心设计的同时信任博弈中,belief-action 相关性确实主要由信念因果驱动而非遗漏变量混淆。
- lab-as-IV 是新的可推广方法论范式:通过对对手行动结果加一个仅决策者可观测的外生扰动,并辅以"行为分布不变性"与"第一阶段斜率接近理论值"两类诊断,研究者可在任意涉及信念中介的实验中复用此设计——填补了实验经济学中"解释变量内生性"的方法论空白。
标签
#trust_game #beliefs #instrumental_variables #causal_inference #belief_elicitation #experimental_economics #quadratic_scoring_rule #endogeneity #first_order_beliefs