Bellemare_2023_StructuralModels_ExperimentalData
Estimation of Structural Models Using Experimental Data From the Lab and the Field
元信息
- 作者: Charles Bellemare (Universite Laval)
- 年份: 2023
- 出版: Cambridge Elements in Behavioural and Experimental Economics
- DOI: 10.1017/9781009362627
- JEL: C93, D63, D84
- 关键词: experimental data, structural models, behavioral economics, data analysis, microeconometrics
- 性质: 方法论综述/教科书性质的Element专著
一句话总结
本文是 Cambridge Elements 系列中的一部方法论专著,系统讲解如何用实验室和田野实验数据来估计行为经济学中的结构模型——通过一阶条件法、随机效用模型和两步间接法,作者展示这些模型大多可用 Stata 内置命令完成,并以委托代理、独裁者博弈、最后通牒、风险/模糊决策、内疚厌恶等多个经典案例提供完整可复制代码。
研究问题
(1) 实验数据相比观测数据,能在多大程度上放松结构估计所需的辅助假设(如关于决策环境、外生性、分布形式的假设)?(2) 行为经济学中的主流偏好模型(不公平厌恶、内疚厌恶、互惠、CRRA 风险偏好、模糊厌恶等)是否可以用实验数据进行可识别的结构估计,使用哪些计量方法最合适?(3) 偏好异质性、决策错误、信念内生性等关键问题如何在结构估计中处理?(4) 如何在样本内与样本外验证结构模型,以及如何利用实验设计本身做模型验证?
核心贡献
- 方法论统一框架:把行为经济学中分散的结构估计实践组织为"一阶条件法(连续选择)+ 随机效用模型(离散选择)+ 两步间接法(参数恢复)"三大支柱。
- 降低入门门槛:系统证明大部分主流模型(F-S 不公平厌恶、CES 利他、内疚厌恶、CRRA 风险偏好等)可用 Stata 内置命令(
clogit,cmxtmixlogit,nl,nlcom)估计,无需自己写最大似然代码。 - 可复制资源:提供完整 Stata
do文件(pamodel.do、altruism.do、discrete.do、guiltaversion.do、beliefs.do)与模拟数据。 - 关键警示:通过 Monte Carlo 演示——忽略偏好异质性会导致 F-S 不公平厌恶参数 β 被高估近一倍;样本内拟合无法区分主观信念模型与理性预期模型,需用样本外预测验证;陈述信念存在内生性,需用控制函数法处理。
- 实验设计与结构估计的接口:明确指出策略方法(每被试多决策)、概率信念引出、模糊投资组合实验等设计如何配合结构估计。
- 直接回应 Keane (2010) 的悲观论:用实验数据估计结构模型可以同时享有 RCT 的内部效度和结构模型的外推能力。
维度1:实验设计分析
实验任务详细流程
本文并非单一实验论文,而是一部系统性方法论专著,通过多个经典实验案例展示如何用实验数据估计结构模型。以下逐一还原各核心案例的实验流程:
案例1:委托代理模型 -- 树木种植公司田野实验 (Shearer 2004; Bellemare & Shearer 2009, 2011)
实验背景:加拿大不列颠哥伦比亚省一家中型树木种植公司,18名工人参与。
实验流程:
- 工人在大面积同质种植地块上工作,每日产出 y_{it} 由生产函数 y_{it} = e_{it} s_{it} 决定(e_{it} 为努力,s_{it} 为随机天气等因素)
- 工人获得计件工资 r_{it}(每单位产出的报酬),公司随机将不同计件费率分配给不同处理组的工人
- 礼物处理(Gift treatment):种植的第二天(周五),公司向每位工人额外提供80美元礼物,告知为一次性事件
- 记录工人在有礼物和无礼物条件下的每日产出数据
- 通过比较礼物前后的产出变化,结合结构模型估计互惠偏好参数 \beta 和努力成本弹性 \gamma
关键设计特征:计件费率的随机分配使得 r_{it} 对于给定 s_{it} 在工人间外生变化,从而可以用简单线性回归估计结构参数。
案例2:独裁者博弈中的利他偏好 (Andreoni & Miller 2002)
实验流程:
- 被试扮演独裁者角色,做出8至11个分配决策
- 每个决策中,设计变化了待分享盈余的金额和分享成本
- 被试在开放式问题中选择保留给自己和分享给对方的金额
- 利用CES效用函数 V_i = [\alpha(\pi_i^d)^\rho + (1-\alpha)(\pi_i^o)^\rho]^{1/\rho} 来刻画替代弹性
发现:43%的被试可被精确分类为自私型、Leontief型(收益均等化)或完全替代型。
案例3:最后通牒博弈中的Fehr-Schmidt (1999) 偏好估计
实验流程:
- 提议者从10种可能的份额中选择一个报价(占总禀赋的0%, 10%, 20%,..., 100%)
- 回应者使用策略方法(strategy method):对10种可能报价中的每一种,事先决定接受或拒绝
- 每个回应者做出10个二元选择(接受/拒绝),形成完整的决策档案
模拟实验设计(Table 1中的Monte Carlo练习):
- N=100个回应者
- 偏好参数从以下数据生成过程中抽取:\alpha_i = 0.5 + u_i^\alpha,\beta_i = 0.3 + u_i^\beta,其中 u_i^\alpha, u_i^\beta \sim N(0, 0.5),Corr(u_i^\alpha, u_i^\beta)=0.5,\lambda=0.5
- 比较使用1个决策/被试 vs. 10个决策/被试的估计精度
案例4:风险偏好估计 -- Holt & Laury (2002) 型彩票选择
实验流程:
- 被试面对10个二元彩票选择的菜单
- 每对彩票的高/低回报固定不变,但发生概率在10个决策中系统变化
- 菜单结构使得被试应在某点"切换"——从偏好一个彩票转向偏好另一个
- 利用CRRA或CARA效用函数估计风险偏好参数 \theta
案例5:内疚厌恶与信念依赖互惠 -- 二人信任博弈 (Bellemare & Sebald 2022)
实验流程(Figure 2所示的博弈树):
- 玩家A选择R(外部选项,双方获得45和30)或L(让玩家B决定)
- 若选L,玩家B选择l(自私选项,获210,给A仅30)或r(慷慨选项,获z,给A获150)
- z在{60, 70, ..., 120}中变化,每个被试做7个决策
- 同时收集被试的高阶信念数据
- 分别估计简单内疚厌恶模型和信念依赖互惠模型的参数
案例6:模糊厌恶的投资组合选择实验 (Ahn et al. 2014; Bellemare, Kroger & Sossou 2020)
Bellemare et al. (2020) 实验流程:
- 外生确定资产收益的可能分布集合
- 被试逐步观察来自真实收益分布的抽样
- 多期中被试进行投资组合选择,并定期报告主观概率
- 估计包含模糊厌恶、风险厌恶和损失厌恶的丰富偏好模型
- 使用finite mixture(7种类型)和个体层面估计
案例7:主观信念测量 -- 信任博弈中的概率信念引出 (Bellemare, Bissonnette & Kroger 2010, 2012)
实验流程:
- 在二元信任博弈中,提议者决定是否投资
- 提议者被要求报告概率分布:将回报金额的范围分成6个连续区间
- 对每个区间,报告预期回应者返回金额落在该区间内的主观概率
- 利用参数化方法(Beta分布)或三次样条插值拟合每个被试的主观CDF
其他要素
实验类型:涵盖实验室实验(独裁者博弈、最后通牒博弈、彩票选择、信任博弈)和田野实验(树木种植公司)。
方法论:
- 一阶条件估计法(Section 3):利用优化问题的FOC推导闭式解,转化为回归方程
- 离散选择模型估计法(Section 4):基于随机效用模型(RUM),使用Conditional Logit、Mixed Logit
- 两步间接法:先用标准软件估计约化形式参数(\lambda=1 正规化下),再反推结构参数
- 处理不确定性的方法(Section 5):已知概率下的风险偏好估计、主观概率下的信念依赖模型、模糊决策模型
亮点:
- 证明实验数据可在更弱假设下估计结构模型(弱化行为假设和分布假设)
- 大量行为经济学中的流行模型可用现有软件(Stata内置命令)估计,无需编程
- 系统提供可复制的Stata代码和模拟数据
- 强调实验方法可用于验证结构模型(样本内和样本外)
- 处理信念内生性问题的控制函数方法
局限:
- 本文性质为方法论综述,非原创实验
- 未覆盖现时偏差(present bias)的结构模型
- 涉及风险和模糊的模型仍需一定编程能力
- 模糊决策的结构估计中,主观分布集合的引出仍面临挑战
- 有限混合模型中,AIC/BIC在确定类别数量上的表现不一致
维度2:理论模型
基准理论
本文覆盖多个理论框架:
-
结果导向偏好(Outcome-based preferences):
- Fehr & Schmidt (1999) 不公平厌恶:V_{ia} = \pi_{ia} - \alpha \max(0, \Pi - 2\pi_{ia}) - \beta \max(0, 2\pi_{ia} - \Pi)
- Bolton & Ockenfels (2000) ERC模型:V_{ij} = \pi_{ij} - \phi(\pi_{ij} - 0.5)^2
- Andreoni & Miller (2002) CES利他偏好
-
信念依赖偏好(Belief-dependent preferences):
- Battigalli & Dufwenberg (2007) 简单内疚厌恶:V_{ij} = \pi_{ij}^B - \phi_i \max\{\mathbf{E}_i^B(\mathbf{E}_i^A(\pi_i^A)) - \pi_{ij}^A, 0\}
- Dufwenberg & Kirchsteiger (2004) 序贯互惠
-
风险偏好:
- CRRA/CARA效用函数
- 非线性概率加权:w_i(p_j) = \frac{\delta_i p_j^{\gamma_i}}{\delta_i p_j^{\gamma_i} + (1-p_j)^{\gamma_i}}
-
模糊决策:
- Maxmin期望效用 (MEU, Gilboa & Schmeidler 1989)
- 光滑模糊模型 (Klibanoff, Marinacci & Mukerji 2005)
Structural Model -- 关键公式
核心框架:决策者对所有可选方案 c 赋予价值 V(c, \mathbf{x}, \boldsymbol{\theta}),其中 \mathbf{x} 为选择环境变量,\boldsymbol{\theta} 为结构参数。
一阶条件法(连续选择):
随机效用模型(离散选择):
Conditional Logit选择概率(\varepsilon_{ij} 服从极值I型分布):
委托代理模型关键方程:
扩展为含互惠的非线性估计方程:
偏好异质性的参数化方法(以F-S模型为例):
两步间接法恢复结构参数:
随机参数模型(RPM)(Apesteguia & Ballester 2018):
估计方法
| 方法 | 适用场景 | 软件命令 |
|---|---|---|
| OLS/固定效应 | 一阶条件可线性化 | regress |
| 非线性最小二乘 | 非线性一阶条件 | nl |
| Conditional Logit | 离散选择,同质偏好 | clogit |
| Mixed Logit | 离散选择,偏好异质性(参数化) | cmxtmixlogit |
| 有限混合模型 | 偏好类型异质性 | 需编程 |
| 个体层面估计 | 每人多决策,两步间接法 | clogit + nlcom |
| 最大似然估计 | 复杂非线性模型 | 需编程 |
| 控制函数法 | 信念内生性 | 两步估计 |
关键假设
- 被试最大化价值函数 V(c, \mathbf{x}, \boldsymbol{\theta})
- 决策随机性通过Fechner误差(极值I型分布)或tremble参数引入
- 实验处理的外生变化允许弱化关于企业/决策环境的行为假设
- 偏好异质性可由参数分布(正态/对数正态)、有限混合或个体估计捕捉
- 随机效用模型中 \boldsymbol{\theta} 和 \lambda 不可同时识别,需正规化
维度3:核心发现
主要结论
-
实验数据允许在更弱假设下估计结构模型:
- Shearer (2004)用实验数据和简单线性回归估计 \gamma,无需Paarsch & Shearer (1999)关于企业如何设定计件费率的额外假设
- 实验数据支持使用随机效应(而非固定效应)估计,提高效率
-
忽略偏好异质性会导致严重偏误:
- Table 1模拟结果:忽略异质性时,\alpha 估计为0.323(真值0.5),\beta 估计为0.582(真值0.3)——\beta 被高估近一倍
- 考虑异质性(Mixed Logit, 10决策/被试):\alpha=0.382(SE 0.099),\beta=0.436(SE 0.167),var(\alpha_i)=0.442,var(\beta_i)=0.528,corr(\alpha_i,\beta_i)=0.575,\lambda=0.431
-
结构模型揭示混淆因素:
- 预测100美元工资礼物提高平均产出20.8%,100美元工资削减降低产出31.7%
- 这种不对称并非来自正/负互惠的差异(\beta 恒定),而是努力成本函数的凸性所致
- 使用估计值 \beta=0.001,\gamma=0.39(r_{it}=0.16)
-
RPM vs RUM识别问题:
- Apesteguia & Ballester (2018)发现使用RPM估计的风险厌恶水平比RUM高14%
- RUM在比较非退化彩票时违反单调性
-
信念内生性对估计的影响:
- 使用陈述高阶信念时,内疚厌恶估计显著高于外生设定信念时的估计
- 差异完全由陈述信念与未观测偏好之间的正相关解释
-
样本内拟合不足以验证模型:
- Bellemare et al. (2008a)中,使用主观概率和理性预期两个模型的样本内拟合非常接近
- 但样本外预测(用独裁者博弈holdout样本检验)显示主观概率模型显著优于理性预期模型
稳健性
- Monte Carlo模拟验证了各估计方法的统计性质
- 使用确定性等价物(CE)和上下文效用(contextual utility)方法可解决RUM中的非单调性问题
- 三次样条插值在拟合主观概率分布时比参数化方法更稳健,不受四舍五入偏误影响
- 个体层面估计在仅有10个决策/被试时可能不收敛(100人中9人失败),提示需要更多决策数
维度6:与其他文献的关系
领域位置
本文位于行为经济学与结构计量经济学的交叉领域,是Cambridge Elements系列中系统介绍如何将实验经济学数据与结构建模方法相结合的方法论专著。
核心对话论文
| 论文 | 关系 |
|---|---|
| Keane (2010) | 对结构建模前景的悲观评估,本文针对性回应其担忧 |
| DellaVigna (2018) | 行为经济学中的结构建模综述,互补文献 |
| Low & Meghir (2017) | 结合结构建模与RCT的综述,互补视角 |
| Fehr & Schmidt (1999) | 不公平厌恶模型,本文核心应用案例 |
| Andreoni & Miller (2002) | CES利他偏好,一阶条件法经典案例 |
| Holt & Laury (2002) | 风险偏好引出实验设计范式 |
| Apesteguia & Ballester (2018) | RPM方法,解决RUM识别问题 |
| Von Gaudecker et al. (2011) | 使用确定性等价物和混合模型估计风险偏好 |
| Bellemare, Kroger & Van Soest (2008a) | 最后通牒博弈中结合主观信念估计F-S模型 |
| Battigalli & Dufwenberg (2007, 2020) | 心理博弈论/信念依赖偏好的理论基础 |
| Bellemare & Shearer (2009, 2011) | 田野实验中互惠的结构估计 |
| Duflo, Hanna & Ryan (2012) | 田野实验与结构模型结合验证的经典案例 |
| Todd & Wolpin (2006) | PROGRESA实验的结构建模验证 |
| Bajari & Hortacsu (2005) | 用实验数据验证拍卖结构模型 |
新贡献
- 降低入门门槛:系统展示行为经济学中大量流行模型可用Stata内置命令(
clogit,cmxtmixlogit,nl,nlcom)估计,无需编程 - 两步间接法的系统化:统一框架下展示如何通过正规化(\lambda=1 或效用归一化到numeraire)先估计约化形式参数,再反推结构参数
- 实验设计与结构估计的对应关系:强调实验设计需要适应结构估计的需求(如策略方法提供多决策、概率信念引出)
- 模型验证的实验方法学:系统讨论样本内(AIC/BIC/选择概率分布比较)和样本外(holdout实验处理)验证方法
- 信念内生性的实用解决方案:控制函数法在结构离散选择模型中的应用
- 提供完整可复制的Stata代码和模拟数据:pamodel.do, altruism.do, discrete.do, guiltaversion.do, beliefs.do
维度4:变量概览
结果变量(按案例分)
- 委托代理:每日产出 y_{it}(树木种植数量);其对数 \ln y_{it} 用于估计弹性
- 独裁者博弈:被试的分配决策(自留 vs 给对方)
- 最后通牒博弈:回应者对每个可能报价的接受/拒绝二元变量(10 个决策/人)
- 彩票选择:在 10 对二元彩票中的选择(risky vs safe)
- 信任博弈:玩家 A 选 R/L、玩家 B 选 l/r 的二元/多元决策
- 模糊投资:跨期资产配置份额;随时间报告的主观概率
- 信念引出:每被试在 6 个区间上的主观概率分布
处理变量(实验外生操纵)
- 计件费率 r_{it}:随机分配给工人
- 80 美元礼物处理:G_{it} \in \{0,1\}
- 彩票概率/金额:在菜单中系统变化
- 最后通牒报价向量:10 种可能报价的策略方法
- z 值变化(B 玩家的慷慨成本):z \in \{60, 70, ..., 120\}
- 信念是否外生设定:用于识别陈述信念的内生性
控制变量
- 工人/被试固定效应 \alpha_i
- 天气/随机扰动 s_{it}(在结构模型中显式建模)
- 会话固定效应(多场次实验)
异质性变量
- 偏好分布参数:\sigma_\alpha, \sigma_\beta, corr(\alpha_i, \beta_i) 等
- 有限混合类型(如 Andreoni-Miller 的 3 类、模糊决策的 7 类)
- 个体层面估计 \hat{\theta}_i(每人单独拟合)
- Fechner 噪声参数 \lambda 的异质性
结构参数(被估计的"变量")
- 互惠 \beta、努力成本弹性 \gamma
- 不公平厌恶 \alpha, \beta(F-S)
- CES 替代弹性 \rho 与利他权重 \alpha
- 内疚厌恶 \phi
- CRRA 风险厌恶 \theta
- 模糊厌恶 \delta
- 概率加权参数 \gamma_i, \delta_i
维度5:局限性
- 覆盖范围:未涉及现时偏差(present bias / β-δ 偏好)的结构模型估计,未涉及参考点依赖与损失厌恶的完整估计实践。
- 复杂模型仍需编程:风险与模糊偏好的混合模型、有限混合模型、动态结构模型等仍需要被试自己写最大似然代码,Stata 内置命令不足。
- 方法论倾向:作者偏好"实验+结构"路线,对纯简化形式(reduced-form)实验、纯结构观测研究的对比讨论较少。
- AIC/BIC 表现不一致:在确定有限混合模型的类别数量上,AIC/BIC 给出不同结论,文中未提供决定性指南。
- 模糊决策实验的引出困难:主观分布集合(multiple priors)的引出仍然是开放问题,文中提供的方法只是部分解决。
- 个体层面估计的样本量需求:每被试 10 个决策时,约 9% 的被试估计无法收敛,提示需要更大决策数(如 30+)。
- 外部效度讨论有限:实验数据估计的偏好参数能否外推到劳动市场、消费市场等真实环境,作者讨论较少。
- 信念测量的可比性:不同实验用的信念引出机制(参数化 Beta、样条、离散概率分布)之间的可比性问题未深入讨论。
- 缺乏机器学习方法的整合:未讨论用机器学习辅助偏好异质性估计、用神经网络做反事实预测等新方法。
维度7:可拓展的研究方向
- 结构估计现时偏差与动态不一致性:在田野实验或在线实验中估计 β-δ 偏好,处理动态选择的内生性。
- 实验+结构估计参考点依赖偏好:用实验外生设定参考点(如 Köszegi-Rabin 内生参考点 vs 外生参考点对比),结构估计 KR 模型。
- 机器学习辅助偏好异质性估计:用因果森林(causal forest)或贝叶斯非参方法替代有限混合模型,识别偏好异质性的潜在维度。
- 结构估计 + RCT 联动验证:先用部分实验数据估计结构模型,用模型预测在另一组实验中的行为,再用 holdout 实验验证(Bellemare 在书中点到但有大量空间拓展)。
- 将平台/在线实验引入:用 Prolific、MTurk 大规模运行结构估计所需的多决策实验,关注样本选择偏差与代表性。
- 跨实验的 meta-structural estimation:把不同实验室、不同国家的同类实验数据合并,估计跨样本偏好分布与文化差异。
- 信念引出机制的比较实验:直接对比多种信念引出方法(QSR、BDM、二元概率列表)在结构估计中产生的偏差。
- 结构估计气候/可持续偏好:用实验数据估计 ESG 投资中的"道德溢价"参数,结合 Bauer 等人的 DCE 方法。
- 将信念依赖偏好嵌入劳动经济学:在田野实验中估计员工的内疚厌恶与互惠参数,预测福利政策(弹性工时、加薪)的效果。
- AI 偏好与人–AI 互动:用结构模型估计人在与算法/AI 决策者互动时的偏好(如对算法的厌恶、对算法的信任)。
标签
#structural_estimation #experimental_economics #behavioral_economics #social_preferences #risk_preferences #belief_dependent_preferences #discrete_choice #random_utility #methodology #guilt_aversion #reciprocity #inequity_aversion #ambiguity
关键结论
- 实验数据 + 结构模型 = 内部效度 + 外推能力:用实验数据估计结构模型同时获得 RCT 的外生变化优势和结构模型的反事实/福利分析能力,回应了 Keane (2010) 对结构估计的悲观看法。
- Stata 内置命令足以估计大部分主流行为模型:
clogit、cmxtmixlogit、nl、nlcom配合两步间接法可估计不公平厌恶、CES 利他、内疚厌恶、CRRA 风险偏好等模型,大大降低门槛。 - 必须建模偏好异质性:忽略偏好异质性会导致结构参数被严重偏估(F-S 模型中 β 被高估近一倍),这是该领域的首要警示。
- 样本内拟合不足以验证模型:主观信念模型与理性预期模型的样本内拟合非常接近,但样本外预测差异显著——必须用 holdout 样本/holdout 实验进行验证。
- 陈述信念存在内生性:用陈述高阶信念估计内疚厌恶时,参数被高估,差异由信念与未观测偏好的正相关解释;推荐用控制函数法或外生设定信念解决。
- RPM 与 RUM 给出不同的风险偏好估计:随机参数模型估计的风险厌恶比 RUM 高 14%,且 RUM 在比较非退化彩票时违反单调性;推荐使用 RPM 或上下文效用方法。
- 委托代理模型的关键反事实:礼物 100 美元提高 20.8% 产出,工资削减 100 美元降低 31.7% 产出,不对称源于努力成本函数的凸性而非互惠的不对称性——这是结构模型才能给出的解释。
- 方法论展望:现时偏差、参考点依赖、模糊决策的结构估计仍是开放领域,机器学习与有限混合的结合是值得探索的方向。