Basic Principles of Asset Pricing Theory: Evidence from Large-Scale Experimental Financial Markets

元信息

作者: Peter Bossaerts, Charles Plott
年份: 2004
期刊/来源: Review of Finance 8, 135-169
关键词: Asset Pricing, CAPM, Arrow-Debreu, Experimental Finance, Risk Premia, Large-Scale Experiments
机构: California Institute of Technology; CEPR
DOI/链接: Kluwer Academic Publishers

一句话总结

通过 9 次大规模（19-63 人）实验性金融市场，本文首次在被试不知总体禀赋的条件下证明：竞争性市场中风险溢价能自发涌现并呈现 Arrow-Debreu 一般均衡和 CAPM 所预测的三大定价性质——风险定价、状态价格概率比的逆财富排序、市场组合 Sharpe 比率最大化——从而绕过 Roll (1977) 批评对资产定价理论提供了直接的实验室检验。

研究问题

在受控实验室金融市场中，资产价格是否会按 Arrow-Debreu / CAPM 一般均衡模型所预测的方式形成风险溢价？
当被试不知总体禀赋（无法策略性地按理论定价）时，CAPM 均衡能否仍然作为竞争性力量的自发结果涌现？
实验市场的规模 (thickness) 是否对均衡收敛至关重要——即此前小规模实验（5-13 人）失败的原因是否在于市场太薄？
被试的信念偏差（如 gambler's fallacy）会如何干扰均衡定价？通过改变状态抽取协议（无放回 vs 有放回）能否消除该偏差？
当实际风险通过提高购买力被放大时（保加利亚 vs 北美被试），风险溢价是否随之扩大？

核心贡献

首次在大规模实验市场中验证一般均衡资产定价理论：通过将单次实验扩展到 19-63 人，达到了产生充分竞争和组合再平衡所需的"市场厚度"，使 CAPM 和 Arrow-Debreu 的核心定价命题首次在实验室获得清晰支持。
绕过 Roll (1977) 批评：实验者完全控制并知晓"市场组合"的真实构成（所有可交易资产之和），从而无需使用代理变量即可直接检验 CAPM 的均值-方差有效性命题。
均衡的非策略性涌现：被试仅知自己的禀赋而不知总体禀赋，因此无法刻意按 CAPM 公式定价；定价均衡完全是市场内生竞争力量的结果。
信念控制的方法论范例：识别出有放回抽取下被试的"超几何"信念（gambler's fallacy）会扭曲价格，并通过改用无放回抽取协议成功消除该异常——为后续实验市场研究提供了信念控制设计模板。
风险溢价的稳健性证据：通过保加利亚 Sofia 大学实验将名义报酬不变但实际购买力放大约 10 倍，验证风险溢价随真实风险放大而扩大，符合理论预测。
建立实验金融学新范式：基于网络分布式参与（web-based）的多地点同步实验，为后续大规模行为金融实验提供了基础设施。

维度1：实验设计分析

实验任务详细流程

整体架构: 两组大规模实验性金融市场实验（共9次实验），旨在检验现代资产定价理论的核心命题——风险溢价完全由与总体风险的协方差决定。第一组6次实验中状态有放回抽取（independent draws），第二组3次实验中状态无放回抽取（draws without replacement）。

市场结构与资产设计:

资产种类: 市场中可交易三种资产：
- 证券A（Security A）: 风险资产，不可卖空
- 证券B（Security B）: 风险资产，不可卖空
- 票据（Notes）: 无风险资产，可卖空（最多8单位）
状态空间: 三种可能状态 X、Y、Z，由随机抽签决定
收益矩阵（Payoff Matrix，所有实验相同）:

	状态 X	状态 Y	状态 Z
证券 A	170	370	150
证券 B	160	190	250
票据 Notes	100	100	100

单期实验的完整时间线:

初始禀赋分配: 每期开始时，被试被赋予一定数量的证券A、证券B和现金（以虚拟货币"法郎/franc"计）。被试需为获得这些证券和现金向实验者支付"贷款偿还金"（loan repayment），形成杠杆效应，放大了持有风险资产的风险
交易阶段（15-25分钟）: 被试通过基于网络的电子限价委托簿（electronic open book system）提交限价订单。三种证券各有一个独立的委托簿。当限价订单与对手方最优价格交叉时，自动转为市价订单成交。遵循严格的价格优先和时间优先规则。不允许隐藏限价订单。交易匿名进行，使用抽象编号（100-200之间）
状态抽取与股息支付: 交易结束后，随机抽取一个状态（X、Y或Z），根据该状态和被试的最终持仓确定各资产的股息收益
期末结算: 收益 = 股息收入 - 贷款偿还金。资产随即收回，新一期以全新的证券和现金禀赋开始
周期重复: 每次实验包含最多8个交易期（periods）。现金和资产持仓不跨期累计

偿付能力规则（Solvency Rule）: 如被试连续两期累计收益为负，则被宣布破产并禁止后续交易。该规则在所有期（除最后一期外）诱导风险规避行为，即使对风险中性的被试亦然

第一组实验（有放回抽取，I类）: 状态从等概率分布中独立抽取，各期概率不变。共6次实验（981007、981116、990211、990407、991110、991111）

第二组实验（无放回抽取，D类）: 从包含X、Y、Z各6个球的瓮中无放回抽取，每期概率随已抽出的球变化。共3次实验（011114、011126、011205）。设计目的是更好地控制被试信念，因第一组实验中部分被试似乎不相信/不理解状态抽取的独立性

其他实验设计要素

要素	内容
实验类型	基于网络的实验室实验（web-based），分布式参与（被试从不同地点登录），被试间设计
被试来源	主要为MBA学生（Yale、UCLA、Stanford、Tulane、Berkeley等）和Caltech学生；实验011126使用保加利亚Sofia大学的学生
被试规模	每次实验19-63人，远超传统实验经济学标准（8-12人）。被试数量非严格控制，取决于注册和实际登录情况
Treatment设计	(1) 第一组 vs. 第二组（有放回 vs. 无放回抽取）; (2) 不同禀赋结构跨实验变化; (3) 实验011126中将风险/回报实际放大约10倍（保加利亚被试，名义报酬与北美被试相同但购买力高10倍以上）
核心观测变量	(1) 交易价格时间序列; (2) 价格/期望收益比; (3) 状态价格概率比（state price probability ratios）; (4) 市场组合的Sharpe比率; (5) 期末个人持仓
因果识别策略	实验设计使被试仅知自身禀赋、不知总体禀赋，因此无法刻意按Arrow-Debreu或CAPM定价——若均衡涌现则必为市场力量的自发结果而非策略性模仿
货币与报酬	以虚拟货币"法郎"计账，实验结束时按预先公布的汇率兑换为美元。汇率0.03-0.04美元/法郎。平均每人约50美元，最高约250美元（981116实验，持续4小时），最低0美元
信息结构	对称信息：所有被试知道收益矩阵、状态概率、自身禀赋；不知他人禀赋和总体禀赋；不知市场组合构成；不知被试总数
亮点	(1) 首次在大规模实验市场中验证CAPM和Arrow-Debreu均衡的定价预测; (2) 被试无法直接使用理论定价（缺乏总体禀赋信息），均衡完全由市场内生涌现; (3) 通过保加利亚实验将风险放大10倍验证风险溢价的稳健性; (4) 解决了Roll (1977) 对CAPM实证检验的批评——实验者掌握真实的市场组合; (5) 发现被试对状态独立性的误解/不信任导致价格偏离，通过改用无放回抽取成功消除该异常
局限	(1) 被试数量非严格控制，为随机结果; (2) 偿付能力规则引入微妙的动态博弈特征，与静态资产定价模型假设不完全一致; (3) 第一组实验中部分被试存在信念偏差（gambler's fallacy式的超几何信念）; (4) 现金先行约束使无风险利率在期内呈现正值然后收敛至零的周期性模式; (5) 有限责任使证券实际上是含看跌期权的组合; (6) 少数Caltech学生参与了两次实验，可能存在经验效应

维度2：理论模型

基准理论框架

本文在两个嵌套的理论框架下分析实验数据：

Arrow-Debreu完全市场模型（一般性框架）: 要求市场完全、效用光滑且凹
CAPM（Sharpe-Lintner-Mossin资本资产定价模型，更具体的框架）: 在Arrow-Debreu基础上进一步假设二次效用

核心定价方程

Arrow-Debreu一阶条件: 对任意风险资产i和无风险资产F：

E[R_i - R_F] = -\text{cov}\left(R_i, \frac{u'(W)}{E[u'(W)]}\right)

其中 $R_i$ 为资产i的回报率， $W$ 为总体财富， $u'(W)$ 为"代表性投资者"的边际效用。风险溢价由回报与边际效用的协方差决定。

状态价格: 状态s的价格为：

P_s = P_F \pi_s \frac{u'(W_s)}{E[u'(W)]}

其中 $\pi_s$ 为状态概率， $W_s$ 为状态s下的总体财富。

CAPM定价方程: 假设二次效用 $u'(W) = a - bW$ ，可推导：

E[R_i - R_F] = \text{cov}(R_i, R_M) \frac{E[R_M - R_F]}{\text{var}(R_M)}

即风险溢价正比于资产回报与市场组合回报的协方差。比例常数为市场组合的期望超额回报除以其方差。

三个可检验的理论性质

风险定价性质（Risk Pricing Property）: 均衡价格将偏离期望收益，即存在风险溢价。风险厌恶的投资者会要求承担风险的补偿
状态价格概率比排序性质（State Price Probability Ratio Property）: 状态价格概率比 $\rho_s = P_s / \pi_s$ 的排序应与该状态下总体财富的排序相反。总体财富最高的状态，其状态价格概率比应最低（边际效用递减）
Sharpe比率性质（Sharpe Ratio Property）: 在CAPM均衡下，市场组合的Sharpe比率（均值-标准差比）应达到最大值。市场组合应是均值-方差有效的

关键理论洞察

Arrow-Debreu模型和CAPM均不要求个体投资者知道总体禀赋。它们是瓦尔拉斯均衡价格：投资者观察价格并优化，价格使总需求等于总供给
CAPM之所以在实验中成立，可能归因于风险水平较小，使得效用函数可用线性和二次项充分近似（即二次效用作为局部近似成立）

维度3：核心发现

结果1：风险定价性质获得强烈支持

所有实验中，风险资产（A和B）的交易价格几乎总是低于期望收益（期望收益：A=230, B=200）
Table II显示：价格/期望收益比在绝大多数期几乎一致地低于1（范围约0.78-1.02，极少数例外）
风险溢价随时间无显著递减趋势，表明偿付能力规则未系统性地扭曲定价
保加利亚实验（011126）中风险实际放大约10倍后，风险溢价更大（价格/期望收益比更低，约0.78-0.86），符合预期

结果2：状态价格概率比性质获得支持

在所有实验中，总体财富在状态Y最高、状态X最低。理论预测： $\rho_X > \rho_Z > \rho_Y$
图形证据显示状态价格概率比确实趋向于按理论预测的排序分离
状态X的状态价格概率比通常大于1，意味着状态X的隐含证券以高于期望收益的价格交易——风险溢价为负，这个反直觉的结果与理论一致
正式检验（Table III）: 以随机游走为零假设，检验状态价格概率比是否朝Arrow-Debreu均衡方向调整。平均转移频率（mean transition frequency）在所有实验中约0.84-0.90，除991110外均在5%水平上显著拒绝随机游走

结果3：Sharpe比率性质获得支持

图5和图6显示市场组合Sharpe比率与最大Sharpe比率之差随时间趋向于零
正式检验（Table IV）: 回归检验Sharpe比率差距的变化是否具有均值回复特征（ $\kappa < 0$ 表示收敛）。除991110外，所有实验的 $\kappa$ 估计值均显著为负（5%水平），拒绝随机游走，支持向CAPM收敛

结果4：信念控制问题

实验990407和991111中出现价格动态异常：被试似乎持有"超几何分布"信念（gambler's fallacy），认为某状态被抽到后下期出现的概率降低
990407中状态序列为X, Y, Y, X, Z, Y, X, Y。第四期后部分被试推高状态Z的隐含价格，因为Z尚未出现
第二组实验（无放回抽取）消除了该异常：无放回抽取下被试信念与实际概率变化方向一致，收敛效果不逊于第一组，尽管复杂度更高（每期概率变化需寻找新均衡）

结果5：偿付能力规则的影响可忽略

使用Afriat不等式检验个体选择的理性化程度：243名活跃被试中，62人（25%）完全不违反显示偏好公理
多数被试（62+79=141人，58%）违反程度不超过0.25美元，相对于持仓价值（50美元以上）可忽略不计
最大违反为5.76美元，仅13人违反超过3美元

结果6：市场厚度效应

Table VI对比薄市场实验（5-13人，Bossaerts & Plott 2002）与厚市场实验（19-63人）
厚市场实验中CAPM距离中位数显著更小（第3期后约0.03-0.08 vs. 0.12-0.18），确认被试数量对均衡收敛至关重要

维度5：局限性

对实验经济学/行为金融学的贡献

方法论突破: 首次成功在实验室中构建足够大、足够厚的金融市场以检验一般均衡资产定价理论。此前实验（5-13人）因市场过薄无法产生充分竞争和有效的组合再平衡
核心发现的不可归因于策略性行为: 被试不知市场组合（总体禀赋）构成，无法刻意按CAPM定价。CAPM定价的涌现纯粹是竞争市场中风险厌恶投资者的自发均衡结果
解决Roll批评: 实验者完全掌控市场组合的构成，因此CAPM可被直接检验，无需使用代理变量
信念控制的重要性: 发现部分被试在有放回抽取条件下持有超几何信念（类似赌徒谬误），导致价格偏离均衡。通过改用无放回抽取协议成功解决该问题，提供了实验设计中信念控制的重要范例
风险溢价的实验内稳健性: 通过保加利亚实验将实际风险放大10倍，验证了风险溢价随风险增大而增大的理论预测

关键局限与未解决问题

均衡的绝对距离难以度量: 理论仅关注均衡性质，缺乏衡量"距均衡有多远"的标准。本文的统计检验仅测试价格是否朝均衡方向移动，无法判断是否已达到均衡
动态特征与静态理论的张力: 偿付能力规则和有限责任引入的动态博弈特征无法被静态CAPM完全捕捉。虽然Afriat检验表明影响微小，但理论上的不一致性仍然存在
现金先行约束: 交易中购买需以现金支付、不允许跨市场互换（swap），产生了类似货币理论中的"现金先行约束"。Notes在期初被当作流动性工具以低于面值交易，产生正的期内无风险利率，这是理论未预见的制度性摩擦
被试异质性未充分探索: 本文聚焦于价格层面的总体均衡检验，未深入分析个体层面的交易策略、信念更新和学习过程。后续研究（Bossaerts, Plott & Zame 2003）开始探索配置问题
外部效度: 实验环境高度简化（3种资产、已知收益矩阵、已知概率），与真实金融市场的复杂度差距巨大。理论在实验室中的成功能否推广到自然发生的金融市场仍是开放问题

维度4：变量概览

变量	类型	测量方式	取值范围
交易价格	主要因变量	限价委托簿成交价格时间序列（每秒/每笔记录）	法郎计价
价格 / 期望收益比	风险溢价指标	$P_i / E[d_i]$ ， $d_i$ 为资产 i 的随机股息	通常 < 1 表示正风险溢价
状态价格 $P_s$	推断变量	由 A、B、Notes 价格反演的 Arrow 证券价格	法郎
状态价格概率比 $\rho_s$	主要检验对象	$\rho_s = P_s / \pi_s$	> 0
市场组合 Sharpe 比率	CAPM 检验对象	$E[R_M - R_F] / \sigma(R_M)$	数值
均值转移频率	收敛性检验	状态价格概率比向均衡方向移动的频率	0–1
$\kappa$ 系数	收敛性检验	Sharpe 比率差距均值回复的速率参数	< 0 表示收敛
State	实验外生变量	X / Y / Z 三种状态的随机抽取（有放回或无放回）	{X, Y, Z}
被试禀赋（个体）	实验外生变量	期初分配给个体的（A 数量, B 数量, 现金）	数值组
总体禀赋	实验外生变量（被试不知）	session 总 A + 总 B + 总现金	数值组
贷款偿还金 (Loan repayment)	杠杆参数	被试为获得期初禀赋须支付的金额	法郎
Period	时间维度	1–8 期	整数
被试人数	关键设计变量	19–63（厚市场） vs 5–13（先前薄市场）	整数
Afriat 不一致度	个体理性化指标	个体选择被显示偏好公理理性化的最小货币偏差	美元
最终美元收入	激励变量	法郎 × 汇率（0.03–0.04 美元/法郎）	0–250 美元

维度6：与其他文献的关系

领域位置

本文位于实验资产定价 (experimental asset pricing) 与一般均衡金融理论检验的交叉前沿，是 Bossaerts-Plott 实验金融学纲领的关键里程碑论文。

与经典理论文献的对话

Sharpe (1964), Lintner (1965), Mossin (1966) —— CAPM 原始模型，本文为其提供首个无 Roll 批评干扰的直接实验检验。
Arrow (1964), Debreu (1959) —— 完全市场状态价格理论，本文检验状态价格概率比的财富排序性质。
Roll (1977) —— 对 CAPM 实证检验的"市场组合不可观测"批评，本文通过实验设计绕过。
Smith, Suchanek, Williams (1988) —— 实验泡沫文献的奠基者，本文采用了类似的实验市场基础设施但聚焦于均衡定价而非泡沫。

与 vault 中已有论文的关系（双链）

Levy_2006_CAPM_HeterogeneousBeliefs —— 异质信念下的 CAPM，与本文同质信念实验形成对比。
Negrea_Toma_2017_DynamicCAPM_Ambiguity —— 动态 CAPM 与模糊性，本文为静态版本。
Barberis_2015_XCAPM_Extrapolative —— 外推性 CAPM，本文为标准 CAPM 的实验基础。
Biais_1998_BeautyContest_TradingVolume —— 实验性资产市场中的交易量与策略行为。
Brock_Hommes_1998_HeterogeneousBeliefs_Chaos —— 异质信念下的市场动态，本文实验中部分被试的超几何信念可视为微观证据。
Bao_2024_ReadingMarket_ExpectationCoordination_TheoryOfMind —— 市场协调与预期形成。
Adam_Marcet_2016_StockMarketVolatility_Learning —— 主观信念学习如何放大波动率。
Guler_Lugovskyy_2025_TradingInstitutions_ExperimentalAssetMarkets —— 实验市场制度比较。
Bernales_2020_SpeculativeBubbles_SupplyConstraints —— 实验市场中的泡沫与供给约束。
Michailova_2016_Overconfidence_Bubbles —— 过度自信与实验市场泡沫。
Merkle_2021_BeliefsAboutBeta —— 投资者对 beta 的主观信念，与 CAPM 的现实偏离相关。
Bosch-Rosa_Gietl_Heinemann_2024_RiskTaking_MotivatedBeliefs —— 同实验经济学方法论传统下的 motivated beliefs 研究。

新的知识贡献

实验金融学第一次清晰证明：主流资产定价理论（CAPM）在大规模实验市场中作为均衡涌现，并非小样本"未达均衡"。
提出"市场厚度"作为实验设计关键参数——薄市场实验失败的原因不在于理论错误而在于竞争不足。
揭示信念偏差（gambler's fallacy）作为定价异常的微观来源，开启了实验市场中"信念-价格"互动机制研究的方向。

维度7：可拓展的研究方向

个体层面信念与交易策略的微观机制研究：本文聚焦总体均衡，未深入分析个体被试的信念形成和交易策略。后续可结合信念引出（如 BSR）和眼动追踪揭示个体如何贡献于均衡涌现。
不完全市场扩展：本文实现近似完全市场（3 资产 + 3 状态），未来可减少资产数或增加状态数，检验不完全市场下的 CAPM 偏离。
异质信念的 CAPM 扩展：与 Levy (2006) 的异质信念 CAPM 对接，通过故意诱导信念异质性（如不对称信号）检验扩展模型。
资产泡沫与基本面价格的临界条件：将本文的均衡价格设计与 Smith-Suchanek-Williams 泡沫设计结合，探究何种参数下市场收敛于基本面 vs 形成泡沫。
机器学习/AI 交易者：在实验市场中加入 AI 算法交易者作为外生扰动，检验人机混合市场中 CAPM 的稳健性（参考 Hashimoto-Takayanagi 2026）。
非标准偏好的市场聚合：引入有偏好的被试子样本（如风险偏好者、过度自信者）测试这些偏差能否在均衡中被市场价格"消化"。
现场扩展：将协议移植到真实世界小市场（如预测市场、加密货币市场）检验外部效度。
更高频的价格发现动态分析：利用毫秒级订单簿数据，分析价格发现过程的微观结构。
奖励异质性与外部效度：进一步扩展保加利亚实验思路，在更高/更低实际购买力的样本中检验风险溢价的可比性。
将 motivated beliefs / 行为偏差融入实验市场设计：结合 Bosch-Rosa_Gietl_Heinemann_2024_RiskTaking_MotivatedBeliefs 的范式，检验当个体被诱导形成 motivated beliefs 时市场价格如何反应。

关键结论

风险定价性质成立：所有实验中风险资产以低于期望收益的价格交易，存在系统性正风险溢价，且风险溢价随实际风险放大而扩大。
状态价格概率比按理论排序：高总体财富状态对应低状态价格概率比；所有实验（除一例）显著拒绝随机游走零假设，价格朝 Arrow-Debreu 均衡方向调整。
CAPM 的 Sharpe 比率性质成立：市场组合 Sharpe 比率与最大可达 Sharpe 比率的差距随时间收敛于零，绝大多数实验显著拒绝随机游走。
信念控制至关重要：有放回抽取下部分被试持有 gambler's fallacy 式的超几何信念，导致定价异常；改用无放回抽取后异常消失。
市场厚度是均衡涌现的必要条件：19-63 人厚市场实验中 CAPM 距离的中位数显著小于 5-13 人薄市场实验。
被试不需知道总体禀赋即可达到 CAPM 均衡：均衡是市场竞争的自发产物，不依赖于被试的策略性理论应用，从而为 CAPM 作为竞争性均衡描述（而非个体认知模型）提供了支持。
偿付能力规则的扭曲可忽略：Afriat 一致性检验显示绝大多数被试的选择可被显示偏好公理理性化（违反 ≤ 0.25 美元），动态博弈特征对静态资产定价检验影响微小。

Bossaerts_2004_AssetPricing_LargeScaleExperiment