Mantovani_Filippin_2026_PredictionMarkets_AverageBeliefs
一句话总结
通过440人实验室实验比较call auction与double auction预测市场,发现DA因允许price-to-state(被试实际表现为price-to-belief)更新使收盘价更接近平均Bayesian信念,但风险偏好对价格无可检测影响,且交易后被试事后信念反而偏离真实状态——预测市场返回"平均信念"的条件比理论预测的更宽松也更脆弱。
研究问题
预测市场(prediction markets)何时返回参与者的"平均信念"(average beliefs)作为对未来事件的概率估计?具体地,交易制度(call vs. double auction)和参与者风险偏好如何调节预测市场价格与平均Bayesian信念之间的关系?
核心贡献
- 首次直接比较call auction与double auction两种标准预测市场制度在信念聚合方面的表现,发现DA系统性地更接近平均Bayesian信念;
- 检验He-Treich(2017)理论:在受控实验中识别CRRA风险偏好对预测市场价格的因果影响,结果未支持"高风险厌恶推动价格偏离平均信念"的理论预测;
- 揭示朴素price-to-belief更新:交易者并未进行理性的price-to-state inference,而是直接将价格当作信念信号修正自身后验,导致事后信念准确度反而下降;
- 方法论创新:联合测量风险偏好(Investment Game)、事前/事后信念(BSR激励)与市场价格,建立信念-价格联合识别策略;
- 政策含义:预测市场作为"民意聚合"工具的有效性依赖于交易制度选择,且其聚合的是信念而非真相,使用者不应将价格直接解读为真实概率。
维度1:实验设计分析
实验设计
总体结构
实验于2017年4月至2018年3月在 University of Milan-Bicocca 的 EELAB 实验室进行,共20场,440名被试参与。实验软件为 z-Tree。每场实验包含22名被试,平均时长约2小时,平均报酬15.9欧元。
实验采用被试间设计,每场实验仅使用一种交易制度:Call Auction (CA) 或 Double Auction (DA),各10场。每场实验内部,被试根据风险偏好中位数被分为两个独立市场(High risk aversion 和 Low risk aversion),每个市场11人。被试被告知每场有两个独立市场,且他们将在整个实验中留在同一市场,但不知道分组依据是风险偏好。
被试完整经历时间线
第一阶段:风险偏好测量(Investment Game)
被试到达实验室后被随机分配到隔间。首先进行风险偏好测量任务:
- 被试获得200 MU(Monetary Units)初始禀赋
- 需要决定将多少金额分配到"安全账户"和"风险投资"
- 风险投资以相等概率(50%)获得2.5倍回报或归零
- 这一选择与 CRRA 系数之间存在封闭形式的映射关系
- 此任务仅进行一次,以保持激励显著性
根据测量结果,被试按风险厌恶中位数被分为 High 和 Low 两组市场。
第二阶段:阅读指导语与测验
被试根据所在市场制度(CA 或 DA)接收详细的规则和操作说明,随后完成一系列理解测验:
- Quiz 1:关于罐子和信号的规则
- Quiz 2:信念报告程序
- Quiz 3:限价订单规则
- Quiz 4:卖空和订单执行的货币后果
- Quiz 5(CA)/ Quiz 5 和 Quiz 6(DA):对应交易界面的操作
每道测验必须全部回答正确才能继续,系统记录每道题的错误次数作为理解程度的代理指标。
第三阶段:12个交易期(核心任务)
被试进行12个交易期,每期结构相同:
1. 罐子选择与信号接收(每期开始)
- 共有4个罐子(Urn A/B/C/D),分别包含不同数量的蓝色弹珠(总计100颗):A含47颗蓝色,B含49颗,C含51颗,D含53颗
- 每期随机等概率选择一个罐子,这是公共知识
- 被试交易一个名为"Majority Blue"的 Arrow-Debreu 证券:如果被选罐子是C或D(蓝色弹珠占多数),则资产在期末支付100 MU;如果是A或B(红色占多数),支付0 MU
- 每名被试收到一个关于所选罐子成分的私人信号,形式为"罐子里有 s 颗蓝色弹珠",其中 s 与真实蓝色弹珠数 x 的偏差不超过5(即 s ∈ {x−5, ..., x+5})
- 11名被试各收到11个可能信号中的一个(每人不同),信号分配是公共知识
- 例如,若选中 Urn A(47颗蓝色),11名被试分别收到信号42至52
- 信号的信息量不同:s ≤ 45 或 s ≥ 55 完全揭示状态;s = 46, 47, 53, 54 部分揭示;48 ≤ s ≤ 52 无信息量(后验概率不变,仍为1/2)
2. 事前信念报告(ex-ante belief)
- 收到私人信号后,被试有30秒时间报告信念:报告每个罐子被选中的主观概率(即 e = Blue 的概率,对应 Urn C 和 D)
- 信念报告使用 Binarized Scoring Rule (BSR) 激励:系统将被试报告的概率与一个从 U[0,1] 中随机抽取的数 k 比较,计算报告概率的平方误差之和。如果平方误差之和小于 k(即报告足够准确),被试获得固定奖励200 MU;否则获得0
- BSR 的关键特性:与 QSR 不同,BSR 提供一个以一定概率获得的固定高额奖励(而非依准确度变化的金额),因此被试无法通过压缩报告方差来降低风险——最优策略始终是报告最准确的概率估计,对风险厌恶者也保持激励相容
3. 市场交易期
被试携带1000 MU 货币禀赋进入市场(无资产初始持仓),通过卖空进行交易(零净供给)。
- Call Auction (CA):被试有2分钟独立提交限价订单到封闭式订单簿。提交过程中可实时看到自己的净需求变化,但看不到他人的订单。可按意愿买卖多个单位。2分钟结束后,系统计算使总需求等于总供给的均衡价格(即总净需求为零的价格),若存在多个此类价格则取平均值。按优先级执行订单(买方出价高者优先,卖方要价低者优先),部分订单可能未成交。
- Double Auction (DA):市场开放3分钟(比CA长,因为需要互动)。被试在连续双向拍卖中提交限价订单到公开订单簿。当买卖价格匹配时自动成交。被试可实时观察所有已执行交易的价格和数量。可自由买卖多个单位。
两种制度下均有防破产约束:每笔订单提交时系统验证在最坏情况下(资产价值为0或100 MU)被试不会破产,否则显示错误信息拒绝订单。净多头仓位最终资产价值为0,净空头仓位最终为100。
4. 事后信念报告(ex-post belief)
交易期结束后,被试再次报告每个罐子被选中的概率(同样使用BSR激励),但不会收到关于真实状态的任何反馈。
罐子序列:12期中每个罐子恰好出现3次,采用伪随机序列。半数场次使用该序列,另一半使用其逆序。
第四阶段:支付结算
实验结束时,计算机随机选择以下各项进行支付:
- Investment Game:风险投资结果(成功获2.5倍或归零)加上安全账户金额
- 交易任务:随机选择1个交易期,该期所有被试统一使用同一期
- 信念任务:随机选择1个交易期的事前或事后信念报告(每位被试独立选择),且保证信念任务选中的期与交易任务选中的期不同(防止期内对冲)。信念报告通过BSR计算,每位被试分配独立的随机数 k,不同被试选中的具体期也不同(避免社会比较效应)
支付前,被试可看到该场所有随机抽签结果的详细信息(包括每期选中的罐子),然后填写简短问卷,最后匿名领取报酬。
关键设计参数
| 参数 | 数值 |
|---|---|
| 被试总数 | 440人(CA 220人,DA 220人) |
| 每场被试数 | 22人(分为2个市场,各11人) |
| 独立观测数 | 每种制度20个市场 |
| 交易期数 | 12期/场 |
| 罐子成分 | A: 47蓝, B: 49蓝, C: 51蓝, D: 53蓝(共100颗) |
| 资产支付 | C或D被选中→100 MU;A或B→0 MU |
| 信号范围 | 真实蓝色弹珠数 ± 5 |
| 交易禀赋 | 1000 MU(无初始资产持仓) |
| CA时长 | 2分钟 |
| DA时长 | 3分钟 |
| 信念激励 | BSR(阈值 k ~ U[0,1],准确则200 MU) |
| 风险投资禀赋 | 200 MU,回报倍数2.5 |
理论模型
理论基准
Prior Information Equilibrium (PIE):交易者将价格视为固定不变(不从价格推断他人信息),仅基于私人信号更新信念后按效用最大化交易。PIE是一个Walrasian均衡,价格反映信念但不传递信息。在PIE下,只有当所有交易者具有对数效用函数(CRRA系数 θ = 1)时,均衡价格才恰好等于平均信念。
Rational Expectations Equilibrium (REE):交易者从价格中推断他人的私人信息(price-to-state inference),据此更新信念。在极端情况下,价格完全揭示真实状态,信念与价格相互一致。
CRRA效用下的需求函数
在PIE设定下,具有CRRA参数 θ 的交易者 i 面对价格 p 的最优需求为:
当 θ = 1(对数效用)时简化为 q = (b_i - p) * m/p,此时市场出清条件给出 PIE 价格恰好等于平均信念。
当 θ ≠ 1 时,PIE价格不再等于平均信念:θ > 1 时价格趋向真实状态,θ < 1 时价格趋向无信息先验(50)。
可检验假说
- Hp(Institution):Double auction 中价格与无信息先验(50)的绝对距离大于 Call auction,因为DA中存在 price-to-state inference 推动价格趋近真实状态
- Hp(Risk):高风险厌恶市场中价格与无信息先验的距离大于低风险厌恶市场(因为更高的风险厌恶使价格偏离平均信念更远)
- Hp(Beliefs):价格偏离平均 Bayesian 信念的方向与信念偏离 Bayesian 基准的方向正相关(即不正确的信念更新可能扭曲价格)
关键假设
- 交易者持有外生信念(通过私人信号Bayesian更新公共先验)
- 交易者不考虑他人的风险偏好(非策略性行为假设)
- 在CA中交易者不从(假想的)出清价格推断信息;在DA中交易者可能从观察到的交易行为推断信息
核心发现
交易制度效应(Hp(Institution)结果:支持)
- DA中收盘价显著更接近平均 Bayesian 信念,CA中价格则更接近无信息先验(50)
- Mann-Whitney 检验:DA与CA价格偏离无信息先验的绝对距离差异显著(U = 3.354, p < .001)
- DA中90%的交易期内收盘价与平均Bayesian信念的距离小于与真实资产价值的距离;CA中该比例为97%
- DA中的价格收敛发生在交易期内:开盘价(前10笔交易均价)与CA无显著差异,但收盘价(后10笔交易均价)显著不同
- 信息量更大的罐子(A和D)中,DA与CA的价格差异更显著
风险偏好效应(Hp(Risk)结果:不支持)
- 高、低风险厌恶市场之间价格分布无显著差异(Mann-Whitney U = 0.487, p = 0.626)
- 价格与平均 Bayesian 信念的距离与市场平均CRRA系数不相关
- 分制度检验同样不显著(DA: U = 0.832, p = 0.406; CA: U = −0.227, p = 0.821)
- 低风险厌恶市场平均CRRA约0.23(PIE预测价格约40, 47, 53, 60),高风险厌恶市场平均CRRA约1.41(PIE预测价格约25, 38, 62, 75),理论上应有约15个点的价格差异,但实际未观察到
信念更新效应(Hp(Beliefs)结果:不支持)
- 事前信念在两种制度间无显著差异,且紧密跟踪 Bayesian 基准
- 事后信念并未变得更准确——相反,在两种制度下被试在交易后对真实状态的了解反而减少(Wilcoxon signed-rank 检验:DA z = −2.800, p = 0.005; CA z = −3.733, p < 0.001)
- 信念修正的方向是朝向观察到的价格,而非朝向真实状态——这是一种朴素的 price-to-belief 更新,而非理性的 price-to-state inference
- 价格偏离与信念偏离之间无显著相关(ρ = 0.082, p = 0.615)
- DA中事后信念平方误差显著小于CA(Mann-Whitney U = 2.894, p = 0.003),因为DA价格本身更准确
交易量与行为
- 交易量小于风险中性PIE预测(平均37.6 vs. 约109单位在urn B/C下)
- CA中个体持仓与风险偏好负相关(Spearman ρ = −0.200, p < 0.01),持仓与价格-信念距离正相关(ρ = 0.160, p < 0.01)
- CA中被试表现出"操作保守主义"(operational conservatism):需求函数围绕接近无信息先验的价格转向(从正转负),而非围绕自身信念
信念与价格的联合动态
- DA中价格与信念共同收敛:价格从接近无信息先验向平均Bayesian信念移动,同时事后信念向价格方向移动
- 交易者间信念方差在交易后下降约25%(urn A/D)和21%(urn B/C),意味着分歧减少但不太可能完全揭示真实状态
- 最终收敛点大致在无信息先验与真实状态之间,平均事前信念恰好落在此范围内
与其他文献的关系
预测市场理论基础
- He_Treich_2017_PredictionMarketPrices_HeterogeneousBeliefs:本文理论框架的重要基础,分析了风险厌恶和异质信念下预测市场价格的性质。Mantovani和Filippin的实验直接检验了He和Treich关于CRRA偏好下价格偏离平均信念的理论预测,但未找到风险偏好显著影响价格的证据。
- Bossaerts_2004_AssetPricing_LargeScaleExperiment:早期大规模资产定价实验的经典之作。本文延续了其通过实验室市场检验资产定价理论的传统,但聚焦于预测市场而非一般资产市场。
信念报告方法
- Danz_Vesterlund_2022_BeliefElicitation_BIC:本文采用BSR进行信念激励正是基于Danz等人对信念报告机制的系统比较。作者明确引用此文讨论BSR的局限性,同时认为BSR在本研究中(风险偏好和信念准确度均重要)是最合适的方法。
- Harrison_2017_ScoringRules_SubjectiveProbability:本文的BSR选择也考虑了评分规则与主观概率报告之间的关系。
- Canen_2022_BeliefElicitation_Incentives:信念报告激励相容性的理论探讨,与本文使用BSR的理由相关。
- Baillon_2017_BayesianMarkets_PrivateInfo:同样研究如何从市场机制中提取私人信念,但采用了不同的Bayesian市场设计。本文的贡献在于直接比较两种标准交易制度在信念聚合方面的表现。
信念更新
- Holt_2009_BayesianUpdating:本文中被试基于私人信号进行Bayesian更新,事前信念与Bayesian基准高度一致。但关键发现是事后信念并未因市场活动而改善——交易者朴素地朝价格方向更新信念,而非进行理性的 price-to-state 推断。
方法论对话
- 本文与 Plott and Sunder (1982, 1988) 的信息聚合实验经典系列形成对话:后者首次在实验室证明双向拍卖可以聚合分散信息,而本文发现这种聚合伴随着信念的恶化(交易后被试反而更不了解真实状态)。
- Choo et al. (2017) 和 Corgnet et al. (2023) 关于REE在实验中难以实现的发现与本文一致:DA中的价格改善来自部分信息聚合而非完全的理性预期均衡。
维度2:理论模型
Prior Information Equilibrium (PIE):交易者将价格视为外生固定,仅基于私人信号的Bayesian后验信念b_i和CRRA偏好θ最优交易,市场出清价格为价格加权下的"风险偏好-加权平均信念"。
- θ=1(log效用)特例:PIE价格 = 算术平均信念;
- θ>1:价格趋向真实状态(高风险厌恶者按比例扩大头寸);
- θ<1:价格趋向无信息先验50。
Rational Expectations Equilibrium (REE):交易者从价格反推他人私人信号,迭代更新;极限情形价格完全揭示状态。
两种制度对应假设:CA因封闭订单簿无法观察他人行为,应近PIE;DA因连续可观察交易,应近REE。但实际行为偏离理性基准——本文证据表明DA中是"price-to-belief"朴素更新而非真正的"price-to-state inference"。
关键模型隐含假设:交易者信念外生(基于私人信号Bayesian生成);不考虑他人风险偏好(非策略性);CA中不从假想出清价推断信息;防破产约束在所有最坏情形下生效。
维度3:核心发现
- 制度效应(支持Hp-Institution):DA收盘价与平均Bayesian信念的距离系统小于CA;CA价格更接近无信息先验50(Mann-Whitney U=3.354, p<.001);信息量更大的罐子(A,D)中差异更显著;DA价格收敛在交易期内逐步发生(开盘价相似,收盘价分化)。
- 风险偏好效应(不支持Hp-Risk):高、低风险厌恶市场价格无显著差异(U=0.487, p=0.626),分制度也不显著;理论预测15点价差未实现,说明实验者未按个人CRRA做策略性需求调整。
- 信念更新效应(不支持Hp-Beliefs):事前信念紧密贴近Bayesian基准;事后信念在两种制度下均偏离真实状态(DA z=-2.800, p=.005; CA z=-3.733, p<.001),方向朝向观察价格而非真实状态——朴素price-to-belief更新。
- 交易量与持仓:实际交易量远低于风险中性PIE预测(37.6 vs ~109单位);CA中持仓与风险厌恶负相关,与价格-信念距离正相关。
- 操作保守主义:CA被试需求函数围绕接近50的"中性价格"翻转符号,而非围绕自身信念,与传统Walrasian需求理论矛盾。
- 联合动态:DA中价格与信念共同收敛——价格从50向平均Bayesian信念移动,事后信念向价格移动;交易者间信念方差下降25%(A/D罐)和21%(B/C罐),表明分歧减少但状态揭示不完全。
维度4:变量概览
| 类别 | 变量 | 测量方式 |
|---|---|---|
| 自变量(处理) | Trading institution | CA vs DA(被试间) |
| 自变量(分组) | Risk aversion group | High/Low(按市场内CRRA中位数划分) |
| 个体特征 | CRRA系数 θ | Investment Game(200 MU分配,2.5倍/0),封闭形式映射 |
| 个体特征 | Quiz错误次数 | 5-6道理解测验(CA 5题/DA 6题)的错误计数 |
| 信号 | Private signal s | 真实蓝色弹珠数±5的整数 |
| 信念 | Ex-ante belief | 4个罐子各自概率向量,BSR激励,信号后报告 |
| 信念 | Ex-post belief | 同上,市场结束后报告 |
| 信念基准 | Bayesian benchmark | 基于私人信号与公共先验机械计算 |
| 价格 | Opening price | 前10笔交易平均(DA)/单一出清价(CA) |
| 价格 | Closing price | 后10笔交易平均/单一出清价 |
| 价格距离 | Price - 50 | |
| 价格距离 | Price - mean Bayesian belief | |
| 行为 | Net position | 期末持仓(多/空,单位数) |
| 行为 | Trading volume | 期内交易总单位数 |
| 支付 | Total earnings | Investment Game + 1期交易 + 1期信念 |
维度5:局限性
- 样本限制:本科学生样本,预测市场在真实金融/政治市场(PredictIt, Kalshi)的外部效度需进一步验证;
- 小群体规模:每市场仅11人,较大规模市场可能改变信息聚合效率;
- 私人信号信息结构特殊:±5对称信号对应的Bayesian更新非常机械化,与真实预测市场中模糊性、贝叶斯失败更严重的情形不可比;
- 罐子参数对称:A/B/C/D对真值距离对称(47/49/51/53),未检验极端不对称信号下的稳健性;
- 风险偏好测量单一:Investment Game可能未捕捉到与交易场景一致的风险偏好(背景风险、场景效应);
- 未直接观察price-to-state vs price-to-belief动机:仅从行为后果反推被试的更新逻辑,缺乏过程性证据(眼动、口头报告);
- DA中订单簿可见性的具体效应未分解:制度效应可能源自连续交易、可观察成交价、互动机制中任一因素,未能进一步解构;
- 二期及以上动态学习未涉及:12期内被试可能学习,但不收到关于真实状态的反馈,限制了对"经验校准"的研究;
- z-Tree平台限制:交易界面与真实电子交易平台差异较大;
- CRRA预测下风险偏好效应未实现的解释多元:可能因效应规模理论上15点过小、被试不策略性、或CRRA系数测量噪声大。
维度6:与其他文献的关系
预测市场理论基础
- He_Treich_2017_PredictionMarketPrices_HeterogeneousBeliefs:本文理论基础。He-Treich证明CRRA偏好下预测市场价格不等于平均信念,本文实验直接检验但未发现风险偏好的显著作用,对该理论提出挑战。
- Bossaerts_2004_AssetPricing_LargeScaleExperiment:早期大规模资产定价实验经典,本文延续其实验方法但聚焦预测市场。
- Brock_Hommes_1998_HeterogeneousBeliefs_Chaos:异质信念资产定价的理论基础,本文提供异质信念市场出清行为的微观证据。
信念报告方法
- Danz_Vesterlund_2022_BeliefElicitation_BIC:本文采用BSR的方法学依据,并在讨论中引用其对BSR局限性的分析。
- Harrison_2017_ScoringRules_SubjectiveProbability:BSR评分规则与主观概率报告的关系。
- Canen_2022_BeliefElicitation_Incentives:信念报告激励相容性理论探讨。
- Baillon_2017_BayesianMarkets_PrivateInfo:研究通过Bayesian市场提取私人信念的替代机制,本文对比的是标准call/double auction。
- Offerman_2009_TruthSerum_ScoringRules:对scoring rules诚实诱导的早期工作。
信念更新与price-to-state inference
- Holt_2009_BayesianUpdating:本文事前信念高度符合Bayesian基准但事后信念恶化的发现,挑战了"市场学习提升信念准确度"的常识。
资产定价理论与异质信念
- Barberis_PsychologyBased_AssetPricing:心理基础的资产定价综述,本文为其异质信念假设提供实验微观基础。
- AssetPricing_2022_ReturnExtrapolation:外推性预期资产定价,本文事后信念向价格更新与外推机制有关联。
与Plott-Sunder经典系列的对话:本文证实双向拍卖部分聚合信息(与Plott-Sunder 1982,1988一致),但发现这种聚合伴随着事后信念准确度的下降,提出"信息vs信念"分离的新视角。
维度7:可拓展的研究方向
- 真实预测市场场地实验:在PredictIt、Polymarket等真实平台对比CA/DA机制的信念聚合差异;
- 市场规模扩展:检验信息聚合效率在50人、100人甚至千人级市场中的非线性变化;
- 信号结构异质性:引入不对称信号、模糊信号、多源信号,检验制度效应在更复杂信息环境下的稳健性;
- REE学习曲线:让被试反复参与并收到状态反馈,识别多少期后真实达到REE;
- 过程性证据:用眼动、决策时间、口头协议(think-aloud)研究被试究竟在做price-to-state还是price-to-belief更新;
- 交叉机制设计:混合CA与DA要素(如CA后DA再CA),分解出价机制vs可见性的具体贡献;
- 风险偏好-情境互动:结合 Bosch-Rosa_Gietl_Heinemann_2024_RiskTaking_MotivatedBeliefs 等研究,探究背景风险与交易风险的耦合;
- AI/算法交易者影响:在实验中加入算法交易者(学到REE),观察人类被试是否更接近REE;
- 政策应用:将结论应用于公共预测(疫情、选举、宏观),评估不同制度下的预测准确性差异;
- 跨文化比较:在不同市场文化背景下重复实验,检验信念聚合的文化稳健性。
关键结论
- 制度选择关键:double auction预测市场显著优于call auction在信念聚合方面,DA收盘价更接近平均Bayesian信念,CA价格被"操作保守主义"拉向无信息先验50。
- 风险偏好不重要:尽管He-Treich(2017)理论预测高风险厌恶应使价格偏离平均信念约15点,本实验未发现可检测的风险偏好效应——交易者不进行策略性CRRA加权。
- 价格-信念双向收敛但偏离真相:DA市场中价格与信念共同收敛但收敛点位于无信息先验与真实状态之间;交易者朴素地朝价格修正信念(price-to-belief),导致事后信念准确度反而下降。
- 政策含义:预测市场作为信息聚合机制有效但有限,使用者应区分"市场聚合的信念"与"真实概率",并意识到制度设计(CA vs DA)对结果有重要影响。