Frydman_Nave_2017_ExtrapolativeBeliefs_Perceptual_Economic

更新于 2026/7/5

Extrapolative Beliefs in Perceptual and Economic Decisions: Evidence of a Common Mechanism

基本信息

  • 作者: Cary Frydman, Gideon Nave
  • 期刊: Management Science, 63(7), 2340-2352
  • 年份: 2017 (Working paper 2015)
  • DOI: http://dx.doi.org/10.1287/mnsc.2016.2453
  • 关键词: extrapolative beliefs, response times, belief updating, sequential effects, hot-hand fallacy, judgment biases, drift-diffusion
  • 机构: USC Marshall (Frydman); Caltech (Nave, 后转UPenn)

一句话总结

通过让同一组被试(N=38)依次完成感知决策任务(PDT,1200 trials随机视觉刺激)和经济决策任务(EDT,400 trials股价surprise预测+BDM拍卖),证明两类任务中"外推性信念"的形成由同一心理机制驱动——用动态信念模型(DBM)从PDT估计的单参数α可成功预测EDT中的信念时间序列(r=0.66),且PDT中信念偏离程度与EDT中外推程度个体相关(r=0.57)。

研究问题

  1. 在低层次感知决策(看到圆形/方形)和高层次经济决策(预测股票surprise方向)中,被试形成信念的心理机制是否相同?
  2. 投资者在金融决策中表现的外推性信念(hot-hand fallacy式预期)是源于"高层次"的市场叙事/情绪,还是与底层视觉感知中的预期更新共享一个根本机制?
  3. 能否用计算神经科学中的工具(漂移扩散模型 DDM)从反应时间和准确率中"解码"出被试的主观先验信念,并与经济决策中直接引出的信念进行比较?

核心贡献

  1. 跨领域共同机制证据:首次在同一被试身上同时测量感知决策和经济决策中的外推性信念,证明二者具有共同认知基础——这对"金融市场外推性信念是源于市场情绪/叙事"的高层次解释构成挑战
  2. DDM先验解码方法:提出从漂移扩散模型参数中提取主观先验概率的公式(Prior = c_i / a),将反应时和准确率数据转化为可比较的概率信念,开辟了从过程数据推断信念的新方法
  3. 单参数动态信念模型(DBM)的跨领域成功:从PDT估计的α=0.44与EDT最优α=0.46几乎完全一致;用PDT校准的DBM预测EDT信念时间序列r=0.66,证明同一信念更新机制可同时刻画两类任务
  4. 个体差异的稳定性:II(PDT中信念偏离程度)与EI(EDT中外推程度)个体相关r=0.57;II还预测EDT中的实际收益(r=-0.47),说明这种"外推倾向"是稳定的个体特质
  5. 先验编码于初始点而非漂移率:在37/38被试中,DDM的先验信息编码在决策起始点c_i而非证据累积速率M_i——这一发现对长期争论"先验如何影响决策"的文献提供了实验证据
  6. 政策含义:如果外推性信念是底层、自动化、感知层面的现象,则简单的信息披露和投资者教育政策可能不足以纠正此类偏差

维度1:实验设计分析

核心研究问题

感知决策(perceptual decision-making)和经济决策(economic decision-making)中的信念形成是否由同一个心理机制驱动?

被试

  • N = 38人(17名女性),年龄17-29岁(均值20.24, SD = 3.11)
  • 来源:Caltech学生及附近社区学院学生
  • 样本量参照Bloomfield and Hales (2002)

实验地点与程序

  • Caltech Social Science Experimental Laboratory
  • 三场实验session,被试被随机分配到隔间中
  • 任务顺序固定:先PDT,后EDT(因PDT存在疲劳效应,故先做PDT)
  • 两个任务均使用Matlab Psychtoolbox编程
  • 被试获得$5出场费 + 任务报酬

任务一:感知决策任务(Perceptual Decision Task, PDT)

任务流程

  1. 4个block,每block 300个trial(共1200 trials),前有5个练习trial
  2. 每个trial开始:黑色屏幕中央出现白色注视十字(800毫秒)
  3. 注视十字消失后,出现白色圆形(直径10.5 cm)或蓝色方形(宽10.5 cm)
  4. 被试任务:看到圆形按"右箭头"键,看到方形按"左箭头"键
  5. 回应后立即进入下一个trial(新注视十字出现)
  6. block间休息20秒,期间显示正确回应数量反馈

激励机制

  • 每个正确回应获得1美分
  • 每延迟100毫秒扣0.05美分
  • 超过2秒回应获得0美分
  • 全部正确可获$12.00

关键设计特征

  • 被试被明确告知每种形状出现概率为1/2,且前序trial不影响后续trial
  • 刺激序列为伪随机i.i.d.二元过程,所有被试看到相同序列
  • Response-Stimulus Interval (RSI) = 800毫秒(刻意设置较长以排除automatic facilitation效应)

任务二:经济决策任务(Economic Decision Task, EDT)

任务流程

  1. 单一block,400个trial,前有10个练习trial
  2. 被试被告知数据来自上市公司实际业绩
  3. 每期看到过去14期"performance surprises"(实际业绩 - 预测业绩)的折线图(黄色线,黑色背景)
  4. 被试预测下一期surprise是正还是负
  5. 每期获得100单位实验货币作为禀赋
  6. 被试报告愿意为购买该公司股票支付的最高价格(WTP)

激励机制(BDM拍卖)

  • 采用Becker-DeGroot-Marshak (BDM)机制激励兼容
  • 被试报告WTP后,实际价格x从[0,100]均匀分布中随机抽取
  • 若WTP > x,被试以价格x购买股票
  • 若surprise为正,股票回报100单位;若为负,回报0单位
  • 对风险中性被试,WTP = 主观概率(正surprise的概率)
  • 每50 trials显示累计收益并可休息
  • 实验结束后以5000实验货币 = 1 USD的比率支付

关键设计特征

  • 实际序列同样是伪随机i.i.d.二元过程(所有被试相同)
  • 被试未被告知数据生成过程的统计性质
  • 前14期历史可见(与PDT不同)

实验设计的核心比较逻辑

  • Within-subject设计:同一被试完成两个任务
  • PDT中信念无法直接观测 --> 通过DDM从反应时和正确率中"解码"先验概率
  • EDT中信念可直接通过BDM机制激励兼容地测量
  • 比较两个任务中信念是否受到相同的刺激历史影响

维度2:理论模型

模型一:漂移扩散模型(Drift-Diffusion Model, DDM)

用于建模PDT中的决策过程并从中解码先验信念

核心方程(RDV扩散过程)

dRDV(t) = Mdt + sdW
  • RDV(0) = c_i(条件i下的初始点)
  • 上界 = a,下界 = 0
  • M = 漂移率(sensory evidence强度)
  • s = 噪声标准差(固定为0.1)
  • dW = 维纳过程

参数向量\theta_i = [M, a, c_i, T, M_{\sigma^2}, T_{\sigma^2}, c_{i_{\sigma^2}}]

  • M ~ N(M_\mu, M_{\sigma^2})(漂移率跨trial变异)
  • T ~ U[\frac{T_\mu - T_{\sigma^2}}{2}, \frac{T_\mu + T_{\sigma^2}}{2}](非决策时间跨trial变异)
  • c_i ~ U[\frac{c_{i_\mu} - c_{i_{\sigma^2}}}{2}, \frac{c_{i_\mu} + c_{i_{\sigma^2}}}{2}](初始点跨trial变异)

似然函数(极大似然估计)

LL(x_t, b_t | \theta_i) = -2 \sum_{c=i}^{C} \sum_{t=1}^{T_i} \log(L(x_t, b_t | \theta_i))
  • 使用DMA-Toolbox在个体水平估计
  • 实验条件由4-back的重复(R)与交替(A)历史定义,C = 16个条件

关键发现:先验编码在初始点而非漂移率

  • 基准模型(仅初始点c_i随条件变化)在37/38被试中优于同时允许M_ic_i变化的模型(AIC准则)
  • 在31/38被试中优于仅允许漂移率变化的模型

先验概率解码公式

\text{Prior}_i = \frac{c_i}{a}
  • 当噪声趋于无穷大时,被试完全依赖先验,此时到达上界的概率 = c_i / a
  • 这一结果对完整DDM(含跨trial变异参数)同样成立

模型二:动态信念模型(Dynamic Belief Model, DBM)

用于建模跨trial的信念更新动态(来自计算神经科学文献)。

核心假设

  1. 被试认为观测到重复的概率由时变参数\gamma_t控制:Pr(X_t = X_{t-1}) = \gamma_t
  2. \gamma_t以概率\alpha在每个trial重置为均匀先验P_0(\cdot)

预测方程

Pr(X_t = square | \gamma_t, X_{t-1}) = z_{t-1}\gamma_t + (1 - z_{t-1})(1 - \gamma_t)

其中z_t = 1X_t = squarez_t = 0X_t = circle

贝叶斯更新

\hat{P}(\gamma_t | X_t) \propto P(X_t | \gamma_t, X_{t-1}) P(\gamma_t | X_{t-1})

先验更新(含重置)

P(\gamma_{t+1} | X_t) = (1 - \alpha)\hat{P}(\gamma_t | X_t) + \alpha P_0(\gamma_{t+1})
  • \alpha是唯一自由参数,控制信念的自相关程度
  • \alpha = 0:理性贝叶斯代理人(在i.i.d.环境中的最优策略)
  • \alpha > 0:产生外推性信念(extrapolative beliefs)

不合理性指数与外推指数

不合理性指数(Irrationality Index, II)——PDT:

II_u = \frac{1}{8} \sum_{i=1}^{8} (p_{i,u} - 0.5)^2

外推指数(Extrapolation Index, EI)——EDT:

EI_u = \frac{1}{400} \sum_{t=1}^{400} (b_{t,u} - 0.5)^2

维度3:核心发现

PDT基本结果

  1. 反应时与streak length的关系

    • Continuation trials(刺激延续streak):RT随streak长度递减
    • Violation trials(刺激打破streak):RT随streak长度递增
    • 每个streak长度的continuation vs. violation RT差异在5%水平显著
    • t统计量范围:streak 2时 t(37)=3.95 (p<0.001) 到 streak 6时 t(37)=7.19 (p<0.001)
  2. 错误率与streak length的关系

    • Continuation trials错误率随streak递减,Violation trials错误率随streak递增
    • streak 2时差异 t(37)=3.65 (p<0.001);streak 6时 t(37)=4.95 (p<0.001)
  3. 效应类型:结果与Strategic Expectancy (SE)效应一致(非Automatic Facilitation),支持预期驱动的解释

EDT基本结果

  • 正(负)surprise streak越长,被试报告下一期正(负)surprise概率越高
  • 表现出强外推性信念(consistent with hot-hand fallacy)

DDM解码的先验概率

  • 解码的PDT先验概率与EDT中报告的信念高度相关:r = 0.90 (p<0.005)
  • 8个条件下(3-element histories of R and A),两个任务的信念呈现几乎相同的模式

个体差异的跨任务相关性

  • II与EI的相关性:r = 0.57 (p<0.001) —— PDT中信念偏离程度预测EDT中的外推程度
  • II与EDT payoffs的相关性:r = -0.47 (p<0.01) —— PDT中越"不理性"的被试在EDT中收益越低
  • 控制RT标准差后,II仍然显著预测EI (p<0.001)

不合理性指数

  • 平均II = 1.93 (SD = 0.391),显著大于理性基准0(p<0.001, Tobit回归,左截断于0)

DBM模型的跨任务预测

  • PDT中估计的平均\alpha^* = 0.44
  • EDT中最优\alpha = 0.46(几乎完全一致)
  • 用PDT的\alpha^*校准DBM后,预测EDT信念时间序列与实际信念的相关性:r = 0.66 (p<0.001)
  • 使用个体\alpha的稳健性检验:r = 0.686

DDM模型比较

  • 基准模型(仅初始点变化,C=16条件)在35/38被试中优于C=2,4,8的版本(AIC)
  • 仅初始点变化模型在37/38被试中优于初始点+漂移率同时变化的模型

维度6:与其他文献的关系

研究领域

行为经济学 / 认知心理学 / 计算神经科学 / 行为金融学

理论贡献

  1. 首次在同一组被试中同时测量感知决策和经济决策中的信念形成,提供"共同机制"的直接证据
  2. 提出从DDM参数中解码主观先验概率的新方法(Prior = c_i/a),将反应时数据映射为概率
  3. 证明Dynamic Belief Model (DBM)可以用单一参数模型同时解释两种决策领域的信念动态

与关键文献的关系

文献 关系
Bloomfield & Hales (2002, JFE) EDT任务的直接来源;证实了"regime-shifting beliefs"中的外推效应
Cho et al. (2002); Huettel et al. (2002, Nature Neuro) PDT中sequential effects的经典发现,本文复制并扩展
Asparouhova et al. (2009, MS) EDT任务的另一来源,"law of small numbers"框架
Greenwood & Shleifer (2014, RFS) 投资者外推性信念的调查证据,本文为其提供微观心理机制
Barberis et al. (1998, 2015, JFE) 行为金融模型中的信念偏差假设,本文提供实验基础
Yu & Cohen (2009, NIPS) Dynamic Belief Model的原始提出,本文将其从感知领域扩展到经济领域
Malmendier & Nagel (2011, 2015, QJE) 经验学习模型中的指数衰减权重,与DBM的\alpha参数对应
Ratcliff & McKoon (2008, Neural Comp) DDM理论基础
Mulder et al. (2012, J Neurosci) 先验编码在初始点vs.漂移率的争论,本文支持初始点编码
Summerfield & Tsetsos (2012, 2015) 感知与经济决策之间的桥梁文献

方法论创新

  • DDM先验解码技术:将DDM的初始点和边界参数映射为先验概率(Prior = c_i / a),提供了一个从反应时和准确率数据推断主观信念的分析框架
  • Within-subject跨领域比较:允许在个体水平比较感知和经济决策中的信念形成过程

政策含义

  • 如果外推性信念源于底层感知过程(bottom-up)而非深思熟虑的判断(top-down),那么简单的信息披露政策可能不足以纠正这种偏差
  • 这些感知模式识别过程可能是"hard-wired"的,难以抑制

局限性

  1. 两个任务结构相似(均为二元过程),跨领域泛化需谨慎
  2. 任务顺序未随机化(PDT总在EDT之前)
  3. 样本量较小(N=38)
  4. DDM + DBM只是解释sequential effects的多种模型之一

维度4:变量概览

自变量

实验内自变量(trial水平):

  • Streak length(连续重复的次数,1-6+)
  • Continuation vs. Violation(当前刺激是延续还是打破streak)
  • Trial position(trial顺序,控制学习效应)
  • 4-back history pattern(16种条件,用于DDM分条件估计)

任务(被试内):

  • PDT(Perceptual Decision Task):1200 trials随机视觉刺激
  • EDT(Economic Decision Task):400 trials股价surprise预测

模型估计参数:

  • M(漂移率)、c_i(条件i下的初始点)、a(决策边界)、T(非决策时间)及其方差
  • \alpha(DBM自相关参数,控制信念更新的"粘性")
  • 解码先验:Prior_i = c_i / a

因变量

类别 变量 测量
PDT行为 反应时间(ms) 自动记录
PDT行为 正确率 0/1
EDT信念 WTP(购买股票最高愿付价格) 0-100实验货币
EDT信念 推断的主观概率 WTP/100
个体特质 不合理性指数 II \frac{1}{8}\sum(p_i-0.5)^2
个体特质 外推指数 EI \frac{1}{400}\sum(b_t-0.5)^2
行为后果 EDT累计收益 实验货币

关键参数与样本

  • 样本:N=38(17名女性),17-29岁,Caltech学生及周边社区学院
  • 出场费:$5;总报酬约$30
  • PDT支付:每正确+1美分,每延迟100ms扣0.05美分,>2秒0美分;最高$12
  • EDT支付:BDM拍卖激励兼容;累计实验货币按5000:1兑USD
  • PDT trial数:1200(4 blocks × 300)
  • EDT trial数:400
  • RSI:800ms(避免automatic facilitation)
  • 任务顺序:固定PDT在前(PDT有疲劳)
  • 计量:DDM极大似然估计(DMA-Toolbox)+ DBM单参数估计 + Pearson相关 + Tobit回归
  • 主要结果显著性:跨被试t检验、个体相关性

维度5:局限性

  1. 任务相似性高:PDT与EDT都是二元过程(圆/方、正/负),跨领域泛化到非二元决策(如多选股票、连续金额)需谨慎
  2. 任务顺序未随机化:PDT总在EDT之前,可能存在顺序效应(被试在PDT中学到的pattern recognition倾向被带入EDT)
  3. 样本量有限:N=38;个体水平的DDM估计在小样本下精确度有限
  4. 无生态被试群:Caltech学生与社区学院学生均非真实投资者,外部效度未知
  5. DDM + DBM并非唯一可能模型:sequential effects也可由Bayesian observer with shifting regime、associative memory、reinforcement learning等多种模型解释;本文未与所有竞争模型系统比较
  6. EDT指令的影响:EDT中告知数据"来自上市公司业绩"可能激活金融心智模型,与"中性二元过程"不同
  7. 未直接测量"hot-hand fallacy"信念:仅通过WTP间接推断,被试可能因风险偏好等非信念因素调整WTP
  8. 无神经数据:虽提出"共同机制",但未直接通过fMRI/EEG等神经测量验证
  9. PDT中明确告知概率1/2:被试虽被明确告知i.i.d.,仍表现外推;但这个"明确告知"本身可能影响行为方式
  10. 未检验长期稳定性:II和EI的跨任务相关性未在重测设计下验证

维度7:可拓展的研究方向

  1. 神经层面验证:在PDT和EDT中用fMRI测量是否激活相同脑区(如DLPFC、parietal cortex、basal ganglia),检验"共同机制"的神经基础
  2. 更复杂任务设计:从二元扩展到多类、连续决策(如预测连续股价水平、多资产选择);考察外推机制是否仍泛化
  3. 干预实验:测试若先用PDT训练被试"反外推"(如对违反streak反应更快),是否能减少其EDT中的外推偏差;反之亦然
  4. 真实金融数据应用:将DBM校准的α映射到真实投资者交易数据,检验高α个体是否有更强的trend-following行为;对接Liao_Peng_2022_ExtrapolativeBubbles_TradingVolume
  5. 市场层面:在群体水平的资产价格中估计聚合α,与外推预期资产定价模型(Barberis_2015_XCAPM_ExtrapolativeAssetPricing_2022_ReturnExtrapolation)的隐含α对比
  6. 跨年龄/认知能力:检验外推机制是否在儿童、老年、低认知能力群体中更强;对接Fehr_Huck_2016_StrategicAwareness_CognitiveAbility中关于认知能力门槛的发现
  7. 经验效应交互:将DBM与Malmendier_2020_InvestorExperiences_MarketDynamics的经验学习模型结合,研究"早期经历"如何影响α的形成与稳定性
  8. 结合关联记忆:与Enke_Schwerter_2020_AssociativeMemory_BeliefFormation的关联记忆框架对接,检验外推是否实质上是"近期事件激活相似先例"的特例
  9. AI vs.人类对比:让LLM完成相同的PDT/EDT,比较其外推模式与人类的相似度;对接Chen_Kirshner_2025_ChatGPT_BiasedDecisions
  10. 降噪/降扰干预:测试是否在PDT中增加感官噪声(使先验更重要)会反向放大外推效应,提供因果证据

标签

#extrapolative_beliefs #drift_diffusion_model #sequential_effects #hot_hand_fallacy #perceptual_decision #belief_formation #BDM_mechanism #computational_model #within_subject #reaction_time

关键结论

  1. 感知决策与经济决策共享同一信念形成机制:从PDT解码的先验概率与EDT中的报告信念跨条件相关r=0.90(p<0.005),8种条件下两任务呈现几乎相同的信念模式
  2. 个体外推倾向稳定且具预测力:PDT中的不合理性指数II与EDT中的外推指数EI个体相关r=0.57(p<0.001);II还预测EDT中的实际收益(r=-0.47),说明外推倾向是稳定的认知特质,且对决策表现产生实质损失
  3. 单参数DBM跨领域成功:从PDT估计的α=0.44与EDT最优α=0.46几乎相同;用PDT校准的DBM预测EDT信念时间序列r=0.66(个体α下r=0.69)——一个简单单参数模型同时刻画两种领域信念动态
  4. 先验编码于决策起始点(initial point)而非证据漂移率:在37/38被试中,仅初始点变化的DDM优于同时允许漂移率变化的模型,证据强烈支持先验通过偏移决策起点而非改变证据累积速率影响决策
  5. streak效应方向明确且强度递增:continuation trials的反应时与错误率随streak长度递减;violation trials随streak长度递增;最长streak(6+)的差异在所有被试中均高度显著(t>7)
  6. 理论意义——挑战"高层次叙事"解释:金融市场中观察到的外推性信念(如热手谬误、趋势追逐)可能不是源于市场叙事或情绪传染等高层次现象,而是与底层感知预期共享的、自动化的认知机制
  7. 政策含义——简单信息披露不足以纠偏:若外推是底层、自动化、感知层面的现象,则简单告知投资者"过去表现不代表未来"等信息披露策略可能效果有限,需要更深层次的去偏干预(如改变交易界面、限制频繁查看历史等)
  8. 方法论意义——DDM作为信念测量工具:本文证明DDM不仅是反应时模型,还可作为从过程数据"解码"主观信念的强大工具,为不愿/不能直接报告信念的研究情境提供新方法