Confidence Drives a Neural Confirmation Bias

元数据

作者: Max Rollwage, Alisa Loosen, Tobias U. Hauser, Rani Moran, Raymond J. Dolan, Stephen M. Fleming
期刊: Nature Communications
年份: 2020
DOI: https://doi.org/10.1038/s41467-020-16278-6
关键词: #确认偏误 #信心 #决策后信息加工 #MEG #漂移扩散模型 #知觉决策 #元认知
数据与代码: https://github.com/MaxRollwage/NatureCommunications

一句话总结

通过随机点运动知觉决策任务结合DDM建模与MEG解码，证明高信心选择性地加快了决策后阶段神经层面对"与初始选择一致"证据的累积、抑制了对相反证据的累积——即确认偏误的核心计算机制是漂移率偏移而非起始点偏移，且该机制在与动机推理无关的低层级知觉任务中即已存在。

研究问题

信心（confidence）是否在决策后（post-decisional）阶段引发神经层面的确认偏误？
这种确认偏误的计算机制是"起始点偏移"（规范性的证据延续）还是"漂移率偏移"（非规范性的选择性证据加权）？
该确认偏误能否在去除动机推理因素的纯知觉任务中被观察到，从而表明它是大脑信息加工的通用特征？
信心在何种神经回路（中心-顶叶传感器、CPP）和时间窗口（决策后早期重新激活）通过何种动态影响证据累积？

核心贡献

首次将确认偏误从高阶信念领域拓展至低层级知觉决策：表明确认偏误并非仅由动机推理或意识形态驱动，而可能是大脑证据累积过程的通用计算特征。
解耦信心与准确率的方法学创新：通过"正向证据操纵"（HPE vs LPE，调整反方向运动点比例）在保持准确率不变（Cohen's d = 0.02, BF01 = 4.61）的前提下选择性提升信心（Cohen's d = 0.21）。
计算机制的精细识别：通过分层贝叶斯DDM（10模型比较）证明确认偏误主要表现为漂移率偏移（信心×初始决策交互的95% CI = 0.11-0.26）而非起始点偏移。
神经层面的因果证据：MEG解码+SVM时间泛化分析显示高信心条件下确认性证据的神经累积被放大、否定性证据的累积被消除（信心×初始决策交互p = 0.008），且初始决策的神经表征在决策后被更早重新激活。
跨学科桥梁：连接知觉决策的神经计算文献（Gold & Shadlen, CPP）、元认知文献（Fleming）和确认偏误的认知/社会文献，提示政治极化、金融过度交易等现象的微观神经机制。
可重现性：完整数据与代码开源（GitHub: MaxRollwage/NatureCommunications）。

维度1：实验设计分析

核心研究问题

高信心（confidence）如何在计算和神经层面驱动决策后（post-decisional）信息加工中的确认偏误？

实验范式总览

本文包含三项独立研究：两项纯行为实验（Study 1, n=28; Study 2, n=23）和一项MEG神经影像实验（Study 3, n=25）。所有实验均采用随机点运动（Random Dot Kinematogram, RDK）知觉判断任务，关键创新在于通过心理物理学操纵将信心与准确率解耦。

实验任务详细流程

试次结构（以Study 1为例，见Fig. 1a）

注视点呈现（1000 ms）
决策前证据呈现：RDK刺激（350 ms）——白色圆点云在灰色圆形区域内运动，运动方向为向左或向右
注视点（300 ms）
初始决策与信心评定（2000 ms）：被试按左/右键判断运动方向，随后在50%-100%的7点量表上移动光标报告信心
注视点（350 ms）
决策后证据呈现：第二段RDK刺激（300 ms）——运动方向始终与决策前证据一致（即为额外有用信息）
注视点（300 ms后呈现）
最终决策与信心评定（2000 ms）：被试再次判断运动方向并报告信心

信心操纵的关键设计——"正向证据操纵"

目的：在保持客观准确率不变的前提下，选择性地提升信心
高正向证据条件（HPE）：反方向运动点比例设为15%，正确方向运动点比例通过阶梯法调整以维持目标表现水平
低正向证据条件（LPE）：反方向运动点比例设为5%，正确方向运动点比例同样通过阶梯法调整
效果验证：HPE条件下信心显著提升（Cohen's d = 0.21, p = 0.005），但准确率（Cohen's d = 0.02, BF01 = 4.61）和反应时（Cohen's d = -0.04, BF01 = 4.51）均无显著差异

实验条件

2（决策前证据：HPE vs. LPE） x 2（决策后证据强度：强 vs. 弱）= 4种条件
每种条件90个试次，共360试次（行为实验）或352试次（MEG实验）
决策后证据方向始终与决策前一致，但强度有两个水平

Study 2的关键改动

允许被试在决策后证据呈现后自由反应（无300ms强制延迟），从而可以利用反应时作为决策阈值的代理指标进行DDM拟合

Study 3（MEG实验）的关键改动

初始决策简化为左/右 + 二元高/低信心（而非连续评定）
按键与决策方向之间的映射被随机化（通过呈现L/R或H/L标记），以避免运动准备信号混淆解码
在刺激呈现后引入500ms延迟才揭示按键映射，确保MEG解码窗口内被试尚未准备运动反应

被试

Study 1：28人（M_age=23.8, SD=6.3, 16女）
Study 2：23人（M_age=25.7, SD=7, 12女）
Study 3：25人（M_age=24.6, SD=4.1, 16女）
每项研究使用不同的被试组
排除标准：>90%使用同一信心评级；准确率<55%或>87.5%；阶梯程序未收敛

激励机制

基础报酬：行为实验10英镑，MEG实验20英镑
绩效奖金：行为最高5英镑，MEG最高8英镑
评分规则：二次评分规则（Quadratic Scoring Rule）
- Points = 100 * [1 - (correct_i - conf_i)^2]
- 其中correct_i为准确性指标（正确=1，错误=0），conf_i为信心评级
- 该规则确保信心与奖励正交，同时联合最大化准确率和信心的校准

维度2：理论模型

漂移扩散模型（Drift-Diffusion Model, DDM）

本文使用分层贝叶斯DDM（hierarchical Bayesian DDM, hDDM）对决策后信息加工过程建模，比较了10个竞争模型。

信心影响决策后加工的两种机制假设（Fig. 2a）

起始点偏移：信心使决策后累积过程的起始点向初始决策对应的边界靠近（反映决策前证据的延续）
漂移率偏移：信心选择性地改变证据累积速率（即确认偏误的直接体现）

获胜模型（Model 10）的关键公式

起始点（Starting point）：
$ $\text{Starting point} \sim 1 + \text{confidence} + \text{initial decision} + \text{confidence} \times \text{initial decision}$ $

漂移率（Drift rate）：
$ $\text{Drift rate} \sim 1 + \text{post-decision evidence strength} + \text{confidence} + \text{initial decision} + \text{confidence} \times \text{initial decision}$ $

边界间距（Boundary separation）：
$ $\text{Boundary separation} \sim 1 + \text{confidence}$ $

模型比较结果

使用偏差信息准则（Deviance Information Criterion, DIC）进行模型比较
获胜模型同时包含信心、初始决策及其交互项对起始点和漂移率的依赖
关键发现：信心对漂移率的交互效应（95% equal-tailed interval = 0.11-0.26）强于对起始点的交互效应（95% equal-tailed interval = 0.08-0.18），表明确认偏误主要体现为证据累积速率的选择性改变

hDDM估计方法

MCMC采样：100,000次迭代，50,000次burn-in，thinning factor = 25，得到2,500个后验样本
使用Python HDDM工具箱（v5.50）
准确率编码：正向漂移率 = 正确方向更强的证据整合
RT < 200ms的试次被排除

MEG分析中的机器学习方法

SVM分类器的跨时间泛化

在决策前阶段每个时间点训练SVM分类器（预测左/右决策）
将训练好的分类器应用于决策后阶段对应时间点
获得227 x 227的解码精度矩阵（时间泛化矩阵）
分类器到分离超平面的距离作为连续的神经决策变量（DV）

神经证据累积的量化

对每个试次，将分类器预测值的时间序列进行线性回归拟合
斜率（slope）：类比DDM中的漂移率——反映决策后证据累积速率
截距（intercept）：类比DDM中的起始点——反映初始证据表征强度

维度3：核心发现

行为层面

信心操纵的效果（Study 1）

信心提升：HPE vs. LPE条件下信心均值差异 = 0.024, CI = [0.008, 0.04], Cohen's d = 0.21, t(27) = 3.0, p = 0.005
准确率无显著差异：均值差异 = 0.006, CI = [-0.022, 0.034], Cohen's d = 0.02, BF01 = 4.61
反应时无显著差异：均值差异 = -0.005, CI = [-0.029, 0.018], Cohen's d = -0.04, BF01 = 4.51

信心对改变决策的影响

信心提升幅度（个体间差异）与改变决策频率的关系：r = -0.69, p < 0.0001（Fig. 1d）
该相关不能由正向证据对准确率或反应时的影响解释（控制后 p = 0.005）

DDM关键参数（Study 2, n=23）

信心 x 初始决策对漂移率的交互效应：95% equal-tailed interval = 0.11-0.26, P(parameter > 0) > 0.999
信心 x 初始决策对起始点的交互效应：95% equal-tailed interval = 0.08-0.18, P(parameter > 0) > 0.999
解释：高信心被试选择性地加速与初始选择一致的证据累积，同时减缓与初始选择不一致的证据累积

神经层面（MEG Study 3, n=25）

SVM分类器验证

分类器预测值的斜率显著预测行为：beta = 0.07, t(8550) = 6.89, p < 10^-11
斜率预测反应时：beta = -0.007, t(8549) = -2.83, p = 0.005
斜率预测准确率：beta = 0.16, t(8549) = 3.05, p = 0.002
斜率预测信心：beta = 0.14, t(8549) = 3.53, p = 0.0004

信心驱动的神经确认偏误（核心发现）

高信心条件下：确认性证据的神经累积被放大，而否定性证据的累积几乎被消除（Fig. 4a vs. 4b）
初始决策对神经证据累积斜率的主效应：beta = 0.042, t(8547) = 2.96, p = 0.003
信心 x 初始决策对斜率的交互效应：beta = 0.038, t(8547) = 2.64, p = 0.008（Fig. 4c）
起始点无显著的信心效应（p > 0.05），进一步支持确认偏误主要通过漂移率（选择性证据累积）而非起始点偏移实现

时间泛化分析

高信心使初始决策的神经表征在决策后阶段更早被重新激活（p = 0.01，校正多重比较，Fig. 4d）
中心-顶叶传感器对分类器贡献最大（与centroparietal positivity/CPP文献一致）

维度6：与其他文献的关系

研究贡献

首次在神经层面揭示信心驱动确认偏误的机制：高信心导致决策后神经证据累积选择性地偏向与初始选择一致的信息
将确认偏误从高阶信念领域拓展到低层级知觉任务：表明确认偏误可能是大脑信息加工的通用特征，而非仅由动机推理驱动
区分了两种计算机制：起始点偏移（规范性的，反映决策前证据延续）vs. 漂移率偏移（非规范性的确认偏误），并证明后者是主要机制

与已有文献的关系

确认偏误的行为文献：与Talluri et al. (2018, Curr. Biol.) 和 Urai et al. (2019, eLife) 在知觉任务中发现确认偏误一致，但本文进一步揭示信心作为调节因素的关键角色
证据累积模型：建立在Gold & Shadlen (2007, Annu. Rev. Neurosci.) 等经典漂移扩散模型框架上，创新性地将模型拓展到决策后阶段
信心与元认知：与Fleming (2018, Nat. Neurosci.) 关于信心对改变决策的中介作用一致
自上而下控制：与Desender et al. (2019, J. Neurosci.) 关于信心的决策后神经标记预测信息搜索的发现互补
政治态度与极化：作者指出低层级知觉任务中发现的确认偏误机制可推广至理解政治极化等复杂社会现象

方法论启示

心理物理学信心操纵（正向证据操纵）是解耦信心与准确率的有效工具，可推广至其他信念更新研究
MEG时间泛化分析结合SVM分类器提供了追踪决策后证据累积动态的神经方法
分层贝叶斯DDM为区分起始点偏移和漂移率偏移提供了严谨的计算框架

局限性

知觉决策任务的生态效度有限，向复杂信念（如金融决策、政治态度）的推广需谨慎
决策后证据方向始终与决策前一致（确认性 vs. 否定性由初始决策正确与否决定），限制了对主动信息选择场景的推广
样本量较小（每项研究23-28人），效应量的精确估计存在不确定性

维度4：变量概览

变量类别	变量	测量方式	角色
处理变量	正向证据条件（HPE vs LPE）	HPE: 反方向点15%；LPE: 反方向点5%；正确方向点通过阶梯法调整以等化准确率	自变量（信心操纵）
	决策后证据强度	强 vs 弱（2水平）	自变量
行为因变量	初始决策	左/右按键	二值
	初始信心	Study 1-2: 50%-100%连续7点；Study 3: 二元高/低	主因变量
	最终决策	左/右按键	改变决策与否
	最终信心	同上	信心更新
	反应时（RT）	ms	DDM拟合
	改变决策频率	个体水平	二阶因变量
DDM参数	起始点（starting point）	hDDM贝叶斯估计	规范性机制
	漂移率（drift rate）	hDDM贝叶斯估计	确认偏误机制（核心）
	边界间距（boundary separation）	hDDM贝叶斯估计	决策阈值
神经变量（MEG）	SVM分类器到分离超平面距离	决策前训练→决策后泛化	连续神经DV
	神经累积斜率（slope）	时间序列线性回归	类比drift rate
	神经累积截距（intercept）	时间序列线性回归	类比starting point
	时间泛化矩阵	227×227解码精度	表征重激活动态
样本	Study 1: n=28; Study 2: n=23; Study 3: n=25	不同被试组	跨研究复制
激励	二次评分规则 (QSR)	Points = 100 × [1 - (correct - conf)²]	信心校准

维度5：局限性

样本量小：每项研究23-28人，效应量精确估计不确定，DDM参数后验区间可能受小样本影响。
生态效度有限：知觉决策任务与高阶信念（金融、政治、健康）在认知机制上可能存在质的差异；推广至复杂社会信念需谨慎。
决策后证据方向受控：实验中决策后证据始终与决策前证据一致，方向只取决于初始决策的正确与否；无法研究主动信息选择（active information sampling）情境下的确认偏误。
信心操纵幅度有限：HPE vs LPE仅产生Cohen's d = 0.21的信心差异，可能未充分跨越信心的全范围；强操纵可能产生更大或质变的效应。
决策后窗口短：每段RDK仅300-350ms，证据累积窗口受限；现实中决策后可能持续数小时至数月。
MEG解码假设：SVM跨时间泛化假设决策前与决策后的神经表征在同一空间，可能忽略了重新格式化的表征。
未控制注意力：未直接测量注意力分配，难以排除"高信心→对一致证据投入更多注意"作为漂移率偏移的中介变量。
个体差异未充分挖掘：未与特质性元认知能力、过度自信、人格变量挂钩，限制对临床/社会应用的转化。

维度7：可拓展的研究方向

金融决策应用：将范式转化为投资决策——投资者对一只股票形成初始判断后接收新信息，检验高信心是否选择性加速对支持性新闻的处理、抑制反驳信息，导致过度交易/持仓僵化。
政治信念与极化：将RDK替换为政治声明真伪判断，检验意识形态强度（类比信心）是否驱动神经层面的确认性证据累积偏好。
主动信息搜索：让被试在决策后选择查看哪种证据，检验信心是否引导对一致证据的偏好性搜索（与本文的被动呈现互补）。
临床应用：在精神分裂、强迫症、抑郁症患者中比较神经确认偏误的强度，识别元认知障碍的神经标记。
个体差异与训练：测量与多巴胺受体、前额叶活动相关的特质，并测试元认知训练（如准确性反馈）是否能缩小确认偏误。
跨模态扩展：将范式扩展至听觉、嗅觉、触觉，检验机制的通用性。
强化学习对接：将本文DDM机制嵌入贝叶斯/强化学习模型（参考Palminteri 2022 ConfirmationBias_ReinforcementLearning），统一确认偏误的瞬时（决策后）与累积（多次试次）效应。
AI/算法纠偏：基于神经累积差异，开发实时反馈系统在投资、医学诊断等高风险决策中检测并矫正确认偏误。
群体决策：测量群体讨论中信心高的成员是否在神经层面更强地"过滤"反对意见，影响群体智慧。
跨文化与发展：检验信心-确认偏误关系是否随文化（东方vs西方）和年龄（儿童、青少年、老年）变化。

核心结论一句话总结

高信心通过选择性改变决策后证据累积的神经加工速率（而非起始点偏移），放大与初始选择一致的信息处理、抑制不一致的信息处理，从而在计算和神经层面驱动确认偏误。

关键结论

信心独立于准确率驱动确认偏误：通过"正向证据操纵"在准确率与RT保持不变的情况下，单独提升信心即可显著降低改变决策的频率（个体间相关 r = -0.69, p < 0.0001），证明信心本身（而非客观证据强度）是确认偏误的关键驱动力。
机制核心是漂移率偏移而非起始点偏移：分层贝叶斯DDM（10模型比较）一致显示信心×初始决策对漂移率的交互（95% CI = 0.11-0.26）是确认偏误的主导计算机制；即高信心选择性地加速与初始选择一致的证据累积、减缓不一致的累积。
MEG提供神经层面直接证据：SVM时间泛化分析显示高信心条件下确认性证据的神经累积被放大、否定性证据的累积几乎被消除（信心×初始决策对斜率的交互 p = 0.008），且初始决策的神经表征在决策后被更早重新激活（p = 0.01），定位于中心-顶叶传感器（与CPP一致）。
机制的一般性与可证伪性：在与动机推理、自我形象、政治偏好均无关的纯知觉任务中观察到确认偏误，强烈支持"确认偏误是大脑信息加工的通用计算特征"假说，为理解政治极化、金融过度交易、回音室效应等社会现象提供了基础神经计算原语。
方法论价值：正向证据操纵+hDDM+MEG SVM时间泛化的整合范式，为信念更新研究提供了从行为到神经、从计算到机制的完整工具链，具有跨任务、跨领域的可复制性。

Rollwage_2020_Confidence_NeuralConfirmationBias