Fehr_Huck_2016_StrategicAwareness_CognitiveAbility
Who Knows It Is a Game? On Strategic Awareness and Cognitive Ability
Authors: Dietmar Fehr, Steffen Huck
Journal: Experimental Economics, 2016, 19: 713-726
DOI: 10.1007/s10683-015-9461-0
JEL: C7, C9, D0
一句话总结
通过240人的实验室博弈研究发现,认知能力(CRT)影响"是否意识到自己在玩博弈"这一基础维度——只有CRT满分(3/3)的被试才会将"对他人认知能力的信念"纳入选美博弈(p=2/3 BCG)的决策;CRT≤2的被试如同在玩随机抽奖,揭示策略意识(strategic awareness)存在认知能力门槛。
研究问题
- 在策略博弈中,level-k模型假设所有玩家至少进行某种程度的策略推理,但这一假设是否成立?是否存在被试根本"不知道这是一个博弈"?
- 认知能力(用CRT和WPT测量)与策略意识之间是线性关系,还是存在非线性门槛效应?
- 一个被试对他人认知能力的信念是否影响其博弈行为?这种影响是否依赖于该被试自身的认知水平?
核心贡献
- 提出"策略意识"概念:在level-k思维之前退一步,区分"是否意识到处于博弈情境"(level-zero awareness)与"在博弈中推理多深"(level-k)两个层次
- 方法学创新——CRT信念引出:除让被试做CRT测试外,还要求被试预测同场其他被试的CRT正确率(每次准确预测奖0.25欧元),从而获取对他人认知能力信念的可激励测度
- 识别非线性门槛效应:发现CRT满分(3分)与CRT≤2分的被试在BCG行为上有质的差异——前者的选择系统性受信念影响,后者基本随机;这一非线性门槛效应是对线性"认知能力—策略精细度"关系文献的重要补充
- BBQ作为最强单题预测器:在CRT三题中,球拍-球问题(BBQ)虽然最难(仅32%答对),但单独是策略行为最强预测指标;BBQ答对者BCG选择平均低18.6个单位
- 理论意义:策略意识的存在质疑了level-k模型的基础假设,提示行为博弈论模型应考虑"不参与策略推理"的玩家类型
维度1:实验设计分析
研究问题
认知能力是否影响个体在策略互动中的"策略意识"(strategic awareness)——即被试是否意识到自己在玩博弈、需要推理他人行为?
被试与实验环境
- 被试数量: 240人
- 地点: WZB-TU实验室(柏林),2010年5月至2013年6月,共15场计算机化实验
- 分组: 被试随机匹配为6人一组(4场实验为12人一组)
- 招募: 通过ORSEE招募
- 软件: z-Tree
实验任务详细流程
第一步:认知反映测试(CRT)
- 在博弈之前进行Frederick (2005)经典三题CRT测试:
- 球拍与球问题(BBQ): 球拍和球共1.10欧元,球拍比球贵1.00欧元,球多少钱?(正确答案:0.05欧元;直觉答案:0.10欧元)
- 机器问题(Widgets): 5台机器5分钟做5个零件,100台机器做100个零件要多久?
- 睡莲问题(Lake): 睡莲每天面积翻倍,48天覆盖整个湖,覆盖半个湖要多少天?
- 每答对一题奖励1欧元
- 关键创新设计: CRT之后,被试需要估计同场实验中其他被试每道CRT题的正确率,每次正确预测奖励0.25欧元(最多0.75欧元)——这提供了被试对他人认知能力的信念测度
第二步:选美博弈(Beauty Contest Game, BCG)
- 标准p-选美博弈,p = 2/3
- 被试从[0, 100]区间选择一个整数
- 最接近组平均值 * 2/3 的人赢得5欧元奖金(平局均分)
- 唯一纳什均衡为0(通过迭代剔除弱劣势策略得出)
- 指令包含说明性例子,被试阅读后确认理解才能进入博弈
- 一次性博弈(one-shot),结果在实验结束后公布
第三步:Wonderlic人事测试(WPT)
- 5分钟、20题版本的WPT
- 作为一般认知能力的补充测度(稳健性检验)
- 每答对一题奖励0.25欧元
- 安排在实验最后进行
- 未引出被试对他人WPT成绩的信念
支付结构
- BCG赢家:5欧元(平局均分)
- CRT:每题正确1欧元
- CRT信念引出:每次正确预测0.25欧元(最多0.75欧元)
- WPT:每题0.25欧元
设计亮点
- 利用CRT信念引出巧妙地测度了"对他人认知能力的信念",而不直接引出策略行为相关信念(后者等价于要求被试报告自己的策略选择)
- CRT在BCG之前施测,可能提高了被试的策略意识(作者承认这一点但认为效应有限)
维度2:理论模型
核心理论概念:策略意识(Strategic Awareness)
- 定义: 被试是否意识到自己处于策略情境中,从而需要推理他人的行为
- 这比level-k模型中的推理层级更为基本——它是"第零步":你是否知道这是一个博弈?
- Level-k框架假设所有玩家至少是level-0(随机选择)或更高,但本文质疑:低认知能力的被试可能根本没有意识到需要推理他人
理论预测
- 如果认知能力与策略意识相关,则:
- 高认知能力被试: 意识到博弈结构,会推理他人行为,其选择会受到对他人认知能力的信念影响
- 低认知能力被试: 缺乏策略意识,如同在玩"运气游戏",在整个区间随机选择,其行为不受对他人认知能力信念的影响
- 这一关系是高度非线性的:存在一个认知能力门槛,低于门槛的被试完全缺乏策略意识
与level-k模型的关系
- 传统level-k模型假设高层级玩家锚定在level-0行为上进行最优反应,信念形成过程逐步迭代
- 本文补充:推理如何玩博弈(level-k思维)的前提是意识到这是一个博弈(策略意识)
- 策略意识不要求基于均衡模型的信念——信念可以基于非均衡行为、启发式等
识别策略
- 间接识别法: 不直接测量策略意识,而是通过以下逻辑推断:
- 如果被试有策略意识,则其BCG选择应取决于对他人认知能力的信念
- 如果被试缺乏策略意识,则其BCG选择与对他人的信念无关
- 通过分样本回归(CRT=3 vs. CRT<3)检验这一非线性关系
维度3:核心发现
1. BCG选择的描述性统计
- 平均选择:45.1
- 约68%的选择低于50
- 双峰分布:两个众数在50和33附近
- 约19%的选择在67-100之间(违反一步迭代剔除)
2. 认知能力与BCG选择的关系(高度非线性)
- CRT平均分:1.49(48%的被试答对0-1题,52%答对2-3题)
- CRT 0-2分的被试: 选择几乎随机分布在整个区间,中位数选择对高低认知能力子样本无显著差异
- CRT 3分的被试: 系统性地回避50以上的数字,平均选择29.1
- Mann-Whitney检验:CRT=3 vs. CRT<=2的选择分布差异显著(z=5.351, p<0.01)
- 选择67-100的被试平均CRT=0.89,显著低于选择低于67的被试平均CRT=1.63(p<0.01)
3. Tobit回归:认知能力对BCG选择的效应(Table 2)
| 变量 | 系数 | 标准误 | 显著性 |
|---|---|---|---|
| CRT score = 3 (虚拟变量) | -19.534 | (3.792) | *** |
| BBQ正确 (虚拟变量) | -18.573 | (2.811) | *** |
| WPT分数 | -3.522 | (0.690) | *** |
| STEM专业 | -7.173 | (3.299) | ** |
| 女性 | +5.126 | (3.165) | n.s. |
- CRT满分被试的BCG选择比其他人低约19.5个单位
- BBQ答对者的选择低约18.6个单位
- WPT每多答对一题,选择降低约3.5个单位
- CRT与WPT的相关系数为0.47(p<0.01)
4. 核心发现:策略意识的非线性门槛效应(Table 3)
分样本回归——CRT=3的被试(N=48):
| 变量 | 系数 | 标准误 | 显著性 |
|---|---|---|---|
| 预期BBQ正确比例 | -15.693 | (7.498) | ** |
| 平均预期正确比例 | -12.747 | (8.321) | n.s. (p=0.067) |
分样本回归——CRT<3的被试(N=192):
| 变量 | 系数 | 标准误 | 显著性 |
|---|---|---|---|
| 预期BBQ正确比例 | -6.333 | (6.363) | n.s. |
| 平均预期正确比例 | -5.032 | (10.052) | n.s. |
- 关键对比: 对于CRT满分的被试,对他人认知能力的信念显著预测其BCG选择(系数-15.7, p<0.05);对于CRT<3的被试,信念对选择无预测力
- 替代样本切分(BBQ正确 vs. BBQ错误)结果一致:BBQ正确者的预期BBQ正确比例系数为-11.748(p<0.05),BBQ错误者系数为-7.309(n.s.)
5. CRT各题难度与信念校准
- BBQ正确率仅32%(远低于其他两题的59%和58%)
- BBQ答错者过度自信:认为73%的人答对了BBQ
- BBQ答对者校准更好:认为52%的人答对了BBQ(p<0.01)
- BBQ答对者也更可能赢得BCG奖金(p=0.04, chi-squared检验)
维度6:与其他文献的关系
所属领域
实验经济学 / 行为博弈论 / 认知能力与经济决策
与核心文献的关系
选美博弈(BCG)文献:
- Nagel (1995):经典BCG实验,开创level-k思维研究
- Ho et al. (1998), Costa-Gomes & Crawford (2006):BCG中的迭代优势与最优反应
- Crawford et al. (2013):非均衡策略思维的结构模型综述
- 本文贡献: 在level-k框架之前退后一步,提出"策略意识"这一更基本的概念
认知能力与BCG行为:
- Burnham et al. (2009):高认知能力与BCG中更低选择相关
- Branas-Garza et al. (2012):CRT与BCG行为的关系在不同p值下不一致
- Carpenter et al. (2013):认知能力与策略精细度
- Gill & Prowse (2015):重复BCG中高能力者学习更快
- Georganas et al. (2015):CRT与level-2行为相关
- 本文区别: 不仅测量认知能力与行为的关系,更引入对他人认知能力的信念,揭示策略意识的非线性门槛
操纵对手精细度的信念:
- Agranov et al. (2012):告知本科生对手为研究生 vs. 本科生,观察行为变化
- Alaoui & Penta (2015):推理深度随对手精细度而变
- 本文区别: 不操纵信念,而是自然测量信念并观察其与行为的关联
认知能力与经济决策更广泛文献:
- Frederick (2005):CRT的开创性论文
- Benjamin et al. (2013):认知能力与行为偏差
- Dohmen et al. (2010):认知能力与风险偏好/时间偏好
- Toplak et al. (2011):CRT作为认知偏差免疫力的预测指标
核心学术贡献
- 提出"策略意识"概念,补充level-k框架的理论基础
- 发现认知能力与策略行为之间存在非线性门槛效应——低于门槛的被试如同玩随机抽奖
- 证明只有超过认知能力门槛的被试才会将对他人认知能力的信念纳入决策
- BBQ(CRT中最难的一题)是策略行为最强的单一预测指标
局限性
- 样本量有限(CRT=3子样本仅48人)
- CRT在BCG之前施测可能提高策略意识(顺序效应)
- 未直接测量策略意识,而是通过间接推断
- 一次性博弈,无法观察学习动态
- 引出对他人CRT表现的信念可能使策略情境更突出
维度4:变量概览
自变量
认知能力测量:
- CRT总分(0-3):Frederick (2005) 三题
- BBQ(球拍与球问题,正确率32%)
- Widgets(机器问题,正确率59%)
- Lake(睡莲问题,正确率58%)
- WPT分数:Wonderlic Personnel Test 5分钟20题版本
- BBQ单独虚拟变量
- CRT满分(=3)虚拟变量
信念测量:
- 对其他被试每道CRT题正确率的预测(0-100%)
- "Predicted BBQ correct rate"(最关键变量)
- "Average predicted correct rate"(三题平均)
人口统计变量:
- 性别(女性虚拟变量)
- 专业(STEM虚拟变量)
- 年龄
因变量
| 变量 | 取值范围 | 测量 |
|---|---|---|
| BCG数字选择 | [0, 100] 整数 | 一次性博弈 |
| BCG获胜(虚拟) | 0/1 | 是否最接近(2/3)·均值 |
| 选择是否在劣策略区 | 0/1 | 是否>67(违反一步迭代剔除) |
关键参数与样本
- 总样本:240人,6人或12人一组
- 实验场次:15场(2010-2013,柏林WZB-TU实验室)
- 软件:z-Tree;招募:ORSEE
- 支付:BCG赢家5欧元;CRT每题1欧元;CRT信念准确每次0.25欧元;WPT每题0.25欧元
- 主要计量方法:Tobit回归(BCG选择有0和100上下限)+ 分样本回归(CRT=3 vs. CRT<3)+ Mann-Whitney U 检验
- CRT与WPT相关系数:r=0.47 (p<0.01)
- CRT分布:48%被试 0-1分,52%被试 2-3分;CRT平均1.49
维度5:局限性
- 样本量有限:CRT满分子样本仅48人,统计效力受限;非线性门槛的精确位置识别不充分
- 顺序效应:CRT在BCG之前施测可能提高了被试的策略意识——若在更"无意识"状态下玩BCG,门槛效应可能更明显或不同
- 策略意识的间接识别:未直接测量被试的"我在玩博弈"意识,而是通过"对他人信念是否影响选择"间接推断;可能存在其他混淆机制
- CRT信念引出的潜在影响:要求被试预测他人CRT表现可能本身使策略情境更突出(反应性)
- 一次性博弈:无法观察学习动态,无法区分"无策略意识"与"未意识到信念可影响选择但通过博弈学习"
- 特定参数选择:仅使用p=2/3的BCG;不同p值下门槛位置可能不同
- 未直接操纵信念:与Agranov et al. (2012)的对手类型操纵不同,本文仅测量自然信念
- 样本特异性:柏林大学生样本,外部效度未知
- 未控制风险偏好:高认知能力者也可能更厌恶风险,从而选择更低数字,存在替代解释
- CRT各题相关性差异:BBQ独自有强预测力,可能反映BBQ捕捉了与策略推理特别相关的认知偏差克服能力,而非整体认知能力本身
维度7:可拓展的研究方向
- 直接测量策略意识:用过程数据(眼动、反应时间、思维出声协议)或事后自报问卷直接测量被试是否意识到博弈结构
- 门槛位置的精确识别:使用更大样本与更细致的认知能力梯度(如10题CRT-长版本)识别门槛的精确位置和形状
- 不同博弈类型:在协调博弈、囚徒困境、谈判博弈等不同博弈中检验策略意识的门槛效应是否普遍
- 重复博弈与学习:观察初始无策略意识的被试在重复博弈中是否能"觉醒",以及哪些反馈类型最能促进觉醒
- 结构估计:将"无策略意识"作为level-k之外的一个独立类型纳入混合模型,估计其在人群中的比例
- 教育/训练干预:测试简短干预(如解释博弈结构、提示推理他人)能否提高低认知能力被试的策略意识
- 信念操纵的因果效应:随机告知被试"对手都是高/低CRT分数者",观察行为如何变化,与本文自然信念测量结合
- 现实场景应用:将"策略意识门槛"映射到金融决策(如金融理解力低的散户是否在交易中根本不意识到对手在博弈);可对接Lusardi_2012_NumeracyFinancialLiteracy
- 认知能力 vs. 经验:考察专业从业者(金融分析师、扑克玩家)是否通过经验补偿低CRT的策略意识缺失
- 跨文化与跨年龄:在儿童、老年人、不同教育体系中检验门槛是否普遍存在
标签
#strategic_awareness #cognitive_ability #beauty_contest_game #CRT #level_k #belief_elicitation #experimental_economics #nonlinear_threshold #strategic_sophistication
关键结论
- 认知能力与策略行为关系是非线性的,存在门槛效应:CRT≤2分的被试BCG选择几乎随机分布,CRT满分被试系统性回避高数字,平均选择29.1(低19.5个单位);线性"认知能力—精细度"关系不成立
- 只有越过认知门槛,对他人信念才进入决策:CRT满分子样本中,"对他人BBQ正确率的预测"系数为-15.7(p<0.05);CRT≤2子样本中信念系数不显著,证明低认知者根本不在博弈中使用关于他人能力的信息
- BBQ单独是策略行为最强预测器:CRT三题中最难的BBQ(仅32%答对)独自解释BCG选择的能力比CRT总分还强;BBQ捕捉了"克服直觉冲动、进行反思"的关键认知能力
- 过度自信与策略表现的关联:BBQ答错者过度自信(认为73%的人答对,实际只有32%),其BCG表现也更差;自我认知准确性与策略表现正相关
- 理论意义——补充level-k框架:Level-k模型假设所有玩家至少在某种程度上参与策略推理;本文证明存在大量"零级意识"的玩家——他们不只是level-0行为,而是根本未意识到博弈结构
- 方法论意义——CRT信念引出:通过让被试预测他人CRT表现来获取"对他人认知能力的信念",提供了在不直接询问策略相关信念(其本身等价于策略选择)的情况下测量信念的巧妙工具
- 政策与建模含义:在博弈论模型应用于现实情境(市场设计、政策实施)时,需考虑大量参与者可能缺乏策略意识;线性"认知能力提升→更优策略行为"的政策预期可能误导