Baker_2007_InvestorSentiment_StockMarket
Investor Sentiment in the Stock Market
Authors: Malcolm Baker, Jeffrey Wurgler
Journal: Journal of Economic Perspectives, Vol. 21, No. 2, Spring 2007, pp. 129--151
Affiliations: Harvard Business School; Stern School of Business, NYU; NBER
Data: 美国股票市场月度数据, 1962--2005 (CRSP); 情绪代理变量 1966--2005; 共同基金流量 1990--2005
一句话总结
将六个不完美的市场情绪代理变量(封闭式基金折价、换手率、IPO 数量与首日回报、股息溢价、新发行股权占比)通过主成分分析合成为单一"Baker-Wurgler 情绪指数",并在 1962–2005 年的美国股市数据中证明:投机性/难套利股票(小盘、年轻、亏损、高波动、不付息、困境或极端成长公司)具有更高的"情绪贝塔",且高情绪期之后这些股票的未来回报反而低于类债券股票——形成与传统风险定价模型相悖的"情绪跷跷板"模式。
研究问题
行为金融学是否能在系统性、可量化的层面解释股票市场的截面定价异常与时变可预测性?具体而言:(i) 是否存在一种统一的、综合性的投资者情绪度量,能够取代多个单一代理变量并捕捉到泡沫与崩盘的历史性事件?(ii) 这种情绪是否对不同类型股票产生截面差异化的影响——即"哪些股票最容易被情绪驱动"?(iii) 情绪能否反向预测未来回报,从而违背 CAPM 等传统模型"高风险 = 高期望回报"的核心论断?
核心贡献
- 提出"自上而下"的情绪研究范式:与从微观心理偏差(过度自信、代表性、保守主义)出发的"自下而上"方法形成互补,建立了一个聚合层面的可操作研究框架。
- 构建标准化情绪指数:通过对六个代理变量去除宏观基本面影响后做主成分分析,提出 SENT 与 ΔSENT 两个综合指数;该指数迅速成为行为金融实证研究中最广泛使用的情绪度量基准。
- 理论框架"情绪跷跷板"(Sentiment Seesaw):清晰阐明两个互相强化的机制——(a) 投机需求差异化(高情绪时投机性股票更被青睐)+ (b) 套利约束差异化(投机性股票同时也是难套利的),共同导致截面差异化的情绪敏感性。
- 实证发现截面情绪贝塔的"凸性":从最低到最高波动率十分位组合,情绪贝塔单调递增并呈现凸增长,且最安全股票呈现负贝塔("flight to quality"效应)。
- 发现回报率反转模式:高情绪后投机性股票未来月回报约 −0.6%、类债券股票约 +0.4%;低情绪后则反转——这一模式与情绪跷跷板的理论预测高度吻合,且直接违背传统 CAPM。
- 总体市场可预测性:情绪变化指数与等权/市值加权市场回报相关系数分别达 0.43/0.32,且情绪极端水平后的反向回报具有经济显著性。
- 共同基金流量验证:通过对 8 类股票型基金月流量做 PCA 分解,证明情绪指数与"投机需求"成分的相关性显著高于与"一般需求"的相关性,从机制层面验证了情绪渠道。
- 奠定情绪研究的方法论基础:本文及其 JF 完整版本(Baker & Wurgler 2006)成为后续文本情绪、社交媒体情绪、跨国情绪指数等大量研究的方法论原点。
维度1:综述框架与组织结构
整体方法论框架
本文采用**"自上而下"(top-down) 的实证方法**,区别于从个体心理偏差出发的"自下而上"方法。核心策略是:构建投资者情绪的综合度量指标,然后检验其对不同类型股票截面收益率和总体市场收益率的影响。属于行为金融领域的综述性与实证性论文。
情绪代理变量的选取
论文考察了多种潜在的情绪代理指标,按其在因果链中的位置排列(从最接近心理源头到最远):
- 投资者调查: Robert Shiller 投资者态度调查(1989年起)、UBS/Gallup 调查、Investors Intelligence 金融通讯调查
- 投资者情绪/情绪代理: 季节性情感障碍(Kamstra, Kramer, Levi 2003)、体育赛事结果(Edmans, Garcia, Norli)
- 散户投资者交易: Greenwood and Nagel (2006) 发现年轻投资者更可能在互联网泡沫顶部买入;Kumar and Lee 发现散户集体性买卖行为
- 共同基金流量: Brown, Goetzmann, Hiraki, Shiraishi, Watanabe (2002) 提出的基于资金在安全与风险基金间流动的度量
- 交易量: NYSE换手率,Baker and Stein (2004) 指出流动性本身可作为情绪指标
- 股息溢价: 付息股票与不付息股票的平均市值账面比差异(Baker and Wurgler 2004a, b)
- 封闭式基金折价: Zweig (1973), Lee, Shleifer, Thaler (1991) 提出的散户情绪指标
- 期权隐含波动率: VIX 指数,被称为"投资者恐惧指标"
- IPO首日回报率: 反映投资者热情程度
- IPO数量: 投行对"发行窗口"的判断反映市场情绪
- 新发行股权占比(Equity Share): Baker and Wurgler (2000) 发现高股权发行比例预示低未来回报
- 内部人交易: Seyhun (1998) 证明内部人交易模式包含系统性情绪成分
综合情绪指数的构建
- 去除宏观基本面影响: 将每个情绪代理变量对一组宏观经济指标(工业生产增长率、耐用品/非耐用品/服务消费增长率、就业增长率、NBER衰退指标)进行回归,取残差作为"纯"情绪代理
- 主成分分析(PCA): 对六个去基本面影响后的代理变量提取第一主成分,构建两个指数:
- 情绪水平指数(SENT): 六个代理变量水平值的第一主成分
- 情绪变化指数(\DeltaSENT): 六个代理变量变化值的第一主成分
- 指数公式:
- SENT = -0.23CEFD + 0.23TURN + 0.24NIPO + 0.29RIPO - 0.32PDND + 0.23S
- \Delta SENT = -0.17\Delta CEFD + 0.32\Delta TURN + 0.17\Delta NIPO + 0.41\Delta RIPO - 0.49\Delta PDND - 0.28\Delta S
- 其中 CEFD=封闭式基金折价,TURN=去趋势换手率,NIPO=IPO数量,RIPO=IPO首日回报率,PDND=股息溢价,S=新发行股权占比
共同基金流量分析
- 对八类股票型共同基金(从激进增长到收入型)的月度净流量数据做主成分分析
- 第一主成分 = "一般需求"(generic demand):投资者整体进出股票基金
- 第二主成分 = "投机需求"(speculative demand):资金在投机型与安全型基金间的转移
- 情绪变化指数与投机需求的相关系数为 0.36(高度显著),与一般需求的相关系数为 0.16
截面检验设计
- 分组标准: 按过去一年收益率波动率将股票分为十个十分位组合(高波动率 = 投机性/难以套利;低波动率 = 类债券/易于套利)
- 时间序列回归: 对每个十分位组合的月回报率分别对情绪变化指数(或共同基金流量成分)做回归,控制市值加权市场回报率
- 情绪贝塔(Sentiment Beta): 回归系数即为各组合对情绪的敏感度
收益率可预测性检验
- 按上月情绪水平将时间分为高情绪期和低情绪期
- 分别计算各波动率组合在两种情绪状态下的平均月回报率(经市值加权市场回报调整)
- 构建经验版的"情绪跷跷板"(sentiment seesaw),与理论预测对比
维度2:核心内容梳理
两大基本假设
行为金融的替代模型建立在两个核心假设之上:
假设1:投资者受到情绪(sentiment)影响
- 源自 DeLong, Shleifer, Summers, Waldmann (1990) 的噪声交易者模型
- 投资者情绪定义为:关于未来现金流和投资风险的信念,这些信念不被现有事实所支持
- 情绪不是单一心理偏差的产物,而是过度自信、代表性偏差、保守主义等多种认知偏差的简化形式综合
假设2:套利是有限的(Limits to Arbitrage)
- 源自 Shleifer and Vishny (1997)
- 理性套利者面临成本和风险限制,无法将价格完全推回基本面
- 限制来源:卖空成本、交易成本、短期业绩压力(基金经理面临赎回风险)、特质风险
"情绪跷跷板"理论框架(Figure 1)
这是本文的核心概念模型:
- 横轴: 股票的投机性和套利难度(从安全/易套利到投机/难套利)
- 纵轴: 估值水平(价格),P^* 表示无情绪下的基本面价格
- 三条线:
- 实线:无情绪时的总体估值线(反映风险特征的截面差异)
- 虚线(向右上方倾斜):高情绪时的估值线 -- 投机性股票估值膨胀更多
- 虚线(向右下方倾斜):低情绪时的估值线 -- 投机性股票估值下降更多
跷跷板的两个来源
来源1:投机需求差异化(情绪冲击在股票间不均匀)
- 投资者情绪 \approx 对投机的倾向(akin to propensity to play the lottery)
- 当情绪高涨时,对投机性证券的需求上升更多
- 因此投机性股票的同期收益率更高
来源2:套利难度差异化(套利约束在股票间不均匀)
- 投机性股票同时也是最难套利的:交易成本高、特质波动大、卖空困难、基本面遥远不确定
- 因此即使投机需求冲击是均匀的,套利限制的差异也会导致投机性股票受情绪影响更大
关键洞察: 在实践中,难以估值的证券恰恰也是难以套利的证券(the same securities that are difficult to value also tend to be difficult to arbitrage),这使得两个来源相互强化
哪些股票最具投机性/难以套利?
- 市值小、公司年轻、尚未盈利、高波动率、不支付股息、陷入财务困境、或处于极端增长阶段的公司
- 互联网泡沫时期的小型初创公司即为典型案例
- 相反,"类债券"股票(如受监管的公用事业公司)受情绪影响最小
与风险定价模型的区分
- 传统CAPM等模型: 预测高贝塔/高风险股票总是有更高的期望收益(风险溢价恒正)
- 情绪模型的独特预测: 高情绪时期,投机性股票的未来回报率反而低于类债券股票 -- 这在传统模型中不可能出现
与意见分歧模型的区分
- Hong and Stein (2003) 等意见分歧+卖空约束模型预测:由于乐观者主导定价,股票倾向被高估,因此高特质风险股票的无条件平均回报较低
- 情绪跷跷板模型的额外预测:套利困难的股票不仅可以被高估(高情绪时),也可以被低估(低情绪时,投资者过度悲观)
维度3:领域评估
发现1:情绪指数有效捕捉历史上的投机性事件
- 1966--2005年的情绪水平指数(Figure 2 Panel A)与历史记录高度吻合:
- 1967--1968年泡沫(加盟商、计算机公司、移动房屋制造商)
- 1970年代初期熊市 -> 指数低位
- "Nifty Fifty"泡沫(大型蓝筹股高估值,指数反映为低情绪,因为IPO等投机指标较低)
- 1980年代初高情绪(赌博类公司、自然资源创业公司、高科技/生物技术繁荣)
- 1987年后情绪回落
- 1999年互联网泡沫 -> 指数达到历史高点
发现2:投机性股票的情绪贝塔更高(截面效应)
- 基于共同基金流量(Figure 4 Panel A): 一般需求和投机需求对高波动率组合的影响显著大于低波动率组合。极端高波动率十分位组合呈现出不成比例的高敏感度(凸性模式)
- 基于情绪变化指数(Figure 4 Panel B): 情绪变化指数增加一个标准差,第八十分位组合回报增加约1个百分点,第十十分位组合(最投机)回报增加超过2个百分点
- 类债券股票的负情绪贝塔: 最安全的股票(最低波动率十分位组合)呈现出略微为负的情绪贝塔,与跷跷板中"品质转移"(flight to quality)效应一致
发现3:情绪预测截面回报率的反转(Figure 5)
这是本文最有力的实证结果:
- 低情绪之后: 投机性/高波动率股票的未来平均月回报率高于类债券/低波动率股票(约1%/月 vs. 0.5%/月)
- 高情绪之后: 投机性股票的未来平均月回报率低于类债券股票(约-0.6%/月 vs. 0.4%/月)
- 这一"交叉"模式与情绪跷跷板(Figure 1)的预测惊人一致
- 含义: 高情绪时期投机性股票被高估,随后情绪消退和基本面信息揭示导致价格修正,产生低回报;低情绪时期投机性股票被低估,回报相应较高
- 对传统模型的挑战: 风险更高的投机性股票有时期望回报反而更低,这直接违背了"高风险 = 高回报"的经典资产定价原理
发现4:情绪预测总体市场回报率(Figure 6)
- 等权市场回报率与情绪变化指数的相关系数为 0.43(高度显著)
- 市值加权市场回报率的相关系数为 0.32
- 等权 > 市值加权 的差距表明情绪对小盘股影响更大
- 回报率可预测性:
- 情绪高于均值一个标准差以上时:后续月均回报率 = -0.41%(等权)/ -0.34%(市值加权)
- 情绪低于均值一个标准差以上时:后续月均回报率 = +2.75%(等权)/ +1.18%(市值加权)
- 统计显著性有限(与股息率等其他总量预测指标类似),但经济意义显著
- 市场崩盘倾向于发生在高情绪时期,但崩盘的具体时点难以预测
发现5:共同基金流量印证情绪渠道
- 共同基金流量分解为"一般需求"和"投机需求"两个正交成分
- 投机需求与情绪变化指数的相关系数(0.36)显著高于一般需求(0.16)
- 这验证了情绪指数确实在捕捉投资者在投机性与安全性资产之间的偏好转移
维度5:与其他文献的关系
在行为金融文献中的位置
本文是行为金融领域的标志性综述与实证论文,发表于经济学顶级综述期刊 Journal of Economic Perspectives。它系统性地提出了"自上而下"的投资者情绪研究范式,与"自下而上"的心理偏差微观基础方法(如 Barberis, Shleifer, Vishny 1998; Daniel, Hirshleifer, Subrahmanyman 1998)形成互补。
理论基础
- 噪声交易者模型: DeLong, Shleifer, Summers, Waldmann (1990) 的开创性工作提供了框架 -- 市场中存在受情绪驱动的非理性交易者和受成本/风险约束的理性套利者
- 套利限制文献: Shleifer and Vishny (1997) 论证了现实中套利的成本和风险使得理性力量无法完全纠正错误定价
- 意见分歧模型: Miller (1977) 指出即使投资者掌握相同信息,意见分歧也可以很大;Hong and Stein (2003) 将意见分歧与卖空约束结合
核心方法论贡献
- 综合情绪指数方法: 本文(及 Baker and Wurgler 2006 的完整版本)将多个不完美的情绪代理变量通过主成分分析合成为单一指数,成为后续文献中被广泛采用的标准方法
- Baker-Wurgler 情绪指数已成为金融学实证研究中引用最广泛的情绪度量之一,数据公开在作者网站上
与作者自身研究体系的关系
- Baker and Wurgler (2000):新发行股权占比预测总体市场回报
- Baker and Stein (2004):流动性作为情绪指标的理论模型
- Baker and Wurgler (2004a, b):股息溢价作为情绪指标;迎合理论解释股息政策变迁
- Baker and Wurgler (2006), Journal of Finance:本文的完整学术版本,提供更详细的实证检验,按公司年龄、规模、盈利状况、股息支付、成长性、财务困境等多维度分组
与实验/信念文献的联系
- 投资者情绪的概念与实验经济学中的信念偏差研究相关:情绪本质上是关于未来收益和风险的系统性错误信念
- 过度自信(overconfidence)、代表性启发式(representativeness)、保守主义(conservatism)等心理偏差是情绪的微观来源(Daniel et al. 1998; Barberis et al. 1998)
- 情绪的时变特征呼应了信念更新实验中观察到的外推偏差(extrapolation bias)和近因效应(recency bias)
对后续文献的深远影响
- 情绪度量的标准化: Baker-Wurgler 指数被广泛应用于资产定价、公司金融、宏观经济学研究
- 文本分析与大数据方法: 后续研究发展出基于新闻文本、社交媒体、搜索引擎数据的新一代情绪指标
- 国际拓展: 多国版本的情绪指数被构建并用于检验跨国资产定价异象
- 公司金融应用: 情绪影响企业融资决策(择时发行股票/债务)、投资决策、并购活动
- 资产定价因子模型: 情绪贝塔(sentiment beta)的概念被后续文献正式纳入多因子定价框架
Tags: #investor_sentiment #behavioral_finance #limits_to_arbitrage #stock_returns #cross_section #return_predictability #sentiment_index #PCA #mutual_fund_flows #speculative_stocks #sentiment_seesaw #Baker_Wurgler #noise_traders #IPO #closed_end_fund_discount #VIX
维度4:局限性
- 情绪代理变量的内生性:六个代理变量本身可能受未观测到的基本面或风险偏好变动影响;尽管对宏观变量做了正交化,但仍无法完全分离"情绪"与"风险溢价时变"。
- PCA 权重的不稳定性:第一主成分的权重依赖于样本期;在不同时间窗或国家市场上重新拟合可能给出不同的指数构造。
- 情绪与基本面的辨识难题:高情绪期投机性股票回报高,可能是"情绪驱动 + 后续修正",也可能是"基本面冲击短期共动 + 均值回复";两者的实证识别在观测数据下永远是部分识别。
- 可预测性的统计显著性有限:与股息率等总量预测指标类似,情绪对市场回报的可预测性在常规显著性水平上脆弱(虽经济意义大)。
- 依赖事后选定的代理变量集合:六个代理变量是基于既有文献和经验筛选,存在"data snooping"嫌疑;不同选择会改变指数构造与结论。
- 缺乏微观基础:作为"自上而下"方法,并未直接对应到具体的心理偏差或个体决策机制;需与 Daniel_Hirshleifer_2015_Overconfident_Returns_Trading、Barberis_2015_XCAPM_Extrapolative 等微观行为模型互补理解。
- 样本期局限:1962–2005 主要为美国经验;对结构性变化(高频交易兴起、ETF 普及、机构占比提升)后情绪机制是否稳定未充分讨论。
- 横截面分组维度单一:本文主要按波动率十分位分组;其他投机性维度(年龄、规模、盈利、股息)在 Baker & Wurgler (2006) 中详述,但本文版本简化处理。
维度6:可拓展的研究方向
- 新一代情绪指标的整合:将传统六代理与文本(10-K、新闻、社交媒体)、Google Trends、ETF 流量等 alternative data 融合,构建机器学习驱动的情绪因子。
- 跨国比较:在欧洲、亚洲、新兴市场重建 BW 指数,检验不同市场结构、机构占比、卖空约束下情绪效应的强度差异。
- 结构性识别:用 SVAR、自然实验(如指数纳入、ETF 推出、税收改革)识别情绪冲击与基本面冲击的因果分离,与 Martin_Papadimitriou_2022_Sentiment_Speculation_HeterogeneousBeliefs 的结构模型对话。
- 微观—宏观桥梁:在投资者层面(券商账户)测量个体情绪敏感性,与 BW 指数聚合后做时间序列回归,验证微观偏差到宏观情绪的聚合机制;可与 Daniel_Hirshleifer_2015_Overconfident_Returns_Trading 的过度自信框架结合。
- 结合外推性预期:BW 情绪与 Barberis_2015_XCAPM_Extrapolative 的外推 CAPM 关系——高情绪是否就是"被外推的近期高回报"?两者能否在数据上区分?
- 危机与情绪:将 BW 指数与 Gennaioli_Shleifer_2018_CrisisOfBeliefs 的危机信念框架结合,检验金融危机前后情绪反转的预测力。
- 公司金融决策的情绪择时:情绪高位时管理者是否更频繁发行股权、并购溢价更高?基于 BW 指数的事件研究框架。
- ESG / 主题投资中的情绪:清洁能源、AI、加密货币等主题板块的情绪贝塔是否系统性高于市场?是否构成新的"投机性子样本"?
- 算法交易与高频情绪:高频数据下情绪是否仍可识别?Tick-level 情绪指标的构造与回测。
- 情绪与货币政策传导:央行政策声明的语调是否成为系统性情绪冲击源?情绪通过何种渠道影响实体经济。
关键结论
- 统一的情绪度量是可操作的:通过对多个不完美代理变量做主成分分析并去除基本面影响,可以构造出在历史上准确捕捉到 1968 年泡沫、Nifty Fifty、1987 崩盘前夜与 2000 年互联网泡沫等关键事件的综合情绪指数。
- 截面情绪敏感性差异显著且与套利难度共变:投机性/难套利股票(小盘、年轻、亏损、高波动、不付息、困境或极端成长)具有更高的情绪贝塔,且高情绪时被高估、低情绪时被低估。
- 情绪反向预测未来回报:高情绪后投机性股票回报反而低于安全股票,低情绪后反转——这一"情绪跷跷板"模式与传统 CAPM "高风险 = 高期望回报"的核心论断相悖,是行为金融对经典定价理论的重要挑战。
- 共同基金流量验证情绪渠道的真实存在:投机需求成分与情绪指数高度相关 (ρ = 0.36),证明 BW 情绪指数确实在度量投资者在投机性与安全性资产之间的偏好转移,而非纯粹的统计构造。