Jiao_082_Social_Media_News_Media
Social media, news media and the stock market
Jiao et al. (082) , Journal of Economic Behavior & Organization
摘要
We study the effect on stock volatility and turnover of coverage by traditional news media and social media. We find that coverage by traditional news media predicts decreases in subsequent volatility and turnover, but coverage by social media predicts increases in volatility and turnover. We show that these patters are consistent with a model of “echo chambers”, where social networks repeat news, but some investors interpret repeated signals as genuinely new information.
一句话总结
本文通过直接比较社交媒体与传统新闻媒体对股票的报道("buzz"),发现两者对后续股票波动率和换手率具有截然相反的预测效果——新闻媒体报道预测波动率和换手率下降,而社交媒体报道预测波动率和换手率上升——并用"回音室"(echo chamber)理论模型加以解释。
研究问题
股票市场对社交媒体报道与传统新闻媒体报道的反应是否存在系统性差异?两类媒体覆盖度(buzz)对个股后续的回报波动率和交易换手率分别有何预测作用?
核心贡献
- 首次直接比较社交媒体与新闻媒体对股票市场的影响,提供了"同一数据库、可比口径"的实证证据。
- 建立了新的程式化事实(stylized facts):两类媒体buzz对波动率和换手率的预测方向相反。
- 提出"回音室"理论模型——社交媒体重复新闻信号,部分行为交易者将重复信号误解为新信息,从而增加分歧和波动。
- 排除了过度自信、保守主义、理性忽略、确认偏差等替代性行为偏差机制。
维度1:数据来源与实证策略
数据来源
- 媒体数据:Thomson Reuters MarketPsych Index (TRMI) 数据库,提取每只股票在社交媒体和新闻媒体上的覆盖度(buzz)和情绪(sentiment)指标,每5分钟更新,论文使用月度汇总。
- 新闻媒体来源:Reuters News、MarketPsych收集的主流新闻、Moreover Technologies约50,000个新闻网站。
- 社交媒体来源:MarketPsych收集的论坛/推特、Moreover Technologies的社交媒体feed(约400万社交媒体源的前30%)。
- 金融数据:CRSP(月度股价、收益、交易量)和Compustat(杠杆率、HHI等)。
- 样本期间:2009年1月至2014年12月,72个月。
- 样本范围:NYSE、AMEX、NASDAQ上市股票,排除受管制公用事业、存款机构和控股投资公司。平衡面板包含1,848只股票。
关键变量构造
- Relative Buzz(BuzzS/BuzzN):个股当月buzz / 所有股票当月总buzz,连续变量,介于0和1之间。
- 异质波动率(iVolp):Fama-French三因子模型日度残差的月度平方和(参数法);稳健性检验使用日收益方差(iVoln,非参数法)。
- 换手率(Turn):月度交易量 / 流通股数。
实证策略
- 面板回归(核心模型,公式1和2):
- iVolp_{i,t+1} = α_i + μ_t + β_S BuzzS_{i,t} + β_N BuzzN_{i,t} + γX_{i,t} + δ·iVolp_{i,t} + ε_{i,t+1}
- 包含个股固定效应(α_i)和时间固定效应(μ_t),标准误按股票聚类。
- 面板向量自回归(Panel VAR):将BuzzN、BuzzS、iVolp、Turn作为内生变量,含2阶滞后,进行Granger因果检验和脉冲响应分析。
- 市场层面GJR-GARCH模型:检验市场层面buzz对市场回报波动率的影响。
内生性讨论
- 作者承认无法排除所有替代机制:未观测冲击可能同时驱动buzz和交易行为。
- 社交/新闻媒体覆盖度可能内生于先验不确定性、分歧程度等。
- 通过控制情绪、分析师分歧、行业子样本、市值分位数、市场条件等进行稳健性检验,但没有工具变量或准实验识别策略。
- VAR/Granger因果分析提供了动态因果方向的初步证据(新闻buzz → 社交buzz,反向不成立),但仍非严格因果。
维度2:理论框架
"回音室"(Echo Chamber)模型
模型设定一个三期经济体(t=0,1,2),两代交易者,一种风险资产:
-
信息结构:
- t=1时,到达N个新闻信号 s_n = θ + ε_n(含真实信息)和K个社交媒体信号 e_k = θ + ε_k(实质上是新闻信号的重复/回声,ē = s̄)。
-
交易者异质性:
- 理性交易者(占比 1-λ):仅根据新闻信号更新后验,忽略社交媒体。
- 行为交易者(占比 λ):将社交媒体回声误认为新信息,据此进一步更新后验,因此后验精度更高、信心更强。
-
核心机制:
- 行为交易者因过度信心产生更极端需求,与理性交易者产生分歧(disagreement)。
- 分歧驱动换手率上升、价格偏离基本面,进而使后续回报波动率上升。
-
模型预测(Proposition 1):
- 社交媒体buzz K增加 → 换手率上升、波动率上升。
- 新闻媒体buzz N增加 → 换手率下降、波动率下降(因更多真实信息降低不确定性和分歧)。
替代性行为偏差模型(Appendix B)
作者考察了四种替代机制:过度自信、保守主义、理性忽略、确认偏差。这四种模型均预测社交媒体buzz增加会降低波动率(因为社交媒体被视为包含真实信息),与实证结果不符。唯有"回音室"模型与数据一致。
维度3:核心发现
主要实证结果
-
社交媒体buzz预测波动率上升(β_S > 0,1%显著):BuzzS增加1个标准差,下月iVolp增加约0.04个标准差。经济意义上,从零buzz升至最高buzz(0.5%),波动率上升约0.31个标准差(54%的平均波动率)。
-
新闻媒体buzz预测波动率下降(β_N < 0,1%显著):BuzzN增加1个标准差,下月iVolp下降约0.05个标准差。等量新闻buzz增加使波动率下降0.39个标准差(68%的平均波动率)。
-
换手率模式完全对称:社交媒体buzz预测换手率上升(β_S > 0),新闻媒体buzz预测换手率下降(β_N < 0),均在1%水平显著。
-
Granger因果:VAR分析显示,新闻buzz的增加预测社交媒体buzz增加(p=0.054),但反向不成立。这支持"社交媒体是新闻的回声"的解释。
-
脉冲响应:社交媒体buzz冲击导致波动率和换手率短期上升,约1个月达峰后逐渐消退;新闻buzz冲击导致波动率显著下降。
-
市场层面:GJR-GARCH模型证实,市场层面新闻buzz降低市场波动率,社交媒体buzz增加市场波动率。换手率在市场层面结果不显著。
稳健性
- 非平衡面板、非参数波动率、逐行业排除、逐市值分位排除、异常buzz、绝对buzz、市场条件控制、样本选择偏差检验——所有结果均稳健。
维度4:变量概览
因变量(Y)
| 变量 | 定义 |
|---|---|
| iVolp(t+1) | 下月异质波动率(Fama-French三因子残差平方和) |
| iVoln(t+1) | 下月异质波动率(日收益方差,非参数) |
| Turn(t+1) | 下月换手率 |
核心解释变量(X / Treatment)
| 变量 | 定义 |
|---|---|
| BuzzN | 新闻媒体相对buzz(个股新闻buzz / 全市场新闻buzz) |
| BuzzS | 社交媒体相对buzz(个股社交buzz / 全市场社交buzz) |
控制变量
| 变量 | 定义 |
|---|---|
| iVolp / iVoln | 当期波动率(滞后因变量) |
| Turn | 当期换手率 |
| Size | 市值(对数) |
| InstOwn | 机构持股比例 |
| Return | 月收益率 |
| AbsReturn | 月收益率绝对值 |
| TotalSD | 过去60个月收益标准差 |
| HHI | Herfindahl-Hirschman行业集中度指数 |
| Leverage | 杠杆率 |
| SentN / SentN(-) | 新闻情绪及负面新闻情绪 |
| SentS / SentS(-) | 社交媒体情绪及负面社交情绪 |
| AnalystDisp | 分析师预测分歧 |
| 个股固定效应 α_i | 吸收股票层面不随时间变化的异质性 |
| 时间固定效应 μ_t | 吸收共同的时间趋势和市场冲击 |
维度5:局限性
- 因果识别不足:缺乏准实验变异,无法排除未观测冲击同时驱动buzz和市场结果的可能性。作者明确承认这一点。
- 机制无法精确锁定:虽然"回音室"模型与数据一致,但内生性buzz(由先验不确定性或分歧驱动)也可能解释相同模式。
- 无法观察交易者层面行为:数据仅有股票层面特征,无法区分哪些投资者关注社交媒体vs新闻媒体,无法直接验证行为交易者的存在。
- 样本期间:2009-2014年,社交媒体生态变化迅速,结果的外部效度需谨慎外推。
- 理论模型简化:单期交易、无噪声交易者、CARA效用、正态分布等假设限制了模型的一般性。
- 媒体内容差异:新闻媒体偏重事实,社交媒体偏重情绪(Appendix D),但论文未深入探讨内容差异对结果的影响。
维度6:与其他文献的关系
- Tetlock_2007_GivingContent — 新闻情绪预测收益和波动率的开创性研究,本文扩展至比较新闻与社交媒体。
- Tetlock_2011_AllNews — 投资者是否对重复新闻做出反应?与本文"回音室"假说直接相关。
- DeMarzo_2003_PersuasionBias — 说服偏差和一维意见模型,"回音室"效应的理论基础之一。
- Gentzkow_Shapiro_2011_IdeologicalSegregation — 线上线下意识形态分离,支持社交媒体信息回声的观点。
- Huberman_Regev_2001_ContagiousSpeculation — 重复信息引发市场反应的经典案例。
- Scheinkman_Xiong_2003_Overconfidence — 过度自信与投机泡沫,本文考察但排除的替代机制。
- Barberis_1998_InvestorSentiment — 保守主义偏差模型,本文的替代机制之一。
- Peng_Xiong_2006_InvestorAttention — 理性忽略模型,本文的替代机制之一。
- Kacperczyk_2016_RationalAttention — 理性注意力分配理论。
- Fang_Peress_2009_MediaCoverage — 新闻覆盖度与股票横截面收益。
- Bushee_2010_BusinessPress — 商业媒体降低信息不对称。
- Antweiler_Frank_2004_InternetStockMessages — 网络股票留言板的信息含量。
- Chen_2014_WisdomCrowds — 社交媒体传播的股票观点的价值。
- Da_2015_SumAllFEARS — 投资者情绪与资产价格。
维度7:可拓展的研究方向
- 因果识别:利用社交媒体平台政策变化(如Twitter算法调整、平台宕机事件)作为准自然实验,实现更严格的因果推断。
- 交易者层面分析:结合零售经纪数据(如Robinhood交易记录),直接检验关注社交媒体的交易者是否表现出更多的"回音室"行为。
- 信息内容分解:区分社交媒体中的原创内容 vs 纯粹转发/重复内容,精确衡量"回声"比例。
- 跨国比较:不同国家的媒体生态和投资者结构差异如何影响社交/新闻媒体的市场效应。
- 高频分析:利用TRMI的5分钟更新频率,研究日内buzz对价格发现和波动率的即时影响。
- 实验验证:设计实验室实验,直接操纵信息重复次数和来源,检验回音室效应的微观机制。
- 机器学习内容分析:用NLP技术量化新闻与社交媒体之间的文本相似度,直接测量"回声"程度。
- 与信念更新实验的联系:将本文的回音室假说与实验经济学中关于信念更新偏差(如base-rate neglect、correlation neglect)的研究相结合。
关键结论
社交媒体和新闻媒体对股票市场的影响方向截然相反:新闻媒体覆盖度增加降低后续波动率和换手率(反映真实信息降低了不确定性和分歧),而社交媒体覆盖度增加提高后续波动率和换手率(与"回音室"效应一致——社交媒体重复新闻信号,行为交易者将重复误认为新信息,增加信心和分歧)。这一发现对理解信息传播机制、投资者行为以及金融市场稳定性具有重要意义,也为监管社交媒体金融信息提供了实证基础。