Zheng_Tang_2021_Gender_Herding
Gender and Herding
元数据
- 作者: Yao Zheng, Chun-Ping Tang (根据PDF内容推断)
- 年份: 2021 (推断)
- 期刊: 未明确标注(工作论文/已发表论文)
- JEL分类: G11; G14
- 关键词: Herding, Individual investors, Chinese stock markets, Gender
- 数据类型: 真实交易数据(非实验室实验)
- 研究类型: 实证研究(archival/field data)
一句话总结
利用 2007-2009 年中国某大型券商 161 万个人投资者的完整交易数据,证明女性投资者的同性别羊群倾向显著强于男性(LSV 差异约 27%),且该差异主要由女性较低的投资组合换手率(即较低的过度自信)所驱动;密集羊群行为带来的累积异常损失(高至 -6 pp 在 20 日内)大于过度自信本身的损失。
研究问题
- 个人投资者中女性的羊群行为是否系统性地强于男性?牛市与危机期间是否存在差异?
- 性别羊群差异的微观机制是什么——是过度自信差异、交易经验差异、还是两者并存?
- 密集的羊群交易是否带来负向投资绩效?这一影响在两性间是否存在差异?
- 在中国股市中,羊群行为与过度自信哪一个对个人投资者绩效的负面影响更大?
核心贡献
- 首次系统研究中国个人投资者羊群的性别差异:使用超 160 万投资者完整账户数据(2007-2009),覆盖 1,604 只 A 股,时空覆盖牛市与金融危机两个阶段,样本规模和深度远超此前 Tan et al. (2008)、Lao & Singh (2011) 等研究。
- 机制识别:通过 Female × Low Turnover 与 Female × Low Experience 交互项的对比回归,干净地识别"较低过度自信"为性别羊群差异的主导渠道——加入 Female × Low Turnover 后 Female 主效应消失,而加入 Female × Low Experience 不消除主效应。
- 量化羊群行为的经济成本:构建 B1-S1 零投资组合,发现密集羊群带来 1 日 -4.3% 至 -5.2%、20 日 -5.5% 至 -6.0% 的异常损失;女性损失大于男性,与其更密集的羊群行为一致。
- 羊群 vs. 过度自信的相对重要性:通过 IHM × Turnover 双重排序,证明在中国个人投资者群体中,羊群行为对绩效的负面影响大于过度自信,颠覆了将过度自信视为最重要负面因素的传统观点。
- 方法学三重稳健性:同时使用 LSV(群体层面)、IHM(个体层面)、Buy-Sell Imbalance(交易额加权)三种羊群测度,得出一致结论。
维度1:数据来源与实证策略
研究性质说明
本文不是实验室实验或田野实验,而是基于大规模真实交易记录的实证研究。以下按照数据收集与分析流程进行详细描述。
数据来源与样本
- 数据来源: 中国一家大型匿名券商(brokerage firm)的个人投资者交易数据
- 样本期间: 2007年1月1日至2009年7月31日
- 子期间1(牛市): 2007/01/01 - 2007/10/16(上证综指从2,675涨至6,124点)
- 子期间2(金融危机): 2007/10/17 - 2008/10/28(上证综指跌至1,664点)
- 原始样本: 超过200万个人投资者账户
- 清洗步骤:
- 删除仅持有证券投资基金、指数基金或B股的账户 -> 剩余1,703,951人
- 删除缺失年龄/性别信息或开户时未满18岁的账户 -> 删除2,299人
- 删除缺失开户日期的账户 -> 删除154人
- 删除持股或现金余额为负的账户 -> 删除979人
- 删除样本期内从未交易的账户 -> 删除88,195人
- 最终样本: 1,612,324个个人投资者
- 女性: 751,674人(46.62%)
- 男性: 860,650人(53.38%)
- 股票样本: 1,604只A股(上交所SSE和深交所SZSE)
- 辅助数据: CSMAR(通过WRDS获取)和RESSET数据库(股价、收益率、市值、交易量)
账户数据内容
每个投资者账户包含四类信息:
- 客户档案: 账号、开户日期、性别、国籍、出生日期、身份证号
- 日终余额: 每日现金余额
- 持仓文件: 股票代码、持股数量、市值
- 交易文件: 交易日期、股票代码、买卖股数、价格、交易类型(买/卖)、税前/税后成本
核心变量测度
(一)群体层面羊群行为测度: LSV方法 (Lakonishok, Shleifer, Vishny, 1992)
- 每日将投资者按性别分为两组,分别计算每只股票的LSV值
- LSV(i,j,t) = |B(i,j,t)/[B(i,j,t)+S(i,j,t)] - p(i,t)| - E|B(i,j,t)/[B(i,j,t)+S(i,j,t)] - p(i,t)|
- B(i,j,t): 第t天在性别组i中净买入股票j的投资者数量
- S(i,j,t): 第t天在性别组i中净卖出股票j的投资者数量
- p(i,t): 性别组i在所有股票中的平均净买入比例
- 进一步区分买方羊群(Buy LSV)和卖方羊群(Sell LSV),跟随Wermers (1999)方法
- 每日汇总为各性别组的日均LSV值,跟随Kim and Wei (2002)方法
(二)个体层面羊群行为测度: IHM (Individual Herding Measurement)
- 跟随Merli and Roger (2013)方法
- 先用全体投资者(不按性别分组)按月计算每只股票的signed LSV (SLSV)
- IHM(i,t) = [SUM(n_{i,j,t} * P_{j,t} * SLSV_{j,t})] / [SUM(|n_{i,j,t}| * P_{j,t})]
- n_{i,j,t}: 投资者i在月t交易股票j的股数
- P_{j,t}: 股票j在月t的平均价格
- IHM > 0表示投资者站在"羊群一侧",IHM < 0表示站在"反羊群一侧"
(三)投资组合换手率 (Portfolio Turnover)
- 跟随Barber and Odean (2001)方法
- 月度卖出换手率 + 月度买入换手率的平均值
- 作为过度自信的代理变量
(四)稳健性检验: 买卖不平衡度 (Buy-Sell Imbalance, IMB)
- IMB(i,j,t) = [Buy(i,j,t) - Sell(i,j,t)] / [Buy(i,j,t) + Sell(i,j,t)]
- 基于交易金额而非投资者人数
分析流程
- 性别羊群差异比较: 日均LSV统计比较(全期、牛市、危机期)
- 股票特征与羊群回归: 面板回归,因变量为stock-day层面LSV,自变量为MarketCap、Turnover、Return、Std_250,包含时间和股票固定效应,double-clustered标准误
- 控制混淆因素的IHM分析: 按AgeExperienceTurnover分组(8组),组内比较男女IHM
- 机制分析回归: 面板回归,因变量为月度IHM,自变量包括Female虚拟变量、FemaleLow Turnover、FemaleLow Experience交互项,控制Age、Experience、Turnover、Portfolio Value,时间固定效应,individual-time双重聚类标准误
- 羊群后果分析: 构建五分位买方/卖方投资组合,计算benchmark-adjusted累积异常收益(CAR),用Daniel et al. (1997)方法调整
- 羊群vs过度自信: 按IHM和Turnover双重排序,构建零投资组合比较收益
维度2:理论框架
理论框架
本文不构建正式理论模型,而是基于多个行为金融理论提出假说并进行实证检验。
核心理论基础
1. 从众/顺从理论 (Conformity Theory)
- 心理学研究表明女性比男性表现出更高的顺从度 (Cooper, 1979; Eagly, 1978; Eagly & Carli, 1981)
- 集体主义文化国家(如中国)的个体更倾向于从众 (Bond & Smith, 1996)
- 预测: 女性在股市中更倾向于跟随同性别投资者的行为
2. 过度自信理论 (Overconfidence Theory)
- 男性投资者比女性更过度自信 (Barber & Odean, 2001; Niederle & Vesterlund, 2007)
- 过度自信的投资者更信任自己的判断,更不可能跟随他人 (Goodfellow et al., 2009)
- 投资组合换手率作为过度自信的代理变量
- 预测: 女性因较低的过度自信而更倾向于羊群行为
3. 交易经验假说 (Trading Experience)
- 投资者在获得交易经验后,更依赖自身信息,减少羊群行为 (Merli & Roger, 2013)
- 女性平均交易经验低于男性(4.82年 vs 4.91年)
- 预测: 缺乏经验的投资者更倾向于羊群行为
4. 信息级联与行为驱动羊群的区分
- 如果羊群由信息驱动 -> 应观察到价格延续 (Hirshleifer et al., 1994)
- 如果羊群由行为因素驱动 -> 应观察到价格反转
- 本文发现: 密集交易后出现价格反转,支持行为驱动假说
关键假说
- H1: 女性的同性别羊群倾向强于男性
- H2: 市场条件(牛市vs危机)影响两性的羊群行为
- H3: 女性较低的投资组合换手率是性别羊群差异的主要来源
- H4: 密集羊群行为导致负向投资收益(价格反转)
维度3:核心发现
发现1:女性羊群倾向显著高于男性
| 指标 | 女性 | 男性 | 差异 | t值 |
|---|---|---|---|---|
| 全期LSV | 0.0486 | 0.0381 | 0.0106* | 21.51 |
| 全期Buy LSV | 0.0433 | 0.0336 | 0.0097* | 15.20 |
| 全期Sell LSV | 0.0530 | 0.0412 | 0.0118* | 17.75 |
- 经济含义: 若每组100人交易某只股票,女性中比男性多约1.06人站在同一方向
- 卖方羊群在两性中均强于买方羊群(与损失厌恶一致)
发现2:牛市期间羊群行为更为显著
| 子期间 | 女性LSV | 男性LSV | 差异 |
|---|---|---|---|
| 牛市期 | 0.0539 | 0.0395 | 0.0144* (t=18.34) |
| 危机期 | 0.0444 | 0.0371 | 0.0073* (t=9.54) |
- 牛市期间性别差异约为危机期的2倍
- 主要体现在买方羊群的增加上
发现3:股票特征对羊群的影响(面板回归,Table 4)
- MarketCap: 女性系数0.0184***,男性0.0122*** -> 两性都倾向于在大市值股票上集中交易
- Turnover: 女性系数0.4193***,男性0.3154*** -> 两性都在高换手率股票上表现更强羊群
- |Return|: 女性系数-0.0225***,男性-0.0000(不显著) -> 女性不太可能在极端收益率的股票上聚集
- Std_250(波动率): 对买方羊群,仅女性显著为正(0.0075***);对卖方羊群,两性均显著为负
- R-squared: 0.06 - 0.09
发现4:投资组合换手率是性别羊群差异的主要来源(Table 7回归)
- Female虚拟变量: Spec(1)中显著为正 -> 控制其他变量后女性仍羊群更多
- Turnover系数: 显著为负 -> 换手率每增加1个标准差,羊群倾向下降0.20%
- Female*Low Turnover交互项: Spec(2)中显著为正 -> 低换手率女性羊群显著更强
- 关键发现: 加入Female*Low Turnover后,Female主效应变得不显著 -> 当女性具有高换手率(即过度自信)时,性别差异消失
- Female*Low Experience交互项: Spec(3)中不显著 -> 交易经验不是性别差异的主要渠道
发现5:密集羊群行为的后果 -- 累积异常收益(Table 8)
男性(Panel A):
- 最高买方羊群组合(B1): CAR(1天) = -1.887%,CAR(20天) = -3.928%
- 最高卖方羊群组合(S1): CAR(1天) = +2.446%,CAR(20天) = +1.529%
- 零投资组合(B1-S1): 1天差异 = -4.333%,20天差异 = -5.458%
女性(Panel B):
- 最高买方羊群组合(B1): CAR(1天) = -2.092%,CAR(20天) = -4.054%
- 最高卖方羊群组合(S1): CAR(1天)后正,逐渐为正
- 零投资组合(B1-S1): 1天差异 = -5.174%,20天差异 = -6.045%
性别比较(Panel C): 女性的零投资组合损失大于男性 -> 女性因更密集的羊群行为损失更多
发现6:羊群对交易绩效的负面影响大于过度自信
- 按IHM和Turnover双重排序(Table 9):
- 高羊群组的零投资组合收益为负,低羊群组为正(无论换手率高低)
- 同一换手率组内,低羊群组显著跑赢高羊群组
- 同一羊群组内,低换手率组也跑赢高换手率组,但差异较小
- 结论: 在中国股市,羊群行为对投资绩效的负面影响大于过度自信
发现7:牛市期间损失更大(Table 10)
- 牛市期间男性零投资组合20天损失: -6.664%
- 牛市期间女性零投资组合20天损失: -7.407%
- 危机期间相应损失较小(男性-4.901%,女性-4.901%类似量级)
描述性统计要点
| 特征 | 女性 | 男性 |
|---|---|---|
| 平均年龄 | 39.33 | 38.11 |
| 交易经验(年) | 4.82 | 4.91 |
| 月均交易频率 | 16.44 | 17.36 |
| 月均换手率 | 0.68 | 0.73 |
维度6:与其他文献的关系
所属研究领域
- 行为金融学 (Behavioral Finance)
- 投资者行为与性别差异 (Gender Differences in Investment Behavior)
- 羊群行为 (Herding Behavior)
- 中国股票市场微观结构
与核心文献的关系
直接建立于:
- Lakonishok, Shleifer, Vishny (1992): LSV羊群行为测度方法的基础论文
- Merli and Roger (2013): 个体层面羊群测度(IHM)的方法来源;本文扩展了其研究,深入探究性别差异的来源和后果
- Wermers (1999): 区分买方/卖方羊群的方法
- Barber and Odean (2001): 性别与过度自信/投资行为的经典论文;换手率作为过度自信代理变量
与之对话的文献:
- Tan et al. (2008): 中国股市A/B股羊群行为(仅87只股票),本文使用1,604只A股扩展了覆盖范围
- Lao and Singh (2011): 中国和印度股市羊群行为(仅SSE前300只股票)
- Lee et al. (2013): 中国股市行业层面羊群行为
- Goodfellow et al. (2009): 波兰股市机构与个人投资者的羊群行为
- Hsieh (2013): 台湾股市个人与机构投资者的羊群行为及对收益的影响
心理学基础:
- Cooper (1979), Eagly (1978), Eagly and Carli (1981): 性别与顺从性差异的元分析
- Bond and Smith (1996): 集体主义文化与顺从性
- Cialdini and Goldstein (2004): 社会影响与顺从
主要贡献
- 首次系统研究中国个人投资者羊群行为的性别差异,使用超160万投资者的完整交易数据
- 揭示了性别羊群差异的机制: 女性较低的投资组合换手率(而非交易经验)是主要驱动因素
- 量化了羊群行为的后果: 羊群行为对投资绩效的负面影响大于过度自信
- 使用三种不同的羊群测度(LSV、IHM、买卖不平衡度)得出一致结论,增强了稳健性
- 覆盖牛市和金融危机两个时期,避免了前期研究的样本选择偏误
局限性
- 数据来自单一券商,可能存在选择偏差(尽管覆盖全国且性别比例与全市场一致)
- 样本期间(2007-2009)具有特殊性(极端牛市+金融危机)
- LSV方法基于投资者人数而非交易量,可能低估或高估实际羊群效应
- 无法完全区分"真正的羊群行为"与"虚假羊群"(spurious herding,即因相同信息做出相同决策)
- 非实验研究,因果推断需谨慎
维度4:关键变量概览
| 变量 | 类型 | 测量方式 | 用途 |
|---|---|---|---|
| LSV(i,j,t) | 关键因变量(连续) | Lakonishok-Shleifer-Vishny 群体羊群度,按性别分组每日计算每只股票 | 群体羊群水平比较 |
| Buy LSV / Sell LSV | 因变量(连续) | LSV 中买/卖侧分别测量(Wermers 1999 法) | 区分买方/卖方羊群强度 |
| IHM(i,t) | 关键因变量(连续) | 月度个体加权羊群指数(Merli-Roger 2013) | 个体层面羊群分析 |
| Buy-Sell IMB | 因变量(连续, [-1,1]) | (Buy-Sell)/(Buy+Sell),基于交易金额 | 稳健性检验 |
| Female | 关键自变量(二元) | 客户档案性别 | 主要解释变量 |
| Portfolio Turnover | 关键自变量(连续) | Barber-Odean 2001 法,月度卖出+买入平均 | 过度自信代理 |
| Experience(年) | 自变量(连续) | 当前日期 − 开户日期 | 交易经验代理 |
| Age | 控制变量(连续) | 当前日期 − 出生日期 | 控制年龄效应 |
| Portfolio Value | 控制变量(连续) | 月末持仓市值 | 控制财富效应 |
| MarketCap_j | 控制变量(连续) | 股票 j 的市值 | 股票特征 |
| Turnover_j | 控制变量(连续) | 股票 j 的换手率 | 股票流动性 |
| |Return_j| | 控制变量(连续) | 股票 j 收益绝对值 | 控制极端收益 |
| Std_250_j | 控制变量(连续) | 股票 j 250 日波动率 | 风险特征 |
| CAR(t,t+k) | 因变量(连续, %) | benchmark-adjusted 累积异常收益(DGTW 1997 法) | 羊群后果分析 |
| 牛市/危机 | 子样本变量(二元) | 2007/01-10 vs. 2007/10-2008/10 | 时期异质性 |
维度5:局限性
- 单一券商数据的选择偏差:尽管样本规模庞大(>160 万),但来自单一匿名券商,可能在地理/客户画像上不完全代表全国个人投资者;尽管性别比例与全市场一致仍需谨慎外推。
- 样本期特殊性:2007-2009 同时包含极端牛市(指数翻倍以上)与全球金融危机,结果对其他相对平稳时期的外推效度未知。
- LSV 测度局限:基于投资者人数而非交易量,可能低估大单驱动的羊群;同时 LSV 假设期望买入比例平均化处理可能在交易高度集中的市场被扭曲。
- 难以区分"真羊群"与"虚假羊群"(spurious herding):投资者可能因相同公开信息独立做出相同决策,与互相跟随的行为羊群难以从交易数据中清晰分开。
- 过度自信的间接代理:用 portfolio turnover 代理过度自信遵循 Barber-Odean 传统但本质上是一阶等价,未直接测量信心评分。
- 非实验设计,因果推断有限:交互项识别依赖功能形式假设,性别与换手率可能共同被未观测变量驱动(如风险偏好、教育、家庭责任)。
- 缺乏机制层面的心理测量:未直接测量被试的从众倾向、风险偏好、情绪状态,机制解释依赖于既有心理学文献。
- 未考虑社交网络效应:在中国"散户文化"中,股吧/微信群等社交因素可能驱动羊群,但未纳入分析。
- 缺乏对机构投资者的对照:本研究仅关注个人投资者,未与机构投资者羊群行为做对比,无法回答"性别差异是个人特有还是普遍"。
- 股票样本未细分:未区分国企/民企、行业、所有权结构等可能影响羊群机制的股票特征。
维度7:可拓展的研究方向
- 延长样本期:使用更长时段(如 2010-2025)数据检验结论在 A 股注册制改革、北向资金流入、量化交易兴起等不同制度环境下的稳健性。
- 整合社交媒体数据:将股吧、微信、雪球等社交平台讨论与交易数据匹配,识别社交网络对性别羊群差异的中介作用。
- 直接测量心理变量:通过问卷或实验补充测量被试的过度自信、风险偏好、情绪状态,做严格的机制分解。
- 机构投资者对比:将分析扩展到基金经理、券商自营、私募等机构层面性别羊群差异,连接 Barber_Odean_BoysWillBeBoys_Gender_Overconfidence。
- 跨文化比较:在集体主义(中国、日本、韩国)vs. 个人主义(美国、北欧)国家比较性别羊群差异,验证 Bond & Smith (1996) 关于文化-从众的预测。
- 干预实验:随机推送"反羊群"信息(如展示历史羊群损失)给部分投资者,因果识别羊群行为的可塑性。
- 羊群与极端事件:研究股灾(如 2015 年)期间性别羊群差异的放大效应,以及对系统性风险的贡献。
- 加密货币市场:扩展到加密货币市场的散户羊群行为与性别差异,比较不同资产类别的羊群机制。
- 与代表性偏差/外推预期联系:检验女性是否更倾向于使用代表性启发式(representativeness heuristic),从而连接 Barberis_2015_XCAPM_Extrapolative、Barberis_PsychologyBased_AssetPricing 框架。
- 政策含义:评估投资者教育、风险揭示、冷静期机制等监管干预是否对女性投资者更有效。
- 家庭层面分析:将个人账户与家庭账户合并,研究家庭决策中性别角色(Alesina_2013_GenderRoles_Plough)如何影响家庭投资组合的羊群倾向。
- AI 与人类投资者羊群比较:在 LLM 投资代理人之间研究"AI 群体性偏差"是否表现出类似性别羊群的同质化模式。
标签
#herding #gender #Chinese_stock_market #individual_investors #overconfidence #conformity #behavioral_finance #LSV #portfolio_turnover #archival_data
关键结论
- 性别羊群差异的驱动者是过度自信而非经验不足:女性投资者的羊群倾向显著强于男性,且这一差异主要由其较低的投资组合换手率(即较低的过度自信)所中介——当控制 Female × Low Turnover 后,Female 主效应消失。这一发现把性别羊群差异精确定位到 Barber-Odean 传统的过度自信框架中,而非笼统的"女性更从众"叙事。
- 羊群行为对个人投资者绩效的负面影响超过过度自信:B1-S1 零投资组合 20 日累积异常损失高至 -6%,且女性损失大于男性;同时 IHM × Turnover 双重排序揭示同换手率下高羊群组显著跑输低羊群组,差异大于同羊群组下高换手率与低换手率的差异。这一结果对中国监管机构的投资者保护政策设计具有直接含义:抑制群体性跟风(如打击股吧操纵、限制社交化投资工具的从众诱导设计)的边际收益可能高于抑制过度自信。相关链接:Barber_Odean_1998_IndividualInvestors_Performance、Barber_Odean_BoysWillBeBoys_Gender_Overconfidence、Odean_Volume_Overconfidence、Hwang_2004_MarketStress_Herding、BOYS WILL BE BOYS GENDER, OVERCONFIDENCE, AND COM、Alesina_2013_GenderRoles_Plough。