Hashimoto_Takayanagi_2026_LLMAgents_HumanBias_MarketDynamics
一句话总结
通过设计 FCLAgent (Fundamental-Chartist-LLM Agent) 混合架构,证明 LLM 在 prompt context 下自然涌现 loss aversion 与 herd behavior 偏差,且将少量 FCLAgent 注入人工股票市场即可复现 all-time-high 与 OFI-future-return 等真实市场异象。
研究问题
- LLM agent 是否在不同市场 context (相对 ATH/ATL 位置、OFI 水平、他人行为可见性) 下表现出与人类一致的 context-dependent 行为偏差?
- 当将 LLM agent 嵌入 agent-based 人工股票市场时,能否复现 path-dependent 的真实市场异象,如 all-time-high 异象与 OFI 预测收益异象?
- 如何在保留 LLM 行为偏差特征的同时确保 agent 在数值计算上的可靠性?
核心贡献
- 方法论创新:提出 LLM-augmented agent-based modeling 范式,FCLAgent 将交易方向决策 (LLM, context-dependent) 与价格/数量计算 (传统规则) 分离的混合架构;
- 微观证据:在单 agent 模拟中通过四种 context 情境 (G+/G-/L-/L+) 系统验证 LLM 的 context-dependent loss aversion,并通过多 agent 模拟验证 OFI 与 leader-board 信息触发 herd behavior;
- 宏观证据:仅替换 5 个 FCNAgent 为 FCLAgent (千分之五的比例) 即可复现真实市场的 β^h < 0 与 β^OFI > 0 异象,定量结果落入真实数据 95% 置信区间;
- 稳健性:所有 stylized facts (kurtosis、绝对收益自相关、收益-成交量正相关) 在引入 FCLAgent 后保持,证明该方法不破坏市场基础真实性;
- 对路径依赖型偏差的可解释机制:揭示 path-dependent 异象可以来源于少量 LLM-like 代理的 context-dependent 决策,而非全局参数调整。
维度1:实验设计分析
实验设计
本研究分为两个阶段:微观分析(Micro Analysis)检验LLM agent是否表现出context-dependent的行为偏差,宏观分析(Macro Analysis)检验将LLM agent纳入人工市场后能否复现真实市场异象。
基本设定:LLM-Agent的信息环境
每个LLM-Agent持有一种股票和现金,通过文本prompt接收以下信息后做出交易决策:
- 当前持仓(Current portfolio):现金持有量 c_t^j、股票持有量 w_t^j、未实现损益 \bar{g}_t^j(当前持仓市值与累计买入成本之差)
- 市场状况(Market condition):当前股价 p_t、历史最高价 p_{1:t}^h、历史最低价 p_{1:t}^l、剩余时间步 T_{sim} - t、总时间步 T_{sim}、order flow imbalance(OFI,即买卖订单数量之差除以总订单数,范围为-1到1)
- 交易历史(Trading history):所有过去时间步的交易时间、价格、成交量
LLM-Agent被要求输出:买或卖、订单量、限价、以及决策理由。研究主要使用GPT-4o、Qwen2.5 7B和Llama 3.1 8B三个模型。
Prompt的具体结构为:首先是前提设定("你是一个股票市场模拟的参与者,作为投资者行事"),然后是指令部分(解释portfolio格式、市场状况格式、交易历史格式、OFI的定义和含义),接着是具体的数值信息填入,最后是回答格式要求(JSON格式,包含order_price、is_buy、order_volume、reason字段)。当现金为负或持仓为负时,prompt中会加入警告提示,要求agent卖出股票或买入股票以纠正负值。
第一阶段:微观分析
实验1:Loss Aversion单轮模拟
目的:检验LLM是否在不同context下表现出不对称的损失规避行为——即倾向于实现收益、不愿实现亏损,且该倾向随参考点的变化而变化。
设计:每次模拟仅包含一个LLM-Agent(n_a = 1),在时间步 t = 50 时做出一次交易决策。模拟按Algorithm 1进行:
- 从区间 [r_{min}, r_{max}] 中均匀抽取收益率 r_t
- 计算当前股价 p_t = p_1 \exp(r_t)(初始价格 p_1 = 300.0)
- 设定当前持仓:现金 c_t^j = 30,000,股票 w_t^j = v_1^j = 10,未实现损益 \bar{g}_t^j = v_1^j(p_t - p_1)
- 设定市场状况:当前价格 p_t、历史最高/最低价、剩余时间 T_{sim} - t = 50、总时间 T_{sim} = 100
- 设定交易历史:仅包含初始购买记录 \{1, p_1, v_1\},后续时间步交易量均为0
- 观察LLM-Agent在给定portfolio、市场状况和交易历史条件下的投资决策
四种context情境(通过操纵 r_{min}、r_{max} 和历史最高/最低价来构造):
| 情境 | 含义 | 参数 | 历史最高价 |
|---|---|---|---|
| G+(Unrealized gain + updating ATH) | 持仓盈利,价格正在创新高 | r_{min}=0.0, r_{max}=0.5 | p_{1:t}^h = p_t(当前价即最高价) |
| G-(Unrealized gain + declining from ATH) | 持仓盈利,但已从历史最高价回落 | r_{min}=0.0, r_{max}=0.5 | p_{1:t}^h = p_1 \exp(2r_t)(远高于当前价) |
| L-(Unrealized loss + updating ATL) | 持仓亏损,价格正在创新低 | r_{min}=-0.5, r_{max}=0.0 | p_{1:t}^l = p_t(当前价即最低价) |
| L+(Unrealized loss + recovering from ATL) | 持仓亏损,但已从历史最低价反弹 | r_{min}=-0.5, r_{max}=0.0 | p_{1:t}^l = p_1 \exp(2r_t)(远低于当前价) |
关键对比逻辑:G+与G-中,agent均有未实现收益,但G-中存在额外参考点(历史最高价远高于当前价),检验agent是否将ATH也视为参考点并改变行为。L-与L+同理。
每种情境运行100次trial,每次使用不同的随机种子。
实验2:Herd Behavior多agent模拟
目的:检验LLM-Agent是否会受到其他agent行为信息的影响,偏离自身的私有信号进行羊群交易。
设计:n_a = 20个LLM-Agent参与多session交易模拟,T_{session} = 3个session,每session包含多个时间步(nT_{session}步)。模拟按Algorithm 2进行:
- 初始化每个agent的财富 x_1^j = c_1^j + w_1^j p_1 T_{sessions}
- 每个session开始前:
- 随机等概率选择红利价格 d_s \in \{d_{min}, d_{max}\}(d_{min} < d_{max})
- 为每个agent生成私有信号:若真实红利 d_s = d_{max},则以概率 p_{com} 获得overweight信号(正确信号),否则获得underweight信号(误导信号);若 d_s = d_{min}则反之。私有信号基于实际的earnings conference call内容,由LLM生成,分为overweight和underweight两类文本
- 每个时间步内,agent按以下顺序被选择交易:
- 前3位(j \leq 3):选择当前累计收益最高的agent(Leader机制)
- 其余agent:从尚未被选择的agent中随机抽取
- 被选中的agent收到当前portfolio、市场状况、交易历史和私有信号,做出交易决策
- 订单提交至double auction市场,通过买卖匹配确定成交价格 p_{t+1}
- session结束时按红利价格结算
参数设定:p_1 = 5.0,c_1^j = 100,w_1^j = 5,n_a = 20,T_{session} = 3。每种设定运行30次trial。
三种信息设定(逐步增加社会信息):
- Base设定:每个agent仅收到自身portfolio、市场状况、交易历史和私有信号
- OFI设定:在Base基础上,额外提供当前的order flow imbalance(反映市场多数参与者的行为方向)
- Leader-board设定:在Base基础上,额外提供财富排名前3的trader的当前财富和最近交易方向(模拟社交媒体上"明星投资者"的信息可见性)
羊群行为的定义:当agent的交易方向与其私有信号相矛盾、但与OFI方向或leader-board信息一致时,该订单被归类为herding order。
第二阶段:宏观分析——人工股票市场模拟
FCLAgent(Fundamental-Chartist-LLM Agent)的设计
FCLAgent是对传统FCNAgent(Fundamental-Chartist-Noise Agent)的扩展。FCNAgent由三个组件构成:
- Fundamental组件:根据当前价格偏离基本面价格的程度预测均值回归,权重 w^{j,f},时间窗口 \ au^f
- Chartist组件:根据近期价格趋势外推,权重 w^{j,c},时间窗口 \ au^j
- Noise组件:随机噪声 \epsilon_t,权重 w^{j,n}
FCNAgent基于CARA效用函数 \mathcal{U}^j = -\exp\{-\alpha^j(w_t^j p_t + c_t^j)\} 最优化来确定交易价格和数量。
FCLAgent的关键创新:将交易方向的决策从规则计算中分离出来,改由LLM决定。具体而言:
- 交易方向(买/卖):由LLM根据当前portfolio、市场状况(含ATH/ATL)和交易历史通过文本prompt生成,输出 v_t^j = \mathcal{F}(\iota_t^j) v^j,其中 \mathcal{F}: \mathcal{I} \mapsto \{-1, 1\}
- 订单价格:仍由传统规则决定——若买入则 p_t^j = \min(\hat{p}_{t+\ au^j}^j(1-m^j), p_t^{ask}),若卖出则 p_t^j = \max(\hat{p}_{t+\ au^j}^j(1+m^j), p_t^{bid}),其中 m^j 为固定订单边际
这种混合架构使得LLM的context-dependent行为偏差(如loss aversion导致的在ATH附近倾向卖出)能够影响交易方向,同时保留传统模型在数值计算上的可靠性。
市场模拟设定
- 市场结构:limit order book market,double auction规则,每个时间步随机选择一个agent下单
- 时间结构:T_{sim} = (100 + 750 + 10 + 750) \ imes 500 = 805,000步。每1,610步为一个交易日,共500个交易日。每天前100步和后10步(第850-860步)为集合竞价阶段(仅收集订单不撮合),其余时间连续撮合
- 市场参数:1个市场,tick size = 1.00 \ imes 10^{-2},初始价格 p_0 = 300.00,基本面价格 p_t^f 服从几何布朗运动(零漂移,波动率 1.00 \ imes 10^{-4})
- Agent参数:总agent数 n_a = 1,000。FCNAgent参数:\lambda^f = 10.00, \lambda^c = 1.50, \lambda^n = 1.00, \sigma^n = 1.00 \ imes 10^{-2}, c_{min} = 0.00, c_{max} = 3.00 \ imes 10^4, w_{min} = 0, w_{max} = 100, \alpha^{diff} = 20.00, \alpha = 0.10, \ au^{diff} = 30.00, \ au = 100.00, \ au^f = 200.00。FCLAgent参数:\forall j, v^j = 100(交易量放大以在少数agent下产生足够影响),c_{min} = 0.00, c_{max} = 1.00 \ imes 10^5, w_{min} = 0, w_{max} = 300, m_{min} = 0.00, m_{max} = 0.01
- 实验变量:逐步将 n_{FCL} \in \{0, 1, 2, 3, 4, 5\} 个FCNAgent替换为FCLAgent,保持总数1,000不变。每个 n_{FCL} 值运行5次trial,使用不同随机种子
- LLM选择:宏观模拟主要使用Llama 3.1 8B(开源模型),使用PAMS(Python-based limit order book market simulator)实现
评价指标
All-time-high异象:通过OLS回归 \frac{p_{t+T}}{p_t} = \ ext{const} + \beta^h \frac{p_t}{p_{1:t}^h} 估计 \beta^h。真实市场数据中 \beta^h < 0(价格越接近历史最高,未来收益越低),检验模拟数据是否复现这一负相关。使用10日、15日、30日三个return horizon。
OFI-future return异象:通过OLS回归 \frac{p_{t+T}}{p_t} = \ ext{const} + \beta^{OFI} OFI_t 估计 \beta^{OFI}。真实市场中 \beta^{OFI} > 0(OFI正向预测未来收益),检验模拟能否复现。使用1分钟interval。
Stylized facts:检验模拟数据是否满足真实市场的基本统计特征——收益率分布的excess kurtosis \kappa_r > 0、绝对收益率的自相关 \gamma(T) > 0(T = 1, 5, 10)、绝对收益率与成交量的正相关 \rho > 0。
真实数据对照:使用日本交易所FLEX-FULL历史tick数据(2015年1月5日至2021年8月20日),选取18只高流动性股票进行对比。
理论模型
理论基准
Loss aversion与prospect theory:基于Kahneman and Tversky (1979)的前景理论框架,投资者对损益的评估取决于参考点的选择。本文关注两类参考点:购买价格和历史极值价格(ATH/ATL)。disposition effect(Odean 1998)是loss aversion在金融市场中的典型表现——投资者倾向于过早卖出盈利持仓、过久持有亏损持仓。
Herd behavior:基于Asch (1956)的从众心理,在金融市场中表现为投资者追随他人行为而非依据自身信息交易。本文关注两种触发羊群行为的社会信息:OFI(反映市场整体买卖压力,参考Cipriani and Guarino 2005)和leader-board(反映成功投资者的行为,参考Chmura et al. 2022)。
核心建模假设
- Context-dependence假设:行为偏差不是固定参数,而是随市场context(如当前价格相对ATH/ATL的位置、OFI水平、他人行为可见性)而动态变化的。传统agent模型无法捕捉这种context-dependence。
- LLM作为行为偏差的载体:LLM在大量人类文本上训练,可能内化了人类的context-dependent行为偏差。通过prompt提供不同的市场context,LLM能自然地表现出与context一致的偏差行为,无需显式编程。
- 混合架构假设(FCLAgent):将LLM的行为偏差(交易方向)与传统模型的数值精度(价格计算)分离,既保留了context-dependent的行为特征,又避免了LLM在数值推理上的不可靠性。
可检验预测
- 若LLM确实表现出context-dependent的loss aversion,则在G-情境(价格从ATH回落但仍有unrealized gain)中,卖出订单应多于G+情境(价格正在创新高),因为ATH作为额外参考点使agent感知到"损失"
- 若LLM表现出herding behavior,则在OFI和leader-board信息可用时,与私有信号矛盾的订单比例应显著增加
- 若FCLAgent成功将这些偏差注入市场,则随 n_{FCL} 增加,\beta^h 应趋向真实数据的负值范围,\beta^{OFI} 应趋向真实数据的正值范围
核心发现
微观层面:LLM的行为偏差
Loss aversion结果(Table 1):
- G+与G-对比:GPT-4o在G+中net order flow为-94(3买97卖),G-中为-70(15买85卖)。G-中卖出减少、买入增加,表明ATH作为参考点使agent感知到"从峰值下跌的损失",反而减少了卖出——这与context-dependent loss aversion一致
- L-与L+对比:GPT-4o在L-中net order flow为+80(90买10卖),L+中为+74(87买13卖)。亏损情境下买入占主导,体现了不愿止损(disposition effect)。L+中ATL作为额外参考点略微增加了卖出
- 模型差异:Qwen2.5 7B在gain情境中行为模式不同——即使价格从ATH下跌,仍主要基于购买价格判断损益,未能有效整合ATH作为参考点
Herd behavior结果(Table 2):
- 信号一致性下降:所有三个LLM在OFI和Leader-board设定下,与私有信号一致的订单数量显著低于Base设定(Welch t-test, p < 0.05),表明社会信息改变了agent的交易方向
- Herding订单增加:GPT-4o在Base设定下平均每60步trial有23.31个herding orders,OFI设定下增至53.84,Leader-board设定下OFI维度的herding达46.78、Top-1/Top-2/Top-3 leader的herding分别为18.14/18.13/43.92
- 所有LLM模型均表现出OFI和leader-board可以触发herding behavior
宏观层面:市场异象的复现
All-time-high异象(Table 4):
- 纯FCNAgent(n_{FCL} = 0)时,\beta^h 接近0(10日:-0.01,15日:-0.02,30日:-0.03),无法复现异象
- 随着FCLAgent数量增加,\beta^h 逐渐趋向负值。n_{FCL} = 5 时,10日 \beta^h = -1.31、15日 -1.34、30日 -1.64,已落入真实数据范围(10日:-0.73 [-1.27, -0.20];15日:-1.05 [-1.78, -0.25];30日:-1.49 [-2.72, -0.25])
OFI-future return异象(Table 4):
- n_{FCL} = 0 时 \beta^{OFI} = 0.064,n_{FCL} = 5 时 \beta^{OFI} = 0.123,逐步趋向真实数据值0.114 [0.070, 0.158]
Stylized facts保持(Table 5):所有 n_{FCL} 设定下,kurtosis \kappa_r > 0、收益率自相关 \gamma(T) > 0、收益率-成交量正相关 \rho > 0 均满足,说明引入FCLAgent未破坏市场模拟的基本真实性
FCLAgent行为分析(Fig. 6-7):
- 资产配置比例的99%区间为[0.11, 0.48],说明FCLAgent维持了合理的portfolio平衡
- 当all-time-high nearness p_t/p_{1:t}^h 接近1.00时,卖出显著多于买入(KS检验 p = 4.74 \ imes 10^{-8},Mann-Whitney U检验 p = 1.94 \ imes 10^{-6}),证实了loss aversion机制
- 买入(卖出)倾向于在OFI高(低)时发生(KS检验 p = 1.40 \ imes 10^{-3},Mann-Whitney U检验 p = 7.15 \ imes 10^{-4}),证实了herding机制
稳健性检验(Appendix B):使用更保守的价格规则(Eq. 11替代Eq. 7)后,异象复现的方向一致,但 \beta^h 和 \beta^{OFI} 的绝对值略小,说明定价规则可以放大效应但主要驱动力仍来自LLM的行为偏差。
与其他文献的关系
与异质信念和市场动力学文献的关系:本文的FCLAgent模型可视为 Brock_Hommes_1998_HeterogeneousBeliefs_Chaos 中heterogeneous agent模型的LLM扩展版本。Brock and Hommes通过fundamental trader和chartist trader的交互生成复杂价格动态,而本文的FCNAgent正是基于这一fundamental-chartist框架,FCLAgent则在此基础上引入了LLM驱动的context-dependent交易方向决策。
与LLM行为偏差文献的关系:本文为 Bini_BehavioralEconomics_AI_LLMBiases 所讨论的LLM行为偏差提供了金融市场应用的实证证据。Bini等人系统梳理了LLM中存在的各类认知偏差,而Hashimoto等人则展示了这些偏差如何在模拟交易环境中具体表现为loss aversion和herd behavior,并进一步影响宏观市场价格。
与extrapolative beliefs文献的关系:FCLAgent中chartist组件的价格趋势外推与 Barberis_2015_XCAPM_Extrapolative 的extrapolative expectations框架相关。Barberis的X-CAPM模型中,投资者根据过去收益外推未来收益导致资产定价偏差;而本文的chartist组件 \frac{w^{j,c}}{\ au^j} \log \frac{p_t}{p_{t-\ au^j}} 正是这种外推行为的rule-based实现,与LLM的context-dependent方向决策形成互补。
与extrapolative beliefs的感知基础文献的关系:Frydman_Nave_2017_ExtrapolativeBeliefs_Perceptual_Economic 从感知心理学角度解释了投资者为何会extrapolate价格趋势。本文的LLM agent在prompt中接收到价格历史后自然表现出对趋势的反应,可以视为LLM在训练数据中"习得"了人类的感知偏差。
与学习模型文献的关系:Camerer_1999_EWA_Learning 提出的experience-weighted attraction学习模型用固定规则描述agent如何从历史经验中学习。本文的LLM agent方法代表了一种根本不同的建模范式——不需要显式指定学习规则,LLM基于prompt中的context信息"即时"展现出context-dependent的行为模式,实现了更灵活的行为异质性。
方法论贡献:本文的核心创新在于提出了LLM-augmented agent-based modeling方法,通过混合架构(LLM决定交易方向 + 传统规则决定价格和数量)解决了两个长期难题:(1) 如何在agent模型中引入context-dependent的行为偏差而不需要为每种context手动编程;(2) 如何在保留LLM行为特征的同时确保数值计算的可靠性。这为构建能复现path-dependent市场异象的人工市场提供了新范式。
维度2:理论模型
参见上文"理论模型"小节,要点回顾:
- Prospect Theory 框架:参考点选择影响损益评估,本文同时考虑购买价格与历史极值价格 (ATH/ATL) 作为参考点;
- Disposition Effect:投资者过早卖盈、过久持亏的不对称行为;
- Herd Behavior:信息瀑布与社会从众触发的偏离私有信号交易;
- FCNAgent 基线:基于 CARA 效用 U^j = -exp{-α^j(w_t^j p_t + c_t^j)} 优化,由 fundamental/chartist/noise 三组件加权决定;
- FCLAgent 创新:方向 v_t^j = F(ι_t^j) v^j 由 LLM 决定,价格按规则 p_t^j = min(p̂_{t+τ^j}^j(1-m^j), p_t^ask) 或 max(p̂_{t+τ^j}^j(1+m^j), p_t^bid)。
维度3:核心发现
参见上文"核心发现"小节,要点:
- 微观 Loss Aversion:GPT-4o 在 G- (从 ATH 回落) 中卖出减少 (15买/85卖 vs. G+ 的 3买/97卖),证实 ATH 作为参考点改变行为;L+ 中 ATL 略增卖出;
- 微观 Herd Behavior:OFI 设定下 herding orders 从 23.31 增至 53.84;Leader-board 设定下 Top-3 leader 触发的 herding 达 43.92;
- 宏观 ATH 异象:n_FCL=0 时 β^h ≈ 0;n_FCL=5 时 β^h_{10d}=-1.31, β^h_{15d}=-1.34, β^h_{30d}=-1.64,落入真实数据 95% CI;
- 宏观 OFI 异象:β^OFI 从 0.064 (n_FCL=0) 增至 0.123 (n_FCL=5),趋近真实数据 0.114 [0.070, 0.158];
- Stylized Facts 保持:kurtosis、绝对收益自相关、收益-成交量正相关均满足;
- FCLAgent 行为模式:ATH nearness 高时显著卖出 (KS 检验 p=4.74e-8);OFI 高时显著买入 (KS 检验 p=1.40e-3)。
维度4:变量概览
LLM Agent 输入 (prompt 内容):
- Portfolio:现金 c_t^j、股票 w_t^j、未实现损益 ḡ_t^j
- Market Condition:当前价 p_t、ATH p_{1:t}^h、ATL p_{1:t}^l、剩余时间 T_sim - t、OFI ∈ [-1, 1]
- Trading History:所有过去交易的时间/价格/成交量
- (多 agent 实验) 私有信号 (overweight/underweight 文本)、leader-board 排名
LLM Agent 输出:
- is_buy (买/卖二值)
- order_volume (订单数量)
- order_price (限价)
- reason (决策理由)
实验处理变量:
- 微观实验 1:context ∈ {G+, G-, L-, L+}
- 微观实验 2:信息设定 ∈ {Base, OFI, Leader-board}
- 宏观实验:n_FCL ∈ {0, 1, 2, 3, 4, 5}
- 模型选择:GPT-4o、Qwen2.5 7B、Llama 3.1 8B
评价指标:
- 微观:net order flow、信号一致订单比例、herding orders 数量
- 宏观:β^h (ATH 异象)、β^OFI (OFI 异象)、kurtosis κ_r、自相关 γ(T)、收益-成交量相关 ρ
- 真实数据对照:日本交易所 FLEX-FULL tick 数据 (2015.1.5–2021.8.20, 18 只股票)
关键参数:T_sim = 805,000 步 (500 交易日)、n_a = 1,000、tick size = 0.01、p_0 = 300、基本面价格几何布朗运动 (零漂移、波动率 1e-4)。
维度5:局限性
- LLM 选择有限:宏观主要使用 Llama 3.1 8B,未系统测试更大模型 (GPT-4 系列在 1000 agent × 805,000 步规模下成本过高);
- 替换比例小:n_FCL ≤ 5/1000,未检验高比例 LLM agent 是否会破坏 stylized facts 或导致市场崩溃;
- Prompt 工程依赖:决策行为对 prompt 措辞与变量呈现顺序敏感,未做全面 prompt 鲁棒性检验;
- LLM 训练数据偏差混淆:LLM 表现的"行为偏差"可能源于训练数据中的金融评论语言模式,而非真正的行为机制;
- 静态市场环境:基本面价格服从零漂移布朗运动,未检验在趋势/泡沫期市场中的表现;
- 缺乏外部冲击实验:未引入新闻冲击、流动性冲击等真实事件检验 FCLAgent 反应;
- 方向-价格分离的人为假设:将方向交给 LLM、价格交给规则的混合架构虽提高数值可靠性,但牺牲了 LLM 在价格设定上的潜在 context-dependence;
- 真实数据对照仅为日本市场 18 只股票,跨市场普适性需要进一步检验。
维度6:与其他文献的关系
- Heterogeneous Agent 模型基础:Brock_Hommes_1998_HeterogeneousBeliefs_Chaos 的 fundamental-chartist 框架是本文 FCNAgent 的直接前身;
- Extrapolative Beliefs:Barberis_2015_XCAPM_Extrapolative 的 X-CAPM 模型与本文 chartist 组件的趋势外推机制对应;Frydman_Nave_2017_ExtrapolativeBeliefs_Perceptual_Economic 提供了 extrapolative beliefs 的感知心理学基础;
- LLM 行为偏差综述:Bini_BehavioralEconomics_AI_LLMBiases 系统梳理 LLM 中的认知偏差,本文为其在金融市场情境下提供实证;
- 学习模型对比:Camerer_1999_EWA_Learning 的 EWA 模型用固定规则刻画学习,本文 LLM 方法实现 context-dependent "即时"行为;
- Disposition Effect 经典文献:Jiao_2013_Disposition_Effect_Closed_End 与 Jiao_2017_MeanReversion_DispositionEffect 在真实市场中验证 disposition effect,本文在 LLM agent 中复现该机制;Odean_Volume_Overconfidence 提供 disposition effect 的早期实证;
- Herding 文献:Hwang_2004_MarketStress_Herding 与 Zheng_Tang_2021_Gender_Herding 提供市场层面 herding 度量;本文从 agent 层面机制建模;
- Overconfidence 与个体投资者行为:Barber_Odean_1998_IndividualInvestors_Performance、Barber_Odean_BoysWillBeBoys_Gender_Overconfidence、Camerer_1999_Overconfidence_ExcessEntry 等可与本文 LLM agent 框架结合,未来可扩展至 overconfidence 异象。
维度7:可拓展的研究方向
- 更大模型与更高替换比例:用 GPT-4o/Claude 全规模模拟,检验 n_FCL 接近 100% 时的市场行为;
- Prompt 设计的因果实验:操纵 prompt 中变量的呈现顺序、措辞、量纲,量化 prompt 工程对市场异象的影响;
- 更丰富的市场异象:检验 momentum、value premium、PEAD 等异象能否通过引入特定 context 信息复现;
- 冲击-反应实验:引入新闻冲击、流动性枯竭、监管政策变化等外生冲击,比较 FCLAgent 与 FCNAgent 的反应;
- 跨模型行为比较:对比 Anthropic、OpenAI、Meta、阿里巴巴等不同模型在相同 prompt 下的偏差差异,建立 LLM 行为偏差谱系图;
- fine-tune LLM 注入特定行为:通过强化学习或监督微调修正/放大 LLM 中的偏差,研究单一偏差对市场的孤立影响;
- 真实交易者校准:将真实投资者数据与 LLM agent 行为对比,构建模型选择与参数校准框架;
- 多市场扩展:将 FCLAgent 嵌入多资产、跨市场环境,检验 contagion、spillover 等系统性效应;
- 可解释性分析:提取 LLM 输出的 reason 字段进行文本分析,揭示其决策的"心理过程"。
关键结论
- LLM 内化了人类行为偏差:LLM 在不同市场 context 下自然展现 loss aversion 与 herd behavior,无需显式编程;
- 少量 LLM agent 即可生成真实市场异象:仅 5/1000 的 FCLAgent 替换即复现 ATH 与 OFI 异象,提示真实市场异象可能源于少量"行为代理"对其余理性代理的影响;
- 混合架构是 agent-based modeling 的实用范式:LLM 决定方向 + 规则决定价格,兼顾 context-dependence 与数值可靠性;
- path-dependent 异象需要 path-dependent 行为机制:传统固定参数 agent 无法复现 ATH 异象,本文证明 context-dependent 决策是必要条件;
- 方法论意义:为金融模拟、政策评估与新型市场设计 (如算法交易监管) 提供可扩展的 in silico 实验平台。
🔗 链接到这篇笔记
- Bini_BehavioralEconomics_AI_LLMBiases
- Brown_2016_BankRun_Contagion
- Guler_Lugovskyy_2025_TradingInstitutions_ExperimentalAssetMarkets
- Haaland_Roth_2023_DesigningInformationExperiments
- Harrison_2017_ScoringRules_SubjectiveProbability
- Hartzmark_Hirshman_2021_Ownership_Learning_Beliefs
- Lu_Zhao_2024_MentalModelling_RL_LanguageModels
- Zheng_2025_Memory_GenerativeAI
- Zhu_Jiao_2024_Beliefs_EquityHomeBias
- Zhu_SelfImage_MotivatedReasoning