Hashimoto_Takayanagi_2026_LLMAgents_HumanBias_MarketDynamics

更新于 2026/7/5

一句话总结

通过设计 FCLAgent (Fundamental-Chartist-LLM Agent) 混合架构,证明 LLM 在 prompt context 下自然涌现 loss aversion 与 herd behavior 偏差,且将少量 FCLAgent 注入人工股票市场即可复现 all-time-high 与 OFI-future-return 等真实市场异象。

研究问题

  1. LLM agent 是否在不同市场 context (相对 ATH/ATL 位置、OFI 水平、他人行为可见性) 下表现出与人类一致的 context-dependent 行为偏差?
  2. 当将 LLM agent 嵌入 agent-based 人工股票市场时,能否复现 path-dependent 的真实市场异象,如 all-time-high 异象与 OFI 预测收益异象?
  3. 如何在保留 LLM 行为偏差特征的同时确保 agent 在数值计算上的可靠性?

核心贡献

  1. 方法论创新:提出 LLM-augmented agent-based modeling 范式,FCLAgent 将交易方向决策 (LLM, context-dependent) 与价格/数量计算 (传统规则) 分离的混合架构;
  2. 微观证据:在单 agent 模拟中通过四种 context 情境 (G+/G-/L-/L+) 系统验证 LLM 的 context-dependent loss aversion,并通过多 agent 模拟验证 OFI 与 leader-board 信息触发 herd behavior;
  3. 宏观证据:仅替换 5 个 FCNAgent 为 FCLAgent (千分之五的比例) 即可复现真实市场的 β^h < 0 与 β^OFI > 0 异象,定量结果落入真实数据 95% 置信区间;
  4. 稳健性:所有 stylized facts (kurtosis、绝对收益自相关、收益-成交量正相关) 在引入 FCLAgent 后保持,证明该方法不破坏市场基础真实性;
  5. 对路径依赖型偏差的可解释机制:揭示 path-dependent 异象可以来源于少量 LLM-like 代理的 context-dependent 决策,而非全局参数调整。

维度1:实验设计分析

实验设计

本研究分为两个阶段:微观分析(Micro Analysis)检验LLM agent是否表现出context-dependent的行为偏差,宏观分析(Macro Analysis)检验将LLM agent纳入人工市场后能否复现真实市场异象。

基本设定:LLM-Agent的信息环境

每个LLM-Agent持有一种股票和现金,通过文本prompt接收以下信息后做出交易决策:

  • 当前持仓(Current portfolio):现金持有量 c_t^j、股票持有量 w_t^j、未实现损益 \bar{g}_t^j(当前持仓市值与累计买入成本之差)
  • 市场状况(Market condition):当前股价 p_t、历史最高价 p_{1:t}^h、历史最低价 p_{1:t}^l、剩余时间步 T_{sim} - t、总时间步 T_{sim}、order flow imbalance(OFI,即买卖订单数量之差除以总订单数,范围为-1到1)
  • 交易历史(Trading history):所有过去时间步的交易时间、价格、成交量

LLM-Agent被要求输出:买或卖、订单量、限价、以及决策理由。研究主要使用GPT-4o、Qwen2.5 7B和Llama 3.1 8B三个模型。

Prompt的具体结构为:首先是前提设定("你是一个股票市场模拟的参与者,作为投资者行事"),然后是指令部分(解释portfolio格式、市场状况格式、交易历史格式、OFI的定义和含义),接着是具体的数值信息填入,最后是回答格式要求(JSON格式,包含order_price、is_buy、order_volume、reason字段)。当现金为负或持仓为负时,prompt中会加入警告提示,要求agent卖出股票或买入股票以纠正负值。


第一阶段:微观分析

实验1:Loss Aversion单轮模拟

目的:检验LLM是否在不同context下表现出不对称的损失规避行为——即倾向于实现收益、不愿实现亏损,且该倾向随参考点的变化而变化。

设计:每次模拟仅包含一个LLM-Agent(n_a = 1),在时间步 t = 50 时做出一次交易决策。模拟按Algorithm 1进行:

  1. 从区间 [r_{min}, r_{max}] 中均匀抽取收益率 r_t
  2. 计算当前股价 p_t = p_1 \exp(r_t)(初始价格 p_1 = 300.0
  3. 设定当前持仓:现金 c_t^j = 30,000,股票 w_t^j = v_1^j = 10,未实现损益 \bar{g}_t^j = v_1^j(p_t - p_1)
  4. 设定市场状况:当前价格 p_t、历史最高/最低价、剩余时间 T_{sim} - t = 50、总时间 T_{sim} = 100
  5. 设定交易历史:仅包含初始购买记录 \{1, p_1, v_1\},后续时间步交易量均为0
  6. 观察LLM-Agent在给定portfolio、市场状况和交易历史条件下的投资决策

四种context情境(通过操纵 r_{min}r_{max} 和历史最高/最低价来构造):

情境 含义 参数 历史最高价
G+(Unrealized gain + updating ATH) 持仓盈利,价格正在创新高 r_{min}=0.0, r_{max}=0.5 p_{1:t}^h = p_t(当前价即最高价)
G-(Unrealized gain + declining from ATH) 持仓盈利,但已从历史最高价回落 r_{min}=0.0, r_{max}=0.5 p_{1:t}^h = p_1 \exp(2r_t)(远高于当前价)
L-(Unrealized loss + updating ATL) 持仓亏损,价格正在创新低 r_{min}=-0.5, r_{max}=0.0 p_{1:t}^l = p_t(当前价即最低价)
L+(Unrealized loss + recovering from ATL) 持仓亏损,但已从历史最低价反弹 r_{min}=-0.5, r_{max}=0.0 p_{1:t}^l = p_1 \exp(2r_t)(远低于当前价)

关键对比逻辑:G+与G-中,agent均有未实现收益,但G-中存在额外参考点(历史最高价远高于当前价),检验agent是否将ATH也视为参考点并改变行为。L-与L+同理。

每种情境运行100次trial,每次使用不同的随机种子。

实验2:Herd Behavior多agent模拟

目的:检验LLM-Agent是否会受到其他agent行为信息的影响,偏离自身的私有信号进行羊群交易。

设计n_a = 20个LLM-Agent参与多session交易模拟,T_{session} = 3个session,每session包含多个时间步(nT_{session}步)。模拟按Algorithm 2进行:

  1. 初始化每个agent的财富 x_1^j = c_1^j + w_1^j p_1 T_{sessions}
  2. 每个session开始前:
    • 随机等概率选择红利价格 d_s \in \{d_{min}, d_{max}\}d_{min} < d_{max}
    • 为每个agent生成私有信号:若真实红利 d_s = d_{max},则以概率 p_{com} 获得overweight信号(正确信号),否则获得underweight信号(误导信号);若 d_s = d_{min}则反之。私有信号基于实际的earnings conference call内容,由LLM生成,分为overweight和underweight两类文本
  3. 每个时间步内,agent按以下顺序被选择交易:
    • 前3位(j \leq 3):选择当前累计收益最高的agent(Leader机制)
    • 其余agent:从尚未被选择的agent中随机抽取
  4. 被选中的agent收到当前portfolio、市场状况、交易历史和私有信号,做出交易决策
  5. 订单提交至double auction市场,通过买卖匹配确定成交价格 p_{t+1}
  6. session结束时按红利价格结算

参数设定p_1 = 5.0c_1^j = 100w_1^j = 5n_a = 20T_{session} = 3。每种设定运行30次trial。

三种信息设定(逐步增加社会信息):

  • Base设定:每个agent仅收到自身portfolio、市场状况、交易历史和私有信号
  • OFI设定:在Base基础上,额外提供当前的order flow imbalance(反映市场多数参与者的行为方向)
  • Leader-board设定:在Base基础上,额外提供财富排名前3的trader的当前财富和最近交易方向(模拟社交媒体上"明星投资者"的信息可见性)

羊群行为的定义:当agent的交易方向与其私有信号相矛盾、但与OFI方向或leader-board信息一致时,该订单被归类为herding order。


第二阶段:宏观分析——人工股票市场模拟

FCLAgent(Fundamental-Chartist-LLM Agent)的设计

FCLAgent是对传统FCNAgent(Fundamental-Chartist-Noise Agent)的扩展。FCNAgent由三个组件构成:

  • Fundamental组件:根据当前价格偏离基本面价格的程度预测均值回归,权重 w^{j,f},时间窗口 \ au^f
  • Chartist组件:根据近期价格趋势外推,权重 w^{j,c},时间窗口 \ au^j
  • Noise组件:随机噪声 \epsilon_t,权重 w^{j,n}

FCNAgent基于CARA效用函数 \mathcal{U}^j = -\exp\{-\alpha^j(w_t^j p_t + c_t^j)\} 最优化来确定交易价格和数量。

FCLAgent的关键创新:将交易方向的决策从规则计算中分离出来,改由LLM决定。具体而言:

  • 交易方向(买/卖):由LLM根据当前portfolio、市场状况(含ATH/ATL)和交易历史通过文本prompt生成,输出 v_t^j = \mathcal{F}(\iota_t^j) v^j,其中 \mathcal{F}: \mathcal{I} \mapsto \{-1, 1\}
  • 订单价格:仍由传统规则决定——若买入则 p_t^j = \min(\hat{p}_{t+\ au^j}^j(1-m^j), p_t^{ask}),若卖出则 p_t^j = \max(\hat{p}_{t+\ au^j}^j(1+m^j), p_t^{bid}),其中 m^j 为固定订单边际

这种混合架构使得LLM的context-dependent行为偏差(如loss aversion导致的在ATH附近倾向卖出)能够影响交易方向,同时保留传统模型在数值计算上的可靠性。

市场模拟设定

  • 市场结构:limit order book market,double auction规则,每个时间步随机选择一个agent下单
  • 时间结构T_{sim} = (100 + 750 + 10 + 750) \ imes 500 = 805,000步。每1,610步为一个交易日,共500个交易日。每天前100步和后10步(第850-860步)为集合竞价阶段(仅收集订单不撮合),其余时间连续撮合
  • 市场参数:1个市场,tick size = 1.00 \ imes 10^{-2},初始价格 p_0 = 300.00,基本面价格 p_t^f 服从几何布朗运动(零漂移,波动率 1.00 \ imes 10^{-4}
  • Agent参数:总agent数 n_a = 1,000。FCNAgent参数:\lambda^f = 10.00, \lambda^c = 1.50, \lambda^n = 1.00, \sigma^n = 1.00 \ imes 10^{-2}, c_{min} = 0.00, c_{max} = 3.00 \ imes 10^4, w_{min} = 0, w_{max} = 100, \alpha^{diff} = 20.00, \alpha = 0.10, \ au^{diff} = 30.00, \ au = 100.00, \ au^f = 200.00。FCLAgent参数:\forall j, v^j = 100(交易量放大以在少数agent下产生足够影响),c_{min} = 0.00, c_{max} = 1.00 \ imes 10^5, w_{min} = 0, w_{max} = 300, m_{min} = 0.00, m_{max} = 0.01
  • 实验变量:逐步将 n_{FCL} \in \{0, 1, 2, 3, 4, 5\} 个FCNAgent替换为FCLAgent,保持总数1,000不变。每个 n_{FCL} 值运行5次trial,使用不同随机种子
  • LLM选择:宏观模拟主要使用Llama 3.1 8B(开源模型),使用PAMS(Python-based limit order book market simulator)实现

评价指标

All-time-high异象:通过OLS回归 \frac{p_{t+T}}{p_t} = \ ext{const} + \beta^h \frac{p_t}{p_{1:t}^h} 估计 \beta^h。真实市场数据中 \beta^h < 0(价格越接近历史最高,未来收益越低),检验模拟数据是否复现这一负相关。使用10日、15日、30日三个return horizon。

OFI-future return异象:通过OLS回归 \frac{p_{t+T}}{p_t} = \ ext{const} + \beta^{OFI} OFI_t 估计 \beta^{OFI}。真实市场中 \beta^{OFI} > 0(OFI正向预测未来收益),检验模拟能否复现。使用1分钟interval。

Stylized facts:检验模拟数据是否满足真实市场的基本统计特征——收益率分布的excess kurtosis \kappa_r > 0、绝对收益率的自相关 \gamma(T) > 0T = 1, 5, 10)、绝对收益率与成交量的正相关 \rho > 0

真实数据对照:使用日本交易所FLEX-FULL历史tick数据(2015年1月5日至2021年8月20日),选取18只高流动性股票进行对比。

理论模型

理论基准

Loss aversion与prospect theory:基于Kahneman and Tversky (1979)的前景理论框架,投资者对损益的评估取决于参考点的选择。本文关注两类参考点:购买价格和历史极值价格(ATH/ATL)。disposition effect(Odean 1998)是loss aversion在金融市场中的典型表现——投资者倾向于过早卖出盈利持仓、过久持有亏损持仓。

Herd behavior:基于Asch (1956)的从众心理,在金融市场中表现为投资者追随他人行为而非依据自身信息交易。本文关注两种触发羊群行为的社会信息:OFI(反映市场整体买卖压力,参考Cipriani and Guarino 2005)和leader-board(反映成功投资者的行为,参考Chmura et al. 2022)。

核心建模假设

  1. Context-dependence假设:行为偏差不是固定参数,而是随市场context(如当前价格相对ATH/ATL的位置、OFI水平、他人行为可见性)而动态变化的。传统agent模型无法捕捉这种context-dependence。
  2. LLM作为行为偏差的载体:LLM在大量人类文本上训练,可能内化了人类的context-dependent行为偏差。通过prompt提供不同的市场context,LLM能自然地表现出与context一致的偏差行为,无需显式编程。
  3. 混合架构假设(FCLAgent):将LLM的行为偏差(交易方向)与传统模型的数值精度(价格计算)分离,既保留了context-dependent的行为特征,又避免了LLM在数值推理上的不可靠性。

可检验预测

  • 若LLM确实表现出context-dependent的loss aversion,则在G-情境(价格从ATH回落但仍有unrealized gain)中,卖出订单应多于G+情境(价格正在创新高),因为ATH作为额外参考点使agent感知到"损失"
  • 若LLM表现出herding behavior,则在OFI和leader-board信息可用时,与私有信号矛盾的订单比例应显著增加
  • 若FCLAgent成功将这些偏差注入市场,则随 n_{FCL} 增加,\beta^h 应趋向真实数据的负值范围,\beta^{OFI} 应趋向真实数据的正值范围

核心发现

微观层面:LLM的行为偏差

Loss aversion结果(Table 1):

  • G+与G-对比:GPT-4o在G+中net order flow为-94(3买97卖),G-中为-70(15买85卖)。G-中卖出减少、买入增加,表明ATH作为参考点使agent感知到"从峰值下跌的损失",反而减少了卖出——这与context-dependent loss aversion一致
  • L-与L+对比:GPT-4o在L-中net order flow为+80(90买10卖),L+中为+74(87买13卖)。亏损情境下买入占主导,体现了不愿止损(disposition effect)。L+中ATL作为额外参考点略微增加了卖出
  • 模型差异:Qwen2.5 7B在gain情境中行为模式不同——即使价格从ATH下跌,仍主要基于购买价格判断损益,未能有效整合ATH作为参考点

Herd behavior结果(Table 2):

  • 信号一致性下降:所有三个LLM在OFI和Leader-board设定下,与私有信号一致的订单数量显著低于Base设定(Welch t-test, p < 0.05),表明社会信息改变了agent的交易方向
  • Herding订单增加:GPT-4o在Base设定下平均每60步trial有23.31个herding orders,OFI设定下增至53.84,Leader-board设定下OFI维度的herding达46.78、Top-1/Top-2/Top-3 leader的herding分别为18.14/18.13/43.92
  • 所有LLM模型均表现出OFI和leader-board可以触发herding behavior

宏观层面:市场异象的复现

All-time-high异象(Table 4):

  • 纯FCNAgent(n_{FCL} = 0)时,\beta^h 接近0(10日:-0.01,15日:-0.02,30日:-0.03),无法复现异象
  • 随着FCLAgent数量增加,\beta^h 逐渐趋向负值。n_{FCL} = 5 时,10日 \beta^h = -1.31、15日 -1.34、30日 -1.64,已落入真实数据范围(10日:-0.73 [-1.27, -0.20];15日:-1.05 [-1.78, -0.25];30日:-1.49 [-2.72, -0.25])

OFI-future return异象(Table 4):

  • n_{FCL} = 0\beta^{OFI} = 0.064n_{FCL} = 5\beta^{OFI} = 0.123,逐步趋向真实数据值0.114 [0.070, 0.158]

Stylized facts保持(Table 5):所有 n_{FCL} 设定下,kurtosis \kappa_r > 0、收益率自相关 \gamma(T) > 0、收益率-成交量正相关 \rho > 0 均满足,说明引入FCLAgent未破坏市场模拟的基本真实性

FCLAgent行为分析(Fig. 6-7):

  • 资产配置比例的99%区间为[0.11, 0.48],说明FCLAgent维持了合理的portfolio平衡
  • 当all-time-high nearness p_t/p_{1:t}^h 接近1.00时,卖出显著多于买入(KS检验 p = 4.74 \ imes 10^{-8},Mann-Whitney U检验 p = 1.94 \ imes 10^{-6}),证实了loss aversion机制
  • 买入(卖出)倾向于在OFI高(低)时发生(KS检验 p = 1.40 \ imes 10^{-3},Mann-Whitney U检验 p = 7.15 \ imes 10^{-4}),证实了herding机制

稳健性检验(Appendix B):使用更保守的价格规则(Eq. 11替代Eq. 7)后,异象复现的方向一致,但 \beta^h\beta^{OFI} 的绝对值略小,说明定价规则可以放大效应但主要驱动力仍来自LLM的行为偏差。

与其他文献的关系

与异质信念和市场动力学文献的关系:本文的FCLAgent模型可视为 Brock_Hommes_1998_HeterogeneousBeliefs_Chaos 中heterogeneous agent模型的LLM扩展版本。Brock and Hommes通过fundamental trader和chartist trader的交互生成复杂价格动态,而本文的FCNAgent正是基于这一fundamental-chartist框架,FCLAgent则在此基础上引入了LLM驱动的context-dependent交易方向决策。

与LLM行为偏差文献的关系:本文为 Bini_BehavioralEconomics_AI_LLMBiases 所讨论的LLM行为偏差提供了金融市场应用的实证证据。Bini等人系统梳理了LLM中存在的各类认知偏差,而Hashimoto等人则展示了这些偏差如何在模拟交易环境中具体表现为loss aversion和herd behavior,并进一步影响宏观市场价格。

与extrapolative beliefs文献的关系:FCLAgent中chartist组件的价格趋势外推与 Barberis_2015_XCAPM_Extrapolative 的extrapolative expectations框架相关。Barberis的X-CAPM模型中,投资者根据过去收益外推未来收益导致资产定价偏差;而本文的chartist组件 \frac{w^{j,c}}{\ au^j} \log \frac{p_t}{p_{t-\ au^j}} 正是这种外推行为的rule-based实现,与LLM的context-dependent方向决策形成互补。

与extrapolative beliefs的感知基础文献的关系Frydman_Nave_2017_ExtrapolativeBeliefs_Perceptual_Economic 从感知心理学角度解释了投资者为何会extrapolate价格趋势。本文的LLM agent在prompt中接收到价格历史后自然表现出对趋势的反应,可以视为LLM在训练数据中"习得"了人类的感知偏差。

与学习模型文献的关系Camerer_1999_EWA_Learning 提出的experience-weighted attraction学习模型用固定规则描述agent如何从历史经验中学习。本文的LLM agent方法代表了一种根本不同的建模范式——不需要显式指定学习规则,LLM基于prompt中的context信息"即时"展现出context-dependent的行为模式,实现了更灵活的行为异质性。

方法论贡献:本文的核心创新在于提出了LLM-augmented agent-based modeling方法,通过混合架构(LLM决定交易方向 + 传统规则决定价格和数量)解决了两个长期难题:(1) 如何在agent模型中引入context-dependent的行为偏差而不需要为每种context手动编程;(2) 如何在保留LLM行为特征的同时确保数值计算的可靠性。这为构建能复现path-dependent市场异象的人工市场提供了新范式。

维度2:理论模型

参见上文"理论模型"小节,要点回顾:

  • Prospect Theory 框架:参考点选择影响损益评估,本文同时考虑购买价格与历史极值价格 (ATH/ATL) 作为参考点;
  • Disposition Effect:投资者过早卖盈、过久持亏的不对称行为;
  • Herd Behavior:信息瀑布与社会从众触发的偏离私有信号交易;
  • FCNAgent 基线:基于 CARA 效用 U^j = -exp{-α^j(w_t^j p_t + c_t^j)} 优化,由 fundamental/chartist/noise 三组件加权决定;
  • FCLAgent 创新:方向 v_t^j = F(ι_t^j) v^j 由 LLM 决定,价格按规则 p_t^j = min(p̂_{t+τ^j}^j(1-m^j), p_t^ask) 或 max(p̂_{t+τ^j}^j(1+m^j), p_t^bid)。

维度3:核心发现

参见上文"核心发现"小节,要点:

  1. 微观 Loss Aversion:GPT-4o 在 G- (从 ATH 回落) 中卖出减少 (15买/85卖 vs. G+ 的 3买/97卖),证实 ATH 作为参考点改变行为;L+ 中 ATL 略增卖出;
  2. 微观 Herd Behavior:OFI 设定下 herding orders 从 23.31 增至 53.84;Leader-board 设定下 Top-3 leader 触发的 herding 达 43.92;
  3. 宏观 ATH 异象:n_FCL=0 时 β^h ≈ 0;n_FCL=5 时 β^h_{10d}=-1.31, β^h_{15d}=-1.34, β^h_{30d}=-1.64,落入真实数据 95% CI;
  4. 宏观 OFI 异象:β^OFI 从 0.064 (n_FCL=0) 增至 0.123 (n_FCL=5),趋近真实数据 0.114 [0.070, 0.158];
  5. Stylized Facts 保持:kurtosis、绝对收益自相关、收益-成交量正相关均满足;
  6. FCLAgent 行为模式:ATH nearness 高时显著卖出 (KS 检验 p=4.74e-8);OFI 高时显著买入 (KS 检验 p=1.40e-3)。

维度4:变量概览

LLM Agent 输入 (prompt 内容)

  • Portfolio:现金 c_t^j、股票 w_t^j、未实现损益 ḡ_t^j
  • Market Condition:当前价 p_t、ATH p_{1:t}^h、ATL p_{1:t}^l、剩余时间 T_sim - t、OFI ∈ [-1, 1]
  • Trading History:所有过去交易的时间/价格/成交量
  • (多 agent 实验) 私有信号 (overweight/underweight 文本)、leader-board 排名

LLM Agent 输出

  • is_buy (买/卖二值)
  • order_volume (订单数量)
  • order_price (限价)
  • reason (决策理由)

实验处理变量

  • 微观实验 1:context ∈ {G+, G-, L-, L+}
  • 微观实验 2:信息设定 ∈ {Base, OFI, Leader-board}
  • 宏观实验:n_FCL ∈ {0, 1, 2, 3, 4, 5}
  • 模型选择:GPT-4o、Qwen2.5 7B、Llama 3.1 8B

评价指标

  • 微观:net order flow、信号一致订单比例、herding orders 数量
  • 宏观:β^h (ATH 异象)、β^OFI (OFI 异象)、kurtosis κ_r、自相关 γ(T)、收益-成交量相关 ρ
  • 真实数据对照:日本交易所 FLEX-FULL tick 数据 (2015.1.5–2021.8.20, 18 只股票)

关键参数:T_sim = 805,000 步 (500 交易日)、n_a = 1,000、tick size = 0.01、p_0 = 300、基本面价格几何布朗运动 (零漂移、波动率 1e-4)。

维度5:局限性

  1. LLM 选择有限:宏观主要使用 Llama 3.1 8B,未系统测试更大模型 (GPT-4 系列在 1000 agent × 805,000 步规模下成本过高);
  2. 替换比例小:n_FCL ≤ 5/1000,未检验高比例 LLM agent 是否会破坏 stylized facts 或导致市场崩溃;
  3. Prompt 工程依赖:决策行为对 prompt 措辞与变量呈现顺序敏感,未做全面 prompt 鲁棒性检验;
  4. LLM 训练数据偏差混淆:LLM 表现的"行为偏差"可能源于训练数据中的金融评论语言模式,而非真正的行为机制;
  5. 静态市场环境:基本面价格服从零漂移布朗运动,未检验在趋势/泡沫期市场中的表现;
  6. 缺乏外部冲击实验:未引入新闻冲击、流动性冲击等真实事件检验 FCLAgent 反应;
  7. 方向-价格分离的人为假设:将方向交给 LLM、价格交给规则的混合架构虽提高数值可靠性,但牺牲了 LLM 在价格设定上的潜在 context-dependence;
  8. 真实数据对照仅为日本市场 18 只股票,跨市场普适性需要进一步检验。

维度6:与其他文献的关系

维度7:可拓展的研究方向

  1. 更大模型与更高替换比例:用 GPT-4o/Claude 全规模模拟,检验 n_FCL 接近 100% 时的市场行为;
  2. Prompt 设计的因果实验:操纵 prompt 中变量的呈现顺序、措辞、量纲,量化 prompt 工程对市场异象的影响;
  3. 更丰富的市场异象:检验 momentum、value premium、PEAD 等异象能否通过引入特定 context 信息复现;
  4. 冲击-反应实验:引入新闻冲击、流动性枯竭、监管政策变化等外生冲击,比较 FCLAgent 与 FCNAgent 的反应;
  5. 跨模型行为比较:对比 Anthropic、OpenAI、Meta、阿里巴巴等不同模型在相同 prompt 下的偏差差异,建立 LLM 行为偏差谱系图;
  6. fine-tune LLM 注入特定行为:通过强化学习或监督微调修正/放大 LLM 中的偏差,研究单一偏差对市场的孤立影响;
  7. 真实交易者校准:将真实投资者数据与 LLM agent 行为对比,构建模型选择与参数校准框架;
  8. 多市场扩展:将 FCLAgent 嵌入多资产、跨市场环境,检验 contagion、spillover 等系统性效应;
  9. 可解释性分析:提取 LLM 输出的 reason 字段进行文本分析,揭示其决策的"心理过程"。

关键结论

  1. LLM 内化了人类行为偏差:LLM 在不同市场 context 下自然展现 loss aversion 与 herd behavior,无需显式编程;
  2. 少量 LLM agent 即可生成真实市场异象:仅 5/1000 的 FCLAgent 替换即复现 ATH 与 OFI 异象,提示真实市场异象可能源于少量"行为代理"对其余理性代理的影响;
  3. 混合架构是 agent-based modeling 的实用范式:LLM 决定方向 + 规则决定价格,兼顾 context-dependence 与数值可靠性;
  4. path-dependent 异象需要 path-dependent 行为机制:传统固定参数 agent 无法复现 ATH 异象,本文证明 context-dependent 决策是必要条件;
  5. 方法论意义:为金融模拟、政策评估与新型市场设计 (如算法交易监管) 提供可扩展的 in silico 实验平台。