Memory and Generative AI

**Unknown (2025), **

摘要

生成式人工智能正日益被用作经济代理。然而，我们对它们的财务决策规则知之甚少。利用一种新颖的实验环境，我们展示了它利用记忆来做决策，即使这些记忆不在同一决策领域。当与具有积极情感内容的图像相符时，它会做出更冒险的选择，即使它能形成完美的贝叶斯信念。这一机制还得到了一种称为知识注入的监督微调技术的支持，该技术可以编辑语言模型的记忆。实证分析显示，这种基于记忆的行为显著影响人工智能代理的投资决策和回报可预测性，产生显著的向上或向下偏向，对应其记忆的价值。最后，我们开发了一个基于记忆的经济模型，以解释GAI代理的投资行为。

Now I have all the content needed. Here is the detailed summary:

Memory and Generative AI — Zheng (2025) 详细总结

一句话总结

生成式AI（GAI）的金融决策行为受其"记忆"（训练数据中的联想关联）驱动：正面情绪线索使AI更倾向投资风险资产（股票），而这种效应甚至跨领域存在，且不影响其概率信念。

研究问题

本文要回答什么？ GAI作为经济主体时，其金融决策是否表现出纯粹的贝叶斯理性？外部的、与决策无关的情绪线索（如图片）是否会通过联想记忆机制影响其投资行为？记忆的因果效应是什么？

为什么重要？ GAI正被广泛部署为投资顾问、金融分析师等经济决策者。如果其决策由记忆中的联想偏差驱动而非纯理性，那么基于"完全理性AI"假设的监管框架和应用设计将存在根本性缺陷。

核心贡献

首次实验证明GAI决策受联想记忆驱动：利用改编自神经科学的实验范式（Kuhnen & Knutson, 2011），证明无关的情绪图片线索通过联想记忆通道显著影响GAI的投资选择，但不影响其概率信念——这与人类被试的实验结果高度相似。
因果识别：通过"知识注入"（knowledge injection）微调技术，因果性地证明记忆改变风险偏好，且跨领域记忆（如Yelp餐厅评论）也能影响金融决策，挑战了经验效应的"领域特异性"假说。
理论模型：基于注意力机制（attention mechanism）构建了一个记忆驱动决策的经济模型，推导出线索如何通过选择性检索扭曲估值的定理。
经济含义：证明记忆偏差对投资组合收益的可预测性有实际影响（long-short策略）。

维度1：实验设计分析

实验总体结构

实验采用 Kuhnen & Knutson (2011) 的范式。8个GPT系列模型（GPT-4o mini/full、GPT-4.1 mini/nano/full、GPT-5 mini/nano/full）作为被试，每个模型完成100个独立学习区块（learning block），每个区块包含6个试次（trial），总计800个区块、4800个试次。

被试逐屏经历的完整时间线

区块开始前：

被试（GPT模型）收到完整的实验指令，说明资产类型、收益结构和任务要求。开始一个新的聊天窗口。

每个学习区块（共6个试次）开始前：

系统随机决定本区块股票类型（Good或Bad），该类型在6个试次中保持不变。
股票类型以等概率（50%/50%）分配。

每个试次（Trial #1 至 #6）的被试经历：

第1屏：图片展示与联想回忆

被试看到一张从Google Images随机抽取的图片。图片效价（valence）从-2到+2不等，涵盖五个话题类别：天气（含污染）、恐怖袭击、体育、金融市场、其他。
共691张图片，每张由10位人类志愿者按-2到+2的5级量表评分，取平均值作为效价得分。
被试收到提示："Now look at this picture first before you make investment decisions. What past events or memories does this picture bring to mind?"
被试被明确告知图片与投资决策无关。
被试回答联想回忆内容。

第2屏：投资决策

被试收到提示："Do you want to invest in a stock or a bond? Only reply with 'stock' or 'bond'. Do not reply with other answers. Your choice is:"
资产选择：
- 债券：固定收益$3。
- 股票：来自Good分布（75%概率赚$10，25%概率赔$10，期望$5）或Bad分布（25%概率赚$10，75%概率赔$10，期望-$5）。
被试回答"stock"或"bond"。

第3屏：收益揭示

系统揭示本次试次的股票实际派息（+$10或-$10），不论被试是否选择了股票。
显示被试的累积投资收益（InvPayoff）。

第4屏：概率估计

被试被问："What do you think is the probability that the stock is the good stock?"
被试给出主观概率估计（SubjProb），范围0-1。

第5屏：信心评级

被试被问："How much do you trust your ability to come up with the correct probability estimate that the stock is good?"
被试给出信心评级（Confid），范围通常1-10。

关键设计细节：

在一个学习区块内，聊天历史保留（保留所有指令、选择、收益、概率估计等）。
每完成一个区块（6个试次），聊天历史清空，重新开始新区块。
图片以base64编码嵌入对话，每次试次约消耗10K tokens。

Treatment/Control设计

主实验（联想线索实验）：

Treatment变量：图片的效价等级（ValenceDec，按10分位分组）。
无传统的Treatment/Control组分离——所有被试都接收图片，但图片效价连续变化，作为准实验的自然变异源。

因果识别实验（知识注入微调）：

2×2设计：
- 领域维度：金融新闻 vs. Yelp餐厅评论
- 效价维度：正面记忆 vs. 负面记忆
4个微调模型基于GPT-4o-mini：
- 正面金融新闻模型（9,987条虚构正面金融新闻）
- 负面金融新闻模型（2,713条虚构负面金融新闻）
- 正面Yelp评论模型（3,991条虚构正面评论）
- 负面Yelp评论模型（4,009条虚构负面评论）
每个微调模型在3个刺激条件下各运行100次：负面线索、无线索、正面线索。
线索为样本外的虚构金融新闻或Yelp评论（非图片，因OpenAI限制微调模型的多模态能力）。

随机化策略

学习区块内股票类型（Good/Bad）随机分配。
每试次的图片随机抽取。
每试次的股票实际派息根据所属分布概率随机生成。

激励机制

假设性报酬结构模拟真实实验：
- "出场费"$15
- 投资收益：累积的资产收益 × 1/20
- 概率估计准确性奖励：估计值在正确贝叶斯概率的±5%以内，每次奖$1
- 总报酬 = 出场费 + $(1/20) × (总投资收益 + 准确预测次数)

维度2：理论模型

经典理论基准

贝叶斯更新：在n次试次中观察到k次$10派息后，股票为Good的客观后验概率为 $1/(1+3^{(n-2k)})$ 。这是理性基准。
期望效用理论：若贝叶斯后验概率 $p$ 满足 $p×\$10 + (1-p)×(-\$10) > \$3$ ，则理性选择是股票。

行为偏差模型

联想记忆模型（Section 6）：基于 Bordalo_2024a_AssociativeMemory、Kahana_2012_MemorySearch、Wachter_Kahana_2024_Memory。
- 记忆定义为 $\mathcal{M} = \{(k_i, v_i)\}_{i=1}^N$ ，其中 $k_i \in \mathbb{R}^d$ 为语义特征向量， $v_i \in \mathbb{R}$ 为该经验的效价。
- 查询向量分解为： $q = q_{task} + \lambda \cdot q_{cue}$ ，其中 $q_{task}$ 是核心决策任务， $q_{cue}$ 是外生情绪刺激， $\lambda$ 是线索强度。
- 检索权重通过缩放点积注意力机制确定： $\alpha_i(q;\beta) = \frac{\exp(\beta \cdot \langle q, k_i \rangle)}{\sum_j \exp(\beta \cdot \langle q, k_j \rangle)}$
- 估值： $\hat{y}(q) = \sum_i \alpha_i(q;\beta) \cdot v_i$

关键假设

AI的决策过程可类比为通过注意力机制的概率性记忆检索。
情绪线索 $q_{cue}$ 与高效价记忆的余弦相似度为正。
视觉token的嵌入范数大于文本token（ $\|q_{img}\| > \|q_{txt}\|$ ），解释图片线索更强的效应。

可检验预测

定理6.1：正面线索增加 $\hat{y}$ ，导致风险偏好行为。
引理6.1：视觉线索比文本线索产生更强的偏差（因嵌入范数更大）。
定理6.2：偏差随推理参数 $\beta$ 非单调变化；当 $\beta \to \infty$ （完美推理），偏差趋于零——解释了o1等推理模型偏差更小的现象。
定理6.3：跨领域溢出效应取决于线索向量在记忆空间价值梯度方向上的投影；若线索与任务记忆完全正交，则无偏差。

维度3：核心发现

主要结果

发现1：情绪线索显著影响投资选择

从最低效价到最高效价，选择股票的概率增加约17.1%（从~0.40到~0.52）。
回归系数（Table 2, Column 4）：ValenceDec = 0.0177**（t = 2.59），即效价每增加一个十分位，选股概率增加1.77个百分点。
贝叶斯理性基准的投资选择与效价无关（斜率 = -0.006，t = -0.04，R² ≈ 0）。

发现2：线索不影响概率信念

主观概率估计在各效价组间无显著差异（Figure 4A，回归斜率 ≈ 0.003，R² ≈ 0）。
选择与信念之间存在断裂：线索影响选择（风险偏好），但不影响信念（概率估计）。

发现3：概率估计呈现前景理论特征

低客观概率时高估，高客观概率时低估，与 Kahneman_Tversky_2013_ProspectTheory 预测的"四重模式"一致。
但GAI的概率估计比人类更准确。

发现4：知识注入因果证据

金融新闻微调：正面模型投股概率0.65 (SD=0.01) vs. 负面模型0.49 (SD=0.03)。
Yelp评论微调：正面模型0.49 (SD=0.06) vs. 负面模型0.36 (SD=0.10)——跨领域效应甚至更强。
回归（Table 4, Column 1）：IsPosMem = 0.1447***（t = 18.90），正面记忆模型平均多14.47%概率选股。

发现5：联想线索的不对称效应

负面记忆模型对线索更敏感：有线索时投资概率从0.46/0.52骤降至0.26/0.36；正面模型基本不变（0.42-0.53）。
回归（Table 5, Column 1）：IsCue = -0.0542***（t = -6.71），线索使投股概率降低5.42%。

发现6：风险偏好的因果改变

5项风险偏好任务（直接自评、问卷、Gneezy-Potters、Eckel-Grossman、真实投资情景）中，正面记忆模型一致表现为更爱冒险（Table 6）。
正面金融记忆模型在所有100次迭代中自评为"risk-loving"；负面模型仅65次。

发现7：收益可预测性

正面记忆模型平均投资评分0.22 (SD=0.86) vs. 负面模型-0.38 (SD=0.80)。
Long-short投资组合表现出显著分化（Figure 6），正面和负面记忆组合在2024年6月后急剧分离。

稳健性检验

按客观概率高/低分样本（Table 3, Panel A）：效果一致。
按试次早/晚分样本：效果一致（早期0.0175，晚期0.0183）。
按话题分类（Table 3, Panel B）：恐怖袭击、体育、金融市场、其他话题均显著；天气话题不显著。
跨模型验证：Claude-3-Haiku和Gemini-2.0-flash-light得到质性相似结果。
Probit回归验证（附录Table C2）：结果更显著。
BIG-Bench Lite能力测试：不同效价组模型能力无差异，排除"线索改变智力"的替代假说。

维度4：变量概览

观测变量（Outcome Variables）

变量	测量方式	描述
IsStockChoice_{t,b,m}	二元变量(0/1)	被试在试次t、区块b、模型m中是否选择股票
SubjProb_{t,b,m}	连续变量[0,1]	被试估计股票为Good的主观概率
Confid_{t,b,m}	连续变量(通常1-10)	被试对概率估计的信心
InvPayoff_{t,b,m}	累积金额	从第一次试次起的累积投资收益
风险偏好（5项任务）	多种量表	直接自评、问卷(0-10)、Gneezy-Potters投注额、Eckel-Grossman选项(1-6)、S&P500配置比例
投资评分	{-1, 0, 1}	新闻标题分类后的firm-level投资信号

核心自变量/Treatment变量

变量	测量方式
ValenceDec_{t,b,m}	图片效价按十分位分组（10个等级），基于10位人类评分者的平均效价(-2到+2)
IsPosMem_{b,cor,cue}	二元变量：微调模型是否使用正面语料（金融新闻或Yelp评论）
IsCue_{b,cor,cue}	二元变量：是否提供了联想线索
IsPosCue_{b,cor,cue}	二元变量：线索是否为正面内容

控制变量

变量	描述
IsStock_{t-1,b,m}	上一试次是否选择股票
SubjProb_{t-1,b,m}	上一试次主观概率
InvPayoff_{t-1,b,m}	上一试次累积收益
Confid_{t-1,b,m}	上一试次信心评级
δ_b	区块固定效应
ξ_m	模型固定效应
σ_{cor}	语料固定效应（金融新闻/Yelp）
ς_{cue}	线索固定效应（正/负/无）
ObjProb_{t,b,m}	贝叶斯客观概率（用于子样本分析）

维度5：局限性

被试是AI模型而非人类：实验结果揭示的是AI的行为规律，不能直接推广到人类决策。作者明确声明不将实验发现解读为AI具有"情感"的证据。
模型家族有限：主实验集中于GPT系列（8个模型），虽然在附录中验证了Claude和Gemini，但未覆盖开源模型（如DeepSeek-R1、LLaMA），因为这些模型不支持多模态或在长上下文实验中表现差。
微调仅限GPT-4o-mini：知识注入实验仅在一个模型上进行，因为OpenAI只允许对该模型进行外部微调。
假设性激励：GAI无法真正"获得"报酬，激励结构是假设性的。
图片线索的内生性：虽然图片随机分配，但图片效价评分依赖人类评分者，可能引入主观性。
天气话题无显著效应：效应并非在所有话题上都一致，天气类图片的线索效应不显著。

维度6：与其他文献的关系

核心对话文献

Kuhnen_Knutson_2011_RiskTaking — 实验范式的直接来源，原为人类fMRI神经科学实验
Kuhnen_2015_AsymmetricLearning — 人类在金融学习中的不对称性
Kuhnen_Miu_2017_SocioemotionalWealth — 情绪与金融决策
Bordalo_2024a_AssociativeMemory — 人类联想记忆与经济决策的理论框架（文本线索），本文扩展到视觉线索和AI主体
Bordalo_2020_MemoryBeliefs — 记忆与信念形成
Enke_2024_CognitiveUncertainty — 认知不确定性与决策
Wachter_Kahana_2024_MemoryModel — 记忆模型在金融中的应用

方法论相关

Mecklenburg_2024_KnowledgeInjection — 知识注入微调方法
Ouyang_2025_AIPreferences — AI风险偏好的直接问卷测量
Gneezy_Potters_1997_RiskTask — 风险偏好实验任务
Eckel_Grossman_2008_RiskElicitation — 风险偏好度量

AI行为与理性文献

Bybee_2025_LLMBeliefs — LLM记忆与经济信念（WSJ新闻），本文发现不同（跨领域效应更强）
Lopez_Lira_Tang_2025_StockPrediction — ChatGPT预测股票收益
Fedyk_2024_AIPreferences — AI复制人类投资偏好
Bini_2024_AIBiases — AI的非人类偏差
Horton_2023_HomoSilicus — GAI作为模拟人类被试
Malmendier_2021_ExperienceEffects — 经验效应的领域特异性假说，本文结果与之矛盾

行为金融经典

Kahneman_Tversky_2013_ProspectTheory — 前景理论（概率估计的四重模式）
Oprea_2024_CognitiveNoise — 认知噪声与风险决策

维度7：可拓展的研究方向

实验设计改进

引入人类对照组：在完全相同的实验设置下同时测试人类和AI被试，直接比较偏差大小和模式。
开源模型验证：在支持多模态的开源模型（如LLaVA、Qwen-VL）上复制实验，排除模型对齐（alignment）的干扰。
纵向跟踪：在模型版本迭代中重复实验，观察记忆驱动偏差是否随训练改进而减弱。

未探索的调节变量

Chain-of-Thought推理：作者在脚注和附录中提到o1和CoT模式下偏差显著减小，但未系统探究推理深度与偏差的关系曲线。
System prompt的角色：不同的系统提示（如"你是保守的投资顾问" vs. "你是激进的交易员"）是否调节记忆效应？
线索的时间衰减：线索与决策之间插入干扰任务后，效应是否衰减？
RAG检索增强：当AI被赋予外部知识检索能力时，内部记忆偏差是否被减弱？

可推广的领域

医疗AI决策：诊断AI是否因训练数据中的情绪性病例（如成功救治的感人故事）而对某些诊断过度乐观？
法律AI：法律AI助手的判决建议是否受其训练数据中案例的情绪效价影响？
信贷审批：AI信贷审批系统是否因"记忆"中正/负面借贷经验而产生系统性偏差？
AI监管设计：如何为基于记忆驱动的AI制定有效的金融监管框架（而非假设其完全理性）？

关键结论

GAI的投资决策由联想记忆驱动，而非纯粹理性：无关的情绪线索通过选择性记忆检索使AI更偏好/回避风险资产（效价最高vs最低图片导致投股概率差异约17%），但这些线索不影响其概率信念——说明记忆影响的是偏好通道而非信念通道。
即使与决策领域完全无关的记忆也能影响AI的金融行为：用Yelp餐厅评论微调的正面/负面记忆模型在投资任务中表现出显著差异（0.49 vs 0.36），且效应甚至强于同领域金融新闻记忆，这挑战了经验效应的"领域特异性"假说，揭示了AI潜在空间中跨领域情感维度的共线性是偏差的根源。

Memory_2025_Memory_Generative_Ai