清华・卡内基梅隆・哈佛等提出「Neuron Auctions」:通过调节LLM内部神经元自然融入品牌广告

richlovec 1500_400 (1)
 

清华大学、Carnegie Mellon University、Harvard University 等机构的研究者于 2026 年 5 月 8 日在 arXiv 上发布论文,提出一种利用大语言模型(LLM)内部神经元来调节广告展示的新方法「Neuron Auctions」,通过在生成过程中放大与品牌相关的神经元激活,让品牌信息以更自然的方式融入模型回答。

在传统搜索广告中,广告通常出现在搜索结果页的固定位置,例如顶部或侧边栏,广告位相对清晰。而在基于 LLM 的对话式交互中,回答是沿着对话上下文逐字生成的,很难预先划定固定的广告插入位置。如果直接在提示词(prompt)中硬插广告文案,或在回答中强行插入特定句子,往往会破坏回答的自然性和语义连贯性。

针对这一问题,研究团队提出不再把广告当作表层文本来处理,而是转而在 LLM 的内部表示空间中进行操作:先找出与特定品牌高度相关的 FFN(Feed-Forward Network)前馈网络神经元,在生成时放大这些神经元的激活值,从而提高该品牌在回答中被提及或被推荐的概率。

在内部表示空间中放大品牌相关神经元

在 Neuron Auctions 框架下,用户输入的原始提示词保持不变。系统所做的,是通过基于梯度的分析方法,识别出与各个品牌强相关的神经元,并在生成阶段对这些神经元的激活进行放大。

论文中以酒店、航空公司、运动品牌、音乐流媒体服务、高端手表品牌等为例,设计了多种能联想到目标品牌的填空式提示词,用来抽取与品牌对应的神经元。由于单一提示词容易受到具体语境的噪声影响,研究者使用多组语义相近但表述不同的提示词,寻找那些在不同表达下都能稳定对该品牌做出反应的神经元。

此外,为了避免选中对竞争品牌同样敏感的神经元,研究团队比较了各神经元对目标品牌与竞争品牌的贡献度,剔除了对多家同类品牌都有较强响应的神经元。这样筛选出的,是更偏向于某一特定品牌、而非“某类商品通用概念”的神经元。

■ Neuron Auctions 中的神经元干预概览
LLM Advertisement based on Neuron Auctions fig1.jpg

通过干预神经元数量调节「推荐力度」

在这一方案中,广告主购买的并不是“搜索结果的排序位置”,而是对 LLM 内部神经元干预的强度。具体做法是:为目标品牌选出前 k 个相关性最高的神经元,并在生成时放大这些神经元的激活值。k 越大,模型在回答中提及该品牌的概率就越高,推荐力度也越强。

研究团队在 Qwen3-4B、DeepSeek-R1-8B、Llama-3-8B 等模型上进行了实验,构造了 100 组「两个广告主」的组合场景,并在 Qwen3-4B 上额外测试了 20 组「三个广告主」的组合。

实验结果显示,分配给某品牌的神经元数量越多,该品牌在回答中被提及的频率就越高。即便在同时对多个品牌进行干预的情况下,对每个品牌影响最大的因素仍然是分配给该品牌自身的神经元数量。

不过,当干预强度过大时,模型可能会出现反复提及同一品牌名等不稳定现象。论文在比较不同放大系数后,从推荐效果与生成稳定性之间的平衡出发,在实验中统一采用了 2.0 作为放大系数。

在广告主、平台与用户体验之间寻找平衡

Neuron Auctions 被设计为一种「菜单式」广告竞价机制:平台预先给出若干选项,每个选项对应不同的干预神经元数量及其价格。广告主可以根据自身的点击率预期和投资回报率(ROI),选择最有利可图的方案。

平台方在优化时,不仅考虑从广告主获得的收入,也将用户体验纳入目标函数。如果广告干预过强,回答可能变得不自然,甚至偏离用户真实意图,从而损害长期用户价值。

论文采用了回答相关性、表达连贯性、广告融入的自然程度、用户点击意愿等指标来评估不同设置下的效果。结果表明,当平台在优化中提高对用户体验的权重时,平台收入和广告主效用会有所下降,但用户侧的满意度会相应提升。

■ 图)用户体验与广告收益之间的权衡
左图为两个广告主场景,右图为三个广告主场景。随着用户体验权重 wuser 的增大,用户效用在两种场景下都呈上升趋势,而平台收入则相应下降。论文将这一现象视为 LLM 广告变现与用户体验之间的典型权衡关系。

fig5 Scores over wuser.jpg

研究导向:为未来 LLM 广告设计提供思路

需要强调的是,这项工作并非某个商用 LLM 已经上线的广告功能,而是一项面向未来的机制设计研究。研究者关注的是:如果要在 LLM 回答中嵌入广告,应该把什么作为竞价对象,又如何在广告主收益、平台收入与用户体验之间进行系统性权衡。

论文指出,Neuron Auctions 在单轮生成场景中已经展现出一定效果,但如何扩展到多轮对话式智能体仍是后续研究课题。如果考虑在真实服务中落地,还需要进一步讨论广告展示的透明度、对用户的明确告知、模型中立性以及相关监管要求等问题。


分享:


发表评论

登录后才可评论。 去登录