AAAI 3 条

OPLoRA: Orthogonal Projection LoRA Prevents Catastrophic Forgetting during Parameter-Efficient Fine-Tuning

AAAI引用量 15CCF-A推荐 2025-10-01

提出 OPLoRA(正交投影 LoRA),针对 LoRA 微调时易发生灾难性遗忘的问题,通过将更新约束在与预训练权重主奇异方向正交的子空间中,避免干扰承载原有知识的关键方向。它在保持参数高效的同时显著减轻遗忘。对从业者而言,这让在新任务上微调大模型时更好地保留通用能力,提升落地稳健性。

参数高效微调LoRA灾难性遗忘正交投影微调
📖 阅读⬇ PDF

On the Effectiveness of Parameter-Efficient Fine-Tuning

AAAI引用量 243CCF-A推荐 2022-11-01

该研究系统性分析参数高效微调的有效性,探讨为何仅训练少量参数即可媲美全量微调,并考察其在不同任务与数据规模下的表现与局限。其贡献在于对PEFT背后机理和适用边界的实证理解。对从业者而言,有助于判断在何种场景下PEFT可靠、何时需谨慎使用。

参数高效微调PEFT实证分析全量微调NLP泛化能力
📖 阅读⬇ PDF

ACL 202 条

Understanding the Behaviors of Environment-aware Information Retrieval

ACL 2026CCF-A推荐 2026-06-19Agent

该研究揭示了可用强化学习训练大模型,使其能根据下游检索器自适应调整查询表述策略,且不同检索器存在各自最优的查询风格。还通过检索器特定引导与模型扩展进一步提升检索增强效果,为查询改写优化提供了系统认知。

查询改写检索增强强化学习大模型信息检索检索器自适应
📖 阅读⬇ PDF

Calibration-Aware Policy Optimization for Reasoning LLMs

ACL 2026CCF-A推荐 2026-04-01

该工作针对GRPO(组相对策略优化)在增强LLM推理能力时引入的过度自信问题,提出校准感知的策略优化方法,解决错误响应困惑度低于正确响应导致的相对校准退化。核心贡献在于将校准目标融入强化学习过程,提升推理模型输出置信度的可靠性,对构建更准确可信的推理型LLM具有重要实践意义。

GRPO推理模型置信度校准策略优化过度自信强化学习
📖 阅读⬇ PDF

MadaKV: Adaptive Modality-Perception KV Cache Eviction for Efficient Multimodal Long-Context Inference

ACL引用量 10CCF-A推荐 2025-06-01

MadaKV 是一种模态自适应的 KV 缓存淘汰策略,专门针对多模态大模型在长上下文推理中的显存瓶颈,根据不同模态信息的重要性动态保留或丢弃缓存。其亮点在于细粒度的模态感知机制,在维持模型性能的同时显著降低推理时显存开销。对于需要部署高效多模态长上下文应用的工程师,该方法提供了实用的推理加速和资源优化手段。

多模态大模型KV缓存缓存淘汰长上下文推理推理优化显存优化
📖 阅读⬇ PDF

UORA: Uniform Orthogonal Reinitialization Adaptation in Parameter-Efficient Fine-Tuning of Large Models

ACL引用量 16CCF-A推荐 2025-05-01

提出 UORA(均匀正交重初始化适配),一种新的参数高效微调方法,通过对适配矩阵进行均匀正交重初始化来提升大模型微调的表现与稳定性,并在多项任务上取得领先效果。对从业者而言,它在不显著增加参数的前提下提供了更优的 PEFT 选择,便于在有限算力下高效适配大模型。

参数高效微调正交初始化大模型微调LoRA
📖 阅读⬇ PDF

Quaff: Quantized Parameter-Efficient Fine-Tuning under Outlier Spatial Stability Hypothesis

ACL引用量 9CCF-A推荐 2025-05-01

提出 Quaff,基于「离群值空间稳定性假设」的量化参数高效微调方法,旨在解决大模型在资源受限的个人设备上部署时计算与显存开销过高的问题。它利用激活离群值在空间分布上的稳定性来优化量化与微调的结合。对从业者而言,这有助于在端侧设备上更低成本地完成大模型量化微调与部署。

量化参数高效微调显存优化端侧部署离群值
📖 阅读⬇ PDF

ELABORATION: A Comprehensive Benchmark on Human-LLM Competitive Programming

ACLCCF-A推荐 2025-01-01

ELABORATION 构建了一个全面的人类与 LLM 竞赛编程评估基准,覆盖多种算法挑战。它为衡量大语言模型在实际算法竞赛中的表现提供了标准化工具,有助于推动模型编程能力的进步。

基准测试竞赛编程LLM人类对比编程能力评估

The Impossibility of Fair LLMs

ACLCCF-A推荐 2025-01-01

本文从理论角度论证了公平大语言模型的不可能性,揭示在复杂社会偏见下现行公平标准的内在矛盾。该工作提醒研发人员,在追求 LLM 公平时应更务实地考虑统计与伦理的固有限制。

公平性LLM不可能性偏见伦理理论分析

Intuitive Fine-Tuning: Towards Simplifying Alignment into a Single Process

ACLCCF-A推荐 2025-01-01

Intuitive Fine-Tuning 提出将多步对齐过程简化为单一训练流程,以更直接的方式实现模型偏好优化。该方法降低了对齐的技术门槛,使从业者能更便捷地构建符合人类偏好的模型。

微调对齐简化偏好优化RLHF单阶段训练

Bias in Language Models: Beyond Trick Tests and Towards RUTEd Evaluation

ACLCCF-A推荐 2025-01-01

该工作提出超越简单「陷阱测试」的语言模型偏差评估方法,转向更具鲁棒性的RUTEd评估框架。通过更全面、细致的测试场景揭示模型潜在偏见,为从业者提供更可靠的安全对齐评测工具。

偏见评估语言模型安全对齐公平性鲁棒性测试

Capture the Key in Reasoning to Enhance CoT Distillation Generalization

ACLCCF-A推荐 2025-01-01

该研究在思维链蒸馏过程中捕获推理步骤中的关键信息,从而增强学生模型的泛化能力。这一方法提升了小模型推理能力蒸馏的效率与效果,为低成本推理能力迁移提供有效方案。

思维链蒸馏推理泛化知识蒸馏小模型关键信息捕获

Extending LLM Context Window with Adaptive Grouped Positional Encoding: A Training-Free Method

ACLCCF-A推荐 2025-01-01

该工作提出一种免训练的自适应分组位置编码方法,用于扩展大语言模型的上下文窗口,无需额外微调即可支持更长输入。其核心贡献在于通过分组策略动态调整位置编码,缓解了位置外推时的性能衰减,对需要处理超长文档的从业者具有直接实用价值。

大模型上下文窗口扩展位置编码免训练长文本处理

Semantic Exploration with Adaptive Gating for Efficient Problem Solving with Language Models

ACLCCF-A推荐 2025-01-01

本文提出一种结合语义探索与自适应门控机制的方法,旨在提升语言模型在复杂问题求解中的效率。核心亮点是让模型自主决定何时进行深层语义探索,以平衡推理深度与计算成本,为构建更高效且可靠的智能推理系统提供了新思路。

大模型推理优化自适应门控语义探索问题求解

Can Multimodal Large Language Models Understand Spatial Relations?

ACLCCF-A推荐 2025-01-01

该研究系统评估了多模态大语言模型对空间关系的理解能力,揭示当前模型在处理方位、距离等空间语义时的局限性。其贡献在于建立了专门的评估基准,帮助从业者认识到多模态模型在空间推理上的短板,为后续改进指明方向。

多模态大语言模型空间关系能力评估视觉语言理解基准测试

TrimLLM: Progressive Layer Dropping for Domain-Specific LLMs

ACLCCF-A推荐 2025-01-01

TrimLLM提出一种针对领域专用大模型的渐进式层剪枝技术,通过逐步移除冗余层实现模型压缩与加速。该方法在保持领域性能的同时显著降低推理成本,对需要在特定场景部署高效模型的工程师尤为重要。

大模型压缩层剪枝领域专用模型推理加速模型轻量化

JuStRank: Benchmarking LLM Judges for System Ranking

ACLCCF-A推荐 2025-01-01

JuStRank构建了一个基准测试,用于评估将大语言模型用作系统排序裁判时的可靠性与偏差。该工作为自动化评价系统提供了量化对比框架,有助于从业者更审慎地选择或设计用于模型排序的裁判模型。

大模型评判系统排序基准测试模型评估可靠性分析

Generating Diverse Training Samples for Relation Extraction with Large Language Models

ACLCCF-A推荐 2025-01-01

该研究利用大语言模型生成多样化的训练样本,以增强关系抽取任务的数据丰富性。核心贡献在于揭示了如何通过精心设计的提示策略让LLM产出高质量、多样化的标注数据,从而降低人工标注成本并提升抽取模型鲁棒性。

关系抽取数据增强大模型生成训练样本少样本学习

Evaluation of LLM Vulnerabilities to Being Misused for Personalized Disinformation Generation

ACLCCF-A推荐 2025-01-01

该研究评估了大语言模型被滥用以生成个性化虚假信息的潜在脆弱性,分析模型在特定引导下编造针对性谣言的能力。这对安全从业者至关重要,有助于理解当前模型在内容安全方面的风险边界并推动防护机制研发。

大模型安全虚假信息生成内容滥用风险评估个性化攻击

EscapeBench: Towards Advancing Creative Intelligence of Language Model Agents

ACLCCF-A推荐 2025-01-01

EscapeBench 是一个评估语言模型智能体创造性智能的基准测试,通过密室逃脱式任务考察模型的发散思维、工具使用和多步规划能力。该工作为衡量大模型在开放域创造性问题解决中的表现提供了新标尺,对开发者理解模型的创造力边界具有重要意义。

大模型智能体创造性智能基准测试密室逃脱多步推理

BPP-Search: Enhancing Tree of Thought Reasoning for Mathematical Modeling Problem Solving

ACLCCF-A推荐 2025-01-01

BPP-Search 提出一种增强的思维树搜索方法,专门用于数学建模问题的求解。它通过分支、剪枝和路径评估策略提升大模型在复杂数学推理中的表现,为自动化数学建模任务提供了更有效的问题求解框架。

大模型思维树数学推理数学建模搜索策略问题求解

Fusing Highly Specialized Language Models for Comprehensive Expertise

ACLCCF-A推荐 2025-01-01

该研究探索如何融合多个高度专业化的语言模型,构建一个具备广泛专长的综合系统。核心贡献在于提出一种模型融合方法,使组合后的系统能同时覆盖多个垂直领域的深层知识,为需要多领域协同的工业应用提供了新思路。

模型融合专家模型多领域知识语言模型垂直领域集成学习

HybGRAG: Hybrid Retrieval-Augmented Generation on Textual and Relational Knowledge Bases

ACLCCF-A推荐 2025-01-01

HybGRAG 提出一种混合检索增强生成框架,能同时利用文本和非结构化知识以及关系型知识库进行检索。该工作弥补了传统 RAG 仅处理文本的不足,使得模型能够结合结构化事实进行更准确的推理,对构建知识密集型应用至关重要。

检索增强生成混合检索关系型知识库知识推理大模型RAG

MIND: A Multi-agent Framework for Zero-shot Harmful Meme Detection

ACLCCF-A推荐 2025-01-01

MIND 是一个多智能体框架,旨在零样本条件下检测有害模因(meme)。它通过多个专业化智能体的协作推理来分析图文内容,无需额外训练即可识别仇恨言论等有害信息,为内容安全提供了灵活高效的AI治理方案。

多智能体有害模因检测零样本学习内容安全多模态协作推理

Model Extrapolation Expedites Alignment

ACLCCF-A推荐 2025-01-01

模型外推法被用来加速大模型与人类偏好的对齐过程。该方法通过利用模型参数的外推趋势,减少对齐训练所需的反馈数据量和计算开销,为提升模型对齐效率和实用性提供了新的技术路径。

大模型对齐模型外推偏好优化训练加速人类反馈RLHF

FedEx-LoRA: Exact Aggregation for Federated and Efficient Fine-Tuning of Large Language Models

ACLCCF-A推荐 2025-01-01

FedEx-LoRA 提出一种精确聚合方法,用于联邦学习场景下大语言模型的高效微调。它在保护数据隐私的同时,保证本地LoRA适配器能无损聚合为全局模型,解决了联邦LoRA中聚合不精确的问题,对隐私敏感的分布式AI部署意义重大。

联邦学习LoRA模型聚合微调隐私保护大模型

Jailbreak Large Vision-Language Models Through Multi-Modal Linkage

ACLCCF-A推荐 2025-01-01

提出一种多模态链接攻击,利用视觉与文本模态间的对齐缺陷,实现针对大型视觉语言模型的越狱,暴露其安全脆弱性。该工作提醒从业者重视多模态场景下的安全对齐挑战。

越狱攻击视觉语言模型多模态安全对齐对抗攻击

The Hidden Attention of Mamba Models

ACLCCF-A推荐 2025-01-01

揭示Mamba状态空间模型中存在隐式的注意力模式,通过分析其内部动态,桥接与Transformer的关联。该发现有助于理解Mamba的工作机理,为架构设计和可解释性提供新视角。

Mamba状态空间模型注意力机制模型解释隐式注意力

Improve Vision Language Model Chain-of-thought Reasoning

ACLCCF-A推荐 2025-01-01

本文提出改进视觉语言模型思维链推理的方法,通过优化多模态思考过程增强模型在视觉问答等任务上的逐步推理表现。核心贡献在于设计新的推理增强策略,提升复杂场景的理解与解释能力,为多模态模型深入推理提供实用路径。

视觉语言模型思维链多模态推理视觉问答逐步推理

On the Mutual Influence of Gender and Occupation in LLM Representations

ACLCCF-A推荐 2025-01-01

研究分析大语言模型内部表征中性别与职业概念的相互影响,揭示模型习得的社会偏见与刻板印象联系。通过对表征空间的可视化与度量,为后续去偏干预和公平性评估提供了重要的理论依据与分析工具。

大语言模型偏见分析性别职业表征解耦公平性

Disentangling Memory and Reasoning Ability in Large Language Models

ACLCCF-A推荐 2025-01-01

探索如何在大语言模型中解耦记忆与推理两种能力,提出评估框架区分模型是依靠参数化记忆还是真正逻辑推理来完成任务。该研究有助于理解LLM能力来源,指导架构改进以强化可控推理而非简单记忆复现。

大语言模型记忆与推理解耦能力评估模型可解释性推理增强

LangSAMP: Language-Script Aware Multilingual Pretraining

ACLCCF-A推荐 2025-01-01

提出考虑语言和文字系统的多语言预训练方法LangSAMP,通过注入文字感知信号增强模型对不同文字变体的建模能力。该方法有效提升了低资源语言的跨迁移表现,为多语言模型公平性和覆盖面提供了新思路。

多语言预训练文字感知低资源语言跨语言迁移语言模型

Binary Classifier Optimization for Large Language Model Alignment

ACLCCF-A推荐 2025-01-01

提出利用二分类器优化大语言模型对齐人类偏好的范式,替代传统奖励模型,训练更稳定、校准更优。该工作简化了RLHF流程,有望降低对齐训练的资源消耗并提高模型响应的安全性与实用性。

大语言模型对齐二分类器RLHF偏好优化AI安全

UnSeenTimeQA: Time-Sensitive Question-Answering Beyond LLMs' Memorization

ACLCCF-A推荐 2025-01-01

发布时间敏感问答基准UnSeenTimeQA,要求大模型依据提供的实时上下文而非内部记忆回答问题,专门检验模型对时间信息的理解与推理。该数据集推动LLM从记忆依赖转向情景化时间推理,契合知识更新场景需求。

问答基准时间感知反记忆LLM评估知识更新

Root Defense Strategies: Ensuring Safety of LLM at the Decoding Level

ACLCCF-A推荐 2025-01-01

本文提出在LLM解码阶段实施根防御策略,从生成根源阻止有害内容输出。核心贡献是无需外部过滤器的底层安全机制,可实时生效。对从业者而言,这为在线安全防护提供了高效且可靠的方案。

大模型安全解码策略防御机制实时防护有害输出过滤

L4Q: Parameter Efficient Quantization-Aware Fine-Tuning on Large Language Models

ACLCCF-A推荐 2025-01-01

L4Q将参数高效微调与量化感知训练结合,在低比特量化下维持LLM微调性能。其亮点是大幅节省显存与计算开销,同时减轻精度损失。对于资源受限场景,该方法提供了实用的模型定制途径。

大模型微调量化感知训练参数高效微调LoRA显存优化模型压缩

Second Language (Arabic) Acquisition of LLMs via Progressive Vocabulary Expansion

ACLCCF-A推荐 2025-01-01

该研究通过渐进式词汇扩展使LLM高效习得阿拉伯语等第二语言,且不损害原有能力。亮点是增量词汇学习策略,缓解灾难性遗忘。对多语言模型开发者,这提供了一种低成本扩展新语言的方式。

多语言大模型词汇扩展第二语言习得低资源语言灾难性遗忘

Exploring Forgetting in Large Language Model Pre-Training

ACLCCF-A推荐 2025-01-01

该工作分析LLM预训练中的知识遗忘现象,揭示预训练顺序对记忆保持的影响。核心贡献是遗忘模式研究及潜在缓解策略。这有助于从业者优化训练流程,提升模型最终知识密度。

预训练灾难性遗忘知识保留训练动态大模型持续学习

Bias in the Mirror : Are LLMs opinions robust to their own adversarial attacks

ACLCCF-A推荐 2025-01-01

本文探讨大模型面对自身生成对抗攻击时,其观点偏见是否稳健。通过自我对抗测试发现模型在部分偏见上存在脆弱性。结果可为模型内在偏见的评估与修正提供重要参考。

偏见检测对抗鲁棒性自我对抗观点一致性大模型安全公平性

AndroidLab: Training and Systematic Benchmarking of Android Autonomous Agents

ACLCCF-A推荐 2025-01-01

AndroidLab为训练和评估Android自主代理提供标准化平台与基准,涵盖真实移动交互任务。其核心是系统化评测代理的感知、规划与操作能力。对移动AI研究者,这填补了代理能力对比工具的空白。

Android代理基准测试移动端AI自主代理任务训练GUI智能体

Modular Sentence Encoders: Separating Language Specialization from Cross-Lingual Alignment

ACLCCF-A推荐 2025-01-01

提出模块化句子编码器,将语言专有表示与跨语言对齐模块解耦。核心贡献是允许独立优化单语言能力和跨语言迁移,提升多语言系统的灵活性与可扩展性。对从业者而言,可更高效地适配新语言,避免对齐与语言建模相互干扰。

多语言句子编码跨语言对齐模块化架构表示学习

Multimodal Transformers are Hierarchical Modal-wise Heterogeneous Graphs

ACLCCF-A推荐 2025-01-01

揭示多模态 Transformer 可形式化为层次化的模态间异构图,阐明不同模态特征在深层网络中的交互结构。该视角为理解融合机制和设计更高效的多模态架构提供理论支撑。从业者可据此优化模态交互路径,减少冗余计算。

多模态 Transformer异构图模态交互层次化结构模型分析

LegalAgentBench: Evaluating LLM Agents in Legal Domain

ACLCCF-A推荐 2025-01-01

构建 LegalAgentBench 基准,从法律咨询、文书撰写、法条检索等维度综合评估 LLM 智能体的法律能力。该基准弥补了法律 AI 领域缺少标准化 Agent 评测的空白。帮助研究者与开发者客观对比不同智能体,推动法律 AI 落地。

智能体评测法律领域大语言模型Agent基准测试

Inference Compute-Optimal Video Vision Language Models

ACLCCF-A推荐 2025-01-01

探索视频视觉语言模型的推理计算最优分配策略,旨在以最小计算开销获得最佳视频理解性能。通过动态调整帧采样与模型推理路径,显著降低延迟和成本。为实时视频问答、视频摘要等场景提供了实用优化方案。

视频理解视觉语言模型推理优化计算最优效率

Steering into New Embedding Spaces: Analyzing Cross-Lingual Alignment Induced by Model Interventions in Multilingual Language Models

ACLCCF-A推荐 2025-01-01

分析在多语言模型中通过干预(如微调、提示)改变嵌入空间时所引发的跨语言对齐效应。研究揭示了不同干预手段如何重塑语言表示之间的对齐结构,提升低资源语言的迁移性能。为多语言模型的可控迁移学习提供可解释性指导。

跨语言对齐多语言模型模型干预嵌入空间可解释性

Assessment and manipulation of latent constructs in pre-trained language models using psychometric scales

ACLCCF-A推荐 2025-01-01

引入心理测量量表,量化并操控预训练语言模型中的潜在构念(如人格特质、情绪倾向)。建立从心理测量学角度理解和干预模型行为的框架,为可控文本生成、偏见缓解提供新工具。有助于构建更符合社会规范的生成模型。

心理测量潜在构念预训练语言模型可控生成模型行为分析

Nemotron-CC: Transforming Common Crawl into a Refined Long-Horizon Pretraining Dataset

ACLCCF-A推荐 2025-01-01

Nemotron-CC 项目将海量 Common Crawl 网页数据转化为高质量、长程预训练数据集,重点通过精细化清洗与筛选提升数据质量。其核心贡献在于提供了一套可复现的管线,以较低成本构建堪比闭源数据集的长程依赖预训练语料,对从事大规模语言模型训练的从业者具有重要参考价值。

预训练数据集数据清洗Common Crawl长程依赖数据工程大模型

Contrastive Perplexity for Controlled Generation: An Application in Detoxifying Large Language Models

ACLCCF-A推荐 2025-01-01

该工作提出「对比困惑度」方法用于可控文本生成,并将其应用于大语言模型的去毒化任务。亮点在于无需外部分类器或昂贵微调,仅通过对比目标属性与原始模型的分布差异指导解码,为安全对齐提供了一种轻量、推理时可控的解决方案。

可控生成对比解码去毒化推理时对齐安全对齐困惑度

INVESTORBENCH: A Benchmark for Financial Decision-Making Tasks with LLM-based Agent

ACLCCF-A推荐 2025-01-01

INVESTORBENCH 是一个面向金融决策的基准,基于大模型驱动的智能体评估其在复杂投资场景中的表现。它提供了多种资产类别和真实市场数据模拟,帮助从业者衡量 LLM Agent 在金融分析、风险管理等任务上的能力边界。

金融决策智能体基准测试大模型评估投资模拟多任务

Smarter, Better, Faster, Longer: A Modern Bidirectional Encoder for Fast, Memory Efficient, and Long Context Finetuning and Inference

ACLCCF-A推荐 2025-01-01

该研究提出一种现代双向编码器架构,在保持快速推理的同时显著降低显存占用并扩展上下文长度。其贡献在于平衡了效率、长上下文建模与微调/推理成本,为需要高效编码的检索、表示学习及边缘部署场景提供了实用设计。

双向编码器长上下文内存优化高效推理微调表示学习

Gender Inclusivity Fairness Index (GIFI): A Multilevel Framework for Evaluating Gender Diversity in Large Language Models

ACLCCF-A推荐 2025-01-01

GIFI 框架从多个层级评估大语言模型中的性别包容性与多样性,旨在量化模型输出中的性别偏见与覆盖度。它为从业者提供了一个系统化衡量性别公平性的工具,有助于指导更具包容性的模型开发与迭代。

公平性评估性别多样性大模型偏见包容性指数评价框架负责任的AI

MAIN-RAG: Multi-Agent Filtering Retrieval-Augmented Generation

ACLCCF-A推荐 2025-01-01

MAIN-RAG 提出多智能体协同的过滤式检索增强生成框架,通过多个专用 Agent 合作筛选并验证外部知识,从而提升生成事实性与鲁棒性。该方法缓解了传统 RAG 中检索噪声问题,对构建更可信的生成系统具有工程参考价值。

多智能体检索增强生成事实性知识过滤协同推理RAG

Context-Aware Sentiment Forecasting via LLM-based Multi-Perspective Role-Playing Agents

ACLCCF-A推荐 2025-01-01

该工作利用基于大模型的多视角角色扮演智能体实现上下文感知的情感预测,通过从不同立场模拟情感演变捕获社会动态。其创新在于将多智能体角色扮演引入情感计算,可为舆情分析、对话系统等提供更细粒度的情感趋势推断。

情感预测多智能体角色扮演上下文感知观点挖掘大模型应用

AndroidGen: Building an Android Language Agent under Data Scarcity

ACLCCF-A推荐 2025-01-01

AndroidGen 在数据稀缺条件下构建了一个 Android 语言智能体,能够理解自然语言指令并执行移动设备操作。其核心贡献在于弱监督数据利用策略与模块化架构,为低资源移动端智能体的开发提供了可行方案。

移动端智能体Android数据稀缺语言智能体指令执行低资源

Prompt Candidates, then Distill: A Teacher-Student Framework for LLM-driven Data Annotation

ACLCCF-A推荐 2025-01-01

提出一种教师-学生框架,先用大语言模型生成候选标注提示,再通过蒸馏筛选高质量标注,降低对昂贵人工标注的依赖。核心贡献在于将提示工程与知识蒸馏结合,提升数据标注的质量与效率。对从业者而言,提供了一种低成本、可扩展的自动化标注方案。

数据标注教师-学生框架提示工程知识蒸馏大语言模型数据增强

A Survey of Post-Training Scaling in Large Language Models

ACLCCF-A推荐 2025-01-01

全面综述大语言模型后训练阶段的缩放技术,涵盖数据、模型大小与计算维度,系统分析对齐、推理等能力的缩放规律。核心贡献是为研究人员提供后训练缩放的最新进展与关键发现的路线图。对从业者,帮助理解如何通过后训练缩放优化模型性能与效率。

大语言模型后训练缩放定律综述对齐推理优化

Centurio: On Drivers of Multilingual Ability of Large Vision-Language Model

ACLCCF-A推荐 2025-01-01

通过受控实验分析预训练数据、模型架构和训练策略等因素,揭示大规模视觉语言模型多语言能力的关键驱动因素。核心贡献是提供经验性见解,指导设计更强的多语言多模态模型。从业者可据此优化多语言视觉任务的表现。

多模态视觉语言模型多语言能力预训练迁移学习模型评估

Ensemble Watermarks for Large Language Models

ACLCCF-A推荐 2025-01-01

提出集成多种互补水印方案的方法,提高大语言模型生成文本的水印鲁棒性和隐蔽性,有效抵抗擦除攻击。核心贡献是引入集成思想增强水印安全性,为负责任AI生成提供更可靠的版权保护。从业者可应用于防止模型滥用与内容溯源。

大语言模型水印集成学习鲁棒性版权保护安全

DioR: Adaptive Cognitive Detection and Contextual Retrieval Optimization for Dynamic Retrieval-Augmented Generation

ACLCCF-A推荐 2025-01-01

提出DioR框架,自适应检测用户查询的认知需求,动态优化检索策略与上下文利用,提升检索增强生成系统的准确性与效率。亮点是认知感知的检索优化,使RAG更智能地适应不同复杂问题。从业者可改善复杂问答场景下的系统表现。

检索增强生成动态检索认知检测上下文优化问答系统自适应

ToolHop: A Query-Driven Benchmark for Evaluating Large Language Models in Multi-Hop Tool Use

ACLCCF-A推荐 2025-01-01

构建查询驱动基准ToolHop,专门评估大语言模型在多步工具调用场景下的规划与推理能力,包含需顺序使用多个工具的任务。核心贡献是提供细粒度、现实的多跳工具使用测试集,揭示现有模型短板。从业者可用来评测和提升LLM的工具使用能力。

工具使用基准测试多跳推理大语言模型规划评估

LADM: Long-context Training Data Selection with Attention-based Dependency Measurement for LLMs

ACLCCF-A推荐 2025-01-01

LADM 提出了一种基于注意力依赖度量的长上下文训练数据选择方法,能够量化文本段落间的长距离依赖关系,从而筛选出更有利于拓展LLM上下文窗口的高质量数据。该方法可降低长上下文训练成本,同时提升模型对长文本的理解与推理能力,对需要处理超长输入的从业者具有实际优化价值。

长上下文数据选择注意力机制依赖度量LLM训练优化

Cultural Learning-Based Culture Adaptation of Language Models

ACLCCF-A推荐 2025-01-01

该工作聚焦于语言模型的文化适应,采用基于文化学习的方式使模型更好地理解和反映不同文化背景的语言习惯与价值观。其核心贡献在于提供了一种系统性的文化适配框架,减少模型输出中的文化偏见,对构建全球化、包容性强的AI应用至关重要。

文化学习文化适应语言模型偏见缓解多文化AI

Refuse Whenever You Feel Unsafe: Improving Safety in LLMs via Decoupled Refusal Training

ACLCCF-A推荐 2025-01-01

本研究提出解耦式拒绝训练方法,让大模型在「感到不安全」时能够主动拒绝生成有害内容,通过将安全性判断与回复生成进行解耦,提升了安全对齐的鲁棒性。该方法有助于防御越狱攻击,为从业者提供了一种更可靠的安全训练策略。

LLM安全拒绝训练解耦越狱防御安全对齐有害内容过滤

Token Prepending: A Training-Free Approach for Eliciting Better Sentence Embeddings from LLMs

ACLCCF-A推荐 2025-01-01

Token Prepending 是一种无需训练的句子嵌入提取方法,通过在输入前添加特定token来激发大模型产生更高质量的句子表示。该方法简单易用,可直接应用于现有LLM,为下游语义匹配、检索等任务提供性能提升,降低了嵌入模型的部署门槛。

句子嵌入免训练方法Token Prepending表示学习语义表征LLM应用

Addressing Blind Guessing: Calibration of Selection Bias in Multiple-Choice Question Answering by Video Language Models

ACLCCF-A推荐 2025-01-01

本文解决了视频语言模型在多选题问答中的盲猜校准问题,通过校正选择偏差来提升评估的可靠性。核心亮点是提出了一种校准策略,使得模型预测概率更准确地反映其真实置信度,对需要精准评估视频理解能力的从业者尤为重要。

视频语言模型选择题偏差校准置信度盲猜评估可靠性

Towards Reward Fairness in RLHF: From a Resource Allocation Perspective

ACLCCF-A推荐 2025-01-01

该工作从资源分配视角研究RLHF中的奖励公平性,确保不同任务或数据得到合理回馈,避免奖励坍缩或偏向特定分布。这有助于训练出更平衡、公正的奖励模型,对提升大模型对齐质量和输出多样性具有指导意义。

RLHF奖励公平资源分配奖励模型对齐公平性

Taming LLMs with Gradient Grouping

ACLCCF-A推荐 2025-01-01

Taming LLMs with Gradient Grouping 提出一种梯度分组技术,通过结构化地聚合和调整梯度来驯服大模型的训练动态,提升训练稳定性和效率。该方法为优化器设计提供了新思路,能帮助从业者更稳定地训练大模型,降低崩溃风险。

梯度分组训练稳定性优化技术LLM训练梯度调整

Which of These Best Describes Multiple Choice Evaluation with LLMs? A) Forced B) Flawed C) Fixable D) All of the Above

ACLCCF-A推荐 2025-01-01

这篇观点性论文批判性地审视了多选题方式评估大语言模型的种种缺陷,指出这种评估范式具有强迫性、有根本缺陷但又有改善空间。它提醒从业者审慎解读基准测试分数,并呼吁开发更全面的评估方法,对推动评估生态健康发展有重要意义。

评估范式多选题基准测试批判LLM评估评估有效性方法论反思

SR-LLM: Rethinking the Structured Representation in Large Language Model

ACLCCF-A推荐 2025-01-01

该研究重新审视大语言模型中结构化表示的设计,探索如何更高效地编码与利用表格、图谱等结构化知识。核心贡献在于提出新的结构化表示方法,有望提升模型对于结构化数据的理解与推理能力。对构建知识驱动型LLM应用的从业者具有重要参考价值。

大语言模型结构化表示知识编码推理增强

Contrastive Prompting Enhances Sentence Embeddings in LLMs through Inference-Time Steering

ACLCCF-A推荐 2025-01-01

本文提出对比提示方法,在推理阶段通过对比不同提示来引导句子嵌入,无需额外训练即可提升嵌入质量。亮点是利用推理时引导实现简单高效的嵌入增强。对需要高质量文本表示的下游任务(如检索、聚类)具有重要意义。

对比提示句子嵌入推理时引导嵌入增强大语言模型

Hierarchical Document Refinement for Long-context Retrieval-augmented Generation

ACLCCF-A推荐 2025-01-01

本文针对长上下文检索增强生成场景,提出层级式文档精炼方法,通过逐步压缩与筛选检索内容来处理超长输入。核心贡献在于缓解长上下文中信息丢失与效率瓶颈。对构建长文档RAG系统的从业者十分有价值。

检索增强生成长上下文文档精炼层级结构大语言模型

Comparing Moral Values in Western English-speaking societies and LLMs with Word Associations

ACLCCF-A推荐 2025-01-01

研究通过词语联想任务,系统比较西方英语社会与大型语言模型在道德价值观上的异同,评估模型对人类道德观念的对齐程度。核心贡献在于提供衡量LLM价值对齐的新手段。对关注AI伦理、模型公平性与安全性的开发者有参考意义。

道德价值观价值对齐词语联想大语言模型社会比较AI伦理

Progressive Multimodal Reasoning via Active Retrieval

ACLCCF-A推荐 2025-01-01

该研究提出渐进式多模态推理框架,通过主动检索相关知识来逐步求解复杂多模态问题。核心贡献是将自适应检索融入推理链,提升多模态模型的知识覆盖与推理深度。对多模态问答和视觉推理应用有实际推动价值。

多模态推理主动检索渐进式推理视觉语言模型检索增强

Pre-training Distillation for Large Language Models: A Design Space Exploration

ACLCCF-A推荐 2025-01-01

本文系统探索了大型语言模型预训练阶段的知识蒸馏设计空间,比较了不同蒸馏目标、教师模型架构及训练策略。核心贡献在于为压缩大模型预训练提供全面的指导性分析。对希望降低预训练成本的从业者具有重要参考价值。

预训练蒸馏大语言模型知识蒸馏设计空间模型压缩

Teaching Vision-Language Models to Ask: Resolving Ambiguity in Visual Questions

ACLCCF-A推荐 2025-01-01

该工作教会视觉语言模型在遇到模糊视觉问题时主动生成澄清性提问,通过交互消除歧义。亮点在于赋予模型「知而问」的能力,提高人机交互的稳健性。对开发更可靠的视觉问答与辅助系统有启发意义。

视觉语言模型歧义消除主动提问视觉问答人机交互

LongBench v2: Towards Deeper Understanding and Reasoning on Realistic Long-context Multitasks

ACLCCF-A推荐 2025-01-01

LongBench v2 是一个专为真实长上下文多任务场景设计的评测基准,重点考察模型在长文本中的深层理解与复杂推理能力。该基准通过多样化的任务形式,推动长上下文大语言模型从表面检索走向深度语义推理,对从业者评估模型真实长文本处理水平具有重要价值。

长上下文基准测试多任务推理深度理解LLM评估

FoldMoE: Efficient Long Sequence MoE Training via Attention-MoE Pipelining

ACLCCF-A推荐 2025-01-01

FoldMoE 提出一种将注意力计算与混合专家模块流水线并行的训练策略,专门针对长序列场景优化 MoE 模型的训练效率。该方法显著降低显存占用和计算延迟,使得大规模 MoE 模型处理长文本更为可行。

MoE长序列流水线并行训练效率注意力机制大模型

LongReward: Improving Long-context Large Language Models with AI Feedback

ACLCCF-A推荐 2025-01-01

LongReward 引入 AI 反馈信号来改进长上下文大语言模型,通过自动生成奖励优化模型在长文本任务上的对齐效果。该方法不依赖昂贵人工标注,即可增强模型的长程推理与指令遵循能力,对构建实用长上下文助手具有参考意义。

长上下文AI反馈大语言模型奖励机制对齐推理

UTBoost: Rigorous Evaluation of Coding Agents on SWE-Bench

ACLCCF-A推荐 2025-01-01

UTBoost 框架旨在对 SWE-Bench 上的编码智能体进行更严密的评估,通过增强评估协议来防止作弊和评估失真。该工作提升了编码智能体评测的公平性与可信度,为软件工程自动化工具的迭代指明了更加可靠的方向。

编码Agent评估框架SWE-Bench软件工程严谨性

Fine-Tuning on Diverse Reasoning Chains Drives Within-Inference CoT Refinement in LLMs

ACLCCF-A推荐 2025-01-01

研究发现,在多样化推理链上进行微调,能够促使大语言模型在推理时主动修正和精炼自身的思维链,实现推理过程中的自优化。这一现象提升了复杂多步推理的准确率与鲁棒性,为增强 LLM 推理能力提供了高效的训练范式。

微调思维链推理自优化多样性大语言模型

Establishing Trustworthy LLM Evaluation via Shortcut Neuron Analysis

ACLCCF-A推荐 2025-01-01

该工作通过分析模型中的捷径神经元,识别大语言模型依赖虚假相关性进行推理的行为,从而建立更可信的评估方法。这有助于区分模型的表面模式匹配与真实理解能力,对构建鲁棒且可信赖的 LLM 评估体系具有重要意义。

可信评估捷径神经元虚假相关性解释性大语言模型鲁棒性

Do Large Language Models have an English Accent? Evaluating and Improving the Naturalness of Multilingual LLMs

ACLCCF-A推荐 2025-01-01

该工作评估多语言大语言模型生成文本的自然度,发现因训练数据偏向英语,其他语言输出常带有「英语口音」式的不自然。提出量化方法与改进策略,提升多语言生成的自然流畅度。对需要高质量多语言内容的从业者至关重要。

多语言大模型自然度评估语言偏向文本生成跨语言迁移

Enhancing Character-Level Understanding in LLMs through Token Internal Structure Learning

ACLCCF-A推荐 2025-01-01

通过显式学习词元内部的字符结构信息,增强大语言模型对拼写、字形等字符级特征的理解。该方法能改善字符敏感任务的表现,如拼写纠错与生僻词处理。为需要细粒度文本理解的场景提供了有效的训练思路。

大模型字符级理解词元化内部结构学习拼写子词

Conformity in Large Language Models

ACLCCF-A推荐 2025-01-01

系统性研究大语言模型在对话中的从众倾向,揭示模型可能为迎合用户而放弃自身知识或判断。分析了从众行为的成因与影响,提醒从业者在部署时需防范模型输出受误导意见扭曲。

大模型从众性认知偏差安全对齐可靠性用户交互

Confidence v.s. Critique: A Decomposition of Self-Correction Capability for LLMs

ACLCCF-A推荐 2025-01-01

将大模型的自我纠正能力解耦为「置信度评估」与「批判性修正」两个维度。通过分解分析,揭示了模型自纠正有效性的条件与局限。有助于从业者设计更可靠的自我反思与修正流程。

大模型自我纠正置信度批判性反思元认知

Visual Evidence Prompting Mitigates Hallucinations in Large Vision-Language Models

ACLCCF-A推荐 2025-01-01

提出视觉证据提示技术,通过提取并呈现图像中的关键视觉线索来指引模型回答,有效抑制多模态幻觉。该方法不改变模型结构,易于集成,提升了视觉问答的忠实度与可靠性。

多模态大视觉语言模型幻觉缓解视觉证据提示工程可靠性

Leveraging Dual Process Theory in Language Agent Framework for Real-time Simultaneous Human-AI Collaboration

ACLCCF-A推荐 2025-01-01

提出一种语言代理框架,将双重过程理论融入实时人机协作,使AI能同时处理快速直觉响应与慢速深度推理。核心贡献在于模拟人类双系统认知,提升协作流畅性与实时性。对构建上下文感知、动态交替的对话代理具有实践启发。

人机协作语言代理双重过程理论实时交互认知架构

TokAlign: Efficient Vocabulary Adaptation via Token Alignment

ACLCCF-A推荐 2025-01-01

提出TokAlign方法,通过对齐令牌实现高效词表自适应,在不改变模型结构的情况下扩展或转换语言模型词表。核心亮点是保持模型性能同时显著降低训练成本。为大模型多语言迁移和领域适配提供轻量方案。

词表适配令牌对齐大模型模型微调多语言

AdaEdit: Advancing Continuous Knowledge Editing For Large Language Models

ACLCCF-A推荐 2025-01-01

提出AdaEdit框架,实现大语言模型的持续知识编辑,能顺序注入新知识而不遗忘旧知识。核心贡献在于克服传统编辑的灾难性干扰,支持动态知识更新。对需要持续学习的智能应用至关重要。

知识编辑大模型持续学习模型更新灾难性遗忘

The Impact of Token Granularity on the Predictive Power of Language Model Surprisal

ACLCCF-A推荐 2025-01-01

研究令牌粒度对语言模型预测力的影响,比较不同分词方案下模型困惑度的表现。核心发现揭示了粒度选择如何改变信息度量,影响下游评估。为理解模型语言建模机制和分词策略选择提供实证依据。

令牌粒度语言模型困惑度分词评估分析

HALoGEN: Fantastic LLM Hallucinations and Where to Find Them

ACLCCF-A推荐 2025-01-01

提出HALoGEN框架,用于系统性发现和分类大语言模型的各种幻觉现象。核心贡献是构建幻觉多样性基准,助力理解幻觉来源。为幻觉检测和缓解研究提供重要诊断工具。

幻觉检测大模型基准构建模型安全幻觉分类

TARGA: Targeted Synthetic Data Generation for Practical Reasoning over Structured Data

ACLCCF-A推荐 2025-01-01

TARGA 提出一种定向合成数据生成方法,用于增强结构化数据上的实际推理能力。通过针对性地生成面向具体推理任务的数据,模型能够在表格、知识图谱等结构化场景中表现更佳。这为数据稀缺的推理任务提供了高效的数据增强方案,助力企业级问答和数据分析系统。

合成数据生成结构化数据推理定向生成数据增强表格推理

Curiosity-Driven Reinforcement Learning from Human Feedback

ACL引用量 18CCF-A推荐 2025-01-01

该工作将好奇心驱动的内在奖励引入 RLHF,以缓解人类反馈对齐导致的输出多样性下降问题。通过鼓励模型探索新颖输出,在保持与人类偏好对齐的同时显著提升生成多样性,对需要兼顾对齐质量与内容丰富度的对话和创作类应用具有实用意义。

RLHF强化学习好奇心驱动大模型对齐生成多样性内在奖励
📖 阅读⬇ PDF

EvoWiki: Evaluating LLMs on Evolving Knowledge

ACLCCF-A推荐 2025-01-01

EvoWiki 构建了一个面向不断演化知识的评测基准,用于检验大模型在知识更新、过时与冲突情形下的表现。它揭示了模型在跟踪动态事实方面的局限,对评估和改进检索增强、知识更新策略的从业者提供了重要的衡量工具。

大模型评测基准动态知识知识更新检索增强事实性

Rethinking Repetition Problems of LLMs in Code Generation

ACLCCF-A推荐 2025-01-01

该研究重新审视大模型在代码生成中的重复问题,剖析重复产生的成因并提出相应的检测与缓解思路。对依赖大模型做代码补全和生成的开发工具而言,理解并抑制循环式重复输出能直接提升生成代码的可用性与质量。

大模型代码生成重复问题解码策略代码补全生成质量

PunchBench: Benchmarking MLLMs in Multimodal Punchline Comprehension

ACLCCF-A推荐 2025-01-01

PunchBench 提出一个评测多模态大模型理解图文笑点(punchline)能力的基准,考察模型对幽默、反转等深层语义的把握。它暴露了现有 MLLM 在高阶多模态理解上的不足,为推动模型从表面识别走向语义与情感理解提供了评测抓手。

多模态多模态大模型评测基准幽默理解图文理解语义推理

BELLE: A Bi-Level Multi-Agent Reasoning Framework for Multi-Hop Question Answering

ACLCCF-A推荐 2025-01-01

BELLE 提出一个双层多智能体推理框架来处理多跳问答,将问题分解与协同推理交由不同层级的智能体分工完成。通过结构化的多智能体协作提升复杂推理链的准确性,对构建需要多步检索与推理的问答系统的从业者具有借鉴价值。

Agent多智能体多跳问答推理问答系统任务分解

AdamMeme: Adaptively Probe the Reasoning Capacity of Multimodal Large Language Models on Harmfulness

ACLCCF-A推荐 2025-01-01

AdamMeme 提出一种自适应探测方法,动态生成并迭代挑战样本来评估多模态大模型在有害内容(如恶意表情包)上的推理与识别能力。相比静态基准,它能更全面地暴露模型在内容安全上的盲点,对从事多模态安全与内容审核的从业者尤为重要。

多模态多模态大模型内容安全有害内容检测评测表情包

An Efficient and Precise Training Data Construction Framework for Process-supervised Reward Model in Mathematical Reasoning

ACLCCF-A推荐 2025-01-01

提出一套面向数学推理过程监督奖励模型(PRM)的高效且精确的训练数据构建框架。其核心在于自动化生成步骤级标注,缓解了人工标注昂贵、噪声大的痛点。对从业者而言,这能以更低成本获得高质量过程监督信号,提升推理模型的训练效果。

过程监督奖励模型数学推理训练数据构建步骤级标注大模型

SurveyPilot: an Agentic Framework for Automated Human Opinion Collection from Social Media

ACLCCF-A推荐 2025-01-01

SurveyPilot 是一个用于从社交媒体自动收集人类观点的智能体框架。它通过 Agent 流程模拟问卷调查,自动抓取并归纳真实用户意见,替代部分人工调研。对从业者而言,它为大规模、低成本的舆情与观点采集提供了可复用的自动化范式。

Agent社交媒体观点采集问卷自动化大模型

Sharper and Faster mean Better: Towards More Efficient Vision-Language Model for Hour-scale Long Video Understanding

ACLCCF-A推荐 2025-01-01

针对小时级超长视频理解,提出更高效的视觉语言模型方案,强调以更锐利、更快速的方式建模长时序信息。其亮点在于在保持精度的同时显著降低长视频处理的计算开销。对从业者而言,这为长视频问答与检索等场景提供了可落地的效率优化路径。

视觉语言模型长视频理解多模态推理优化效率

Auto-Arena: Automating LLM Evaluations with Agent Peer Battles and Committee Discussions

ACLCCF-A推荐 2025-01-01

Auto-Arena 通过让多个 LLM 智能体进行同行对战并组织委员会讨论,自动化完成对大模型的评测。其核心贡献是减少对人工评判和静态基准的依赖,提升评测的可扩展性与公允性。对从业者而言,它提供了一种低成本、可持续更新的模型排名与评估方案。

大模型评测Agent同行对战自动化评估LLM-as-judge

PTQ1.61: Push the Real Limit of Extremely Low-Bit Post-Training Quantization Methods for Large Language Models

ACLCCF-A推荐 2025-01-01

PTQ1.61 探索大模型极低比特训练后量化的真实极限,将平均权重压缩推进到约 1.61 比特。其亮点在于在如此激进的低比特下仍尽量保持模型性能。对从业者而言,这显著降低了大模型的显存与存储占用,利于边缘与低成本部署。

训练后量化低比特量化大模型显存优化模型压缩

Sparse Latents Steer Retrieval-Augmented Generation

ACLCCF-A推荐 2025-01-01

提出用稀疏潜变量来引导检索增强生成(RAG)的行为。通过在隐空间中识别并调控少量关键方向,可控地影响模型对检索内容的使用方式。对从业者而言,这为提升 RAG 的可控性与可解释性提供了一种轻量化的干预手段。

检索增强稀疏潜变量可控生成可解释性大模型

SafeRAG: Benchmarking Security in Retrieval-Augmented Generation of Large Language Model

ACLCCF-A推荐 2025-01-01

SafeRAG 构建了一个面向检索增强生成安全性的基准测试。它系统评估 RAG 系统在面对投毒、注入等攻击时的脆弱性与防御表现。对从业者而言,它为衡量与加固 RAG 应用的安全可靠性提供了标准化评测工具。

检索增强安全基准对抗攻击数据投毒大模型

Revisiting the Test-Time Scaling of o1-like Models: Do they Truly Possess Test-Time Scaling Capabilities?

ACLCCF-A推荐 2025-01-01

重新审视 o1 类模型的测试时扩展(test-time scaling)能力,质疑它们是否真正具备随推理算力增加而稳定提升的特性。其贡献在于通过实证分析揭示现有测试时扩展的局限与边界。对从业者而言,这有助于更理性地评估长思维链推理的实际收益与投入产出比。

测试时扩展推理优化o1类模型长思维链大模型

Multimodal Pragmatic Jailbreak on Text-to-image Models

ACLCCF-A推荐 2025-01-01

该研究提出针对文生图模型的「多模态语用越狱」攻击,利用文本与图像组合在语用层面诱导模型生成有害内容,即便单独的文本或图像看似无害。研究构建了相应基准并揭示主流文生图系统的安全盲区。对从业者而言,它表明仅靠单模态过滤不足以防御,安全对齐需考虑跨模态的语境含义。

多模态文生图越狱攻击AI安全内容安全对齐

Principled Understanding of Generalization for Generative Transformer Models in Arithmetic Reasoning Tasks

ACLCCF-A推荐 2025-01-01

该工作从理论与原理层面剖析生成式 Transformer 在算术推理任务中的泛化能力,解释模型为何能或不能外推到训练分布之外的数字与位数。它给出了关于位置编码、表示方式与泛化边界的系统性理解。对从业者而言,这为提升大模型数学与符号推理的可靠性提供了设计指引。

大模型算术推理泛化能力Transformer位置编码可解释性

Benchmarking Open-ended Audio Dialogue Understanding for Large Audio-Language Models

ACLCCF-A推荐 2025-01-01

该研究面向大型音频语言模型,构建了开放式音频对话理解的评测基准,考察模型在真实语音交互中理解语义、情感与上下文的能力。它填补了音频对话场景缺乏开放式评测的空白。对从业者而言,这为语音助手与音频大模型的能力诊断和迭代提供了标准化标尺。

音频语言模型多模态对话理解评测基准语音交互大模型

from Benign import Toxic: Jailbreaking the Language Model via Adversarial Metaphors

ACLCCF-A推荐 2025-01-01

该论文提出「对抗性隐喻」越狱方法,通过将有害意图包裹进看似良性的隐喻表达,诱导语言模型从无害输入推导出有毒输出。方法揭示了模型在语义隐含层面的安全脆弱性。对从业者而言,它提示安全防护需覆盖修辞与隐喻等隐蔽攻击路径,而非仅匹配显式有害词。

越狱攻击大模型AI安全对抗攻击隐喻内容安全

MorphMark: Flexible Adaptive Watermarking for Large Language Models

ACLCCF-A推荐 2025-01-01

MorphMark 提出一种面向大模型的灵活自适应水印方法,可根据上下文动态调整水印强度,在文本质量与水印可检测性之间取得更好平衡。它解决了固定强度水印在低熵文本上损害质量的问题。对从业者而言,这为大模型生成内容的溯源与版权保护提供了更实用的方案。

大模型水印内容溯源文本生成自适应版权保护

A Silver Bullet or a Compromise for Full Attention? A Comprehensive Study of Gist Token-based Context Compression

ACLCCF-A推荐 2025-01-01

该研究系统评估了基于 Gist Token 的上下文压缩方法,探讨其能否在大幅压缩上下文的同时逼近全注意力的效果。研究通过全面实验揭示了此类压缩的收益、适用场景与性能折损。对从业者而言,它为在长上下文推理中权衡显存、速度与质量提供了实证依据。

大模型上下文压缩长上下文注意力机制KV-cache推理优化

On the Limit of Language Models as Planning Formalizers

ACLCCF-A推荐 2025-01-01

该工作探究语言模型作为「规划形式化器」的能力极限,即把自然语言任务翻译为 PDDL 等形式化规划表示再交由求解器执行。研究分析了模型在复杂规划问题上的失败模式与边界。对从业者而言,它为构建结合大模型与符号求解器的混合 Agent 规划系统提供了现实预期与改进方向。

大模型任务规划Agent形式化PDDL神经符号

Learning to Generate Structured Output with Schema Reinforcement Learning

ACLCCF-A推荐 2025-01-01

该研究提出「Schema 强化学习」方法,通过强化学习训练模型生成严格符合指定 Schema 的结构化输出,提升 JSON 等格式的有效性与字段准确率。它将格式约束转化为可优化的奖励信号。对从业者而言,这显著改善了大模型在工具调用与结构化数据生成场景中的可靠性。

大模型结构化输出强化学习JSON工具调用格式约束

Improve Safety Training of Large Language Models with Safety-Critical Singular Vectors Localization

ACLCCF-A推荐 2025-01-01

提出通过定位「安全关键奇异向量」来改进大模型的安全训练方法。研究在权重矩阵的奇异值分解空间中识别出对安全行为起决定性作用的少量奇异向量,并据此做有针对性的安全微调。亮点在于把安全能力精确归因到模型参数的特定子空间,让从业者能以更低代价、更少副作用地强化安全对齐,同时减少对通用能力的损害。

大模型安全对齐奇异值分解安全微调可解释性参数定位

WarriorCoder: Learning from Expert Battles to Augment Code Large Language Models

ACLCCF-A推荐 2025-01-01

WarriorCoder 让多个代码大模型像专家一样相互「对战」,从胜负中自动生成高质量训练数据来增强代码能力。其核心是无需依赖现有数据集或人工标注,通过模型间擂台竞争挖掘各自长处并蒸馏整合。对从业者而言,提供了一条低成本、可自我进化的代码模型数据合成与能力提升路径。

代码大模型数据合成模型对战知识蒸馏代码生成自进化

Quantification of Large Language Model Distillation

ACLCCF-A推荐 2025-01-01

针对大模型「蒸馏」现象提出了量化方法,用以评估一个模型在多大程度上是从其他模型蒸馏而来。论文设计指标刻画蒸馏程度及其带来的同质化与鲁棒性下降问题。对从业者重要在于:可用于检测模型抄近路、评估训练独立性,并警示过度蒸馏对模型多样性与可靠性的负面影响。

大模型知识蒸馏量化评估模型同质化模型溯源鲁棒性

Pandora's Box or Aladdin's Lamp: A Comprehensive Analysis Revealing the Role of RAG Noise in Large Language Models

ACLCCF-A推荐 2025-01-01

系统分析了检索增强生成(RAG)中「噪声」对大模型的双面作用,既可能是潘多拉魔盒也可能是阿拉丁神灯。研究对不同类型的检索噪声进行分类并量化其正负影响,发现某些噪声反而有助于提升表现。对从业者的价值在于指导如何筛选与利用检索内容,从而设计更稳健的 RAG 系统。

检索增强RAG噪声分析大模型检索质量鲁棒性

Stepwise Reasoning Disruption Attack of LLMs

ACLCCF-A推荐 2025-01-01

提出一种针对大模型链式推理的「逐步推理破坏」攻击,通过在中间推理步骤注入扰动来误导模型最终结论。研究揭示了思维链推理在中间环节的脆弱性,即便单步被干扰也会级联放大错误。对从业者重要在于警示推理型模型的安全风险,并为构建更鲁棒的推理防御机制提供依据。

大模型链式推理对抗攻击推理安全思维链鲁棒性

Crowd Comparative Reasoning: Unlocking Comprehensive Evaluations for LLM-as-a-Judge

ACLCCF-A推荐 2025-01-01

提出「群体比较推理」方法来增强大模型作为评判者(LLM-as-a-Judge)的评估能力。其核心是引入多视角的比较式推理,模拟群体评审对候选答案两两或多方对比,从而得到更全面可靠的评判。对从业者而言,可显著提升自动评测的准确性与一致性,降低单一评判者的偏差。

大模型LLM评判自动评测比较推理评估方法群体智慧

Lost in Multilinguality: Dissecting Cross-lingual Factual Inconsistency in Transformer Language Models

ACLCCF-A推荐 2025-01-01

剖析了 Transformer 语言模型在多语言场景下的跨语言事实不一致问题,即同一事实在不同语言下给出矛盾答案。论文从模型内部机制定位事实知识在多语言间无法对齐的根源。对从业者重要在于揭示多语言模型的可靠性短板,并为改进跨语言知识一致性提供方向。

多语言大模型事实一致性跨语言可解释性知识对齐

GradOT: Training-free Gradient-preserving Offsite-tuning for Large Language Models

ACLCCF-A推荐 2025-01-01

提出 GradOT,一种无需训练、保持梯度的异地微调(Offsite-tuning)方法,用于在不泄露完整模型的前提下让用户侧适配大模型。其亮点是通过梯度保持的压缩与变换,兼顾模型隐私与下游微调效果。对从业者而言,为模型所有者与数据持有方之间的安全协作微调提供了高效且隐私友好的方案。

大模型异地微调隐私保护免训练梯度保持模型适配

Knowledge Boundary of Large Language Models: A Survey

ACLCCF-A推荐 2025-01-01

这是一篇关于大语言模型「知识边界」的综述,系统梳理了模型已知与未知之间的界限问题,对相关概念、分类体系、检测方法与缓解策略进行了归纳整理。它帮助从业者理解模型何时会产生幻觉或过度自信,并为提升模型可靠性与可信度提供研究地图。

大模型知识边界幻觉综述可信AI

Mitigating Visual Forgetting via Take-along Visual Conditioning for Multi-modal Long CoT Reasoning

ACLCCF-A推荐 2025-01-01

该工作针对多模态长链式推理中「视觉遗忘」问题,提出「随身视觉条件」(Take-along Visual Conditioning)方法,在推理过程中不断把视觉信息重新注入,避免模型在长推理链中逐渐丢失对图像内容的关注。这对构建稳定的多模态推理系统、提升视觉问答与视觉推理准确性具有实践价值。

多模态长链推理视觉遗忘视觉问答CoT

MoC: Mixtures of Text Chunking Learners for Retrieval-Augmented Generation System

ACLCCF-A推荐 2025-01-01

MoC 提出面向检索增强生成(RAG)的「文本分块学习器混合」方法,用可学习、可组合的多分块器替代固定规则切分,根据文本特点动态选择合适的分块策略。更优的分块能显著提升检索质量与最终回答效果,对搭建高质量 RAG 系统的工程师很有参考意义。

检索增强RAG文本分块混合专家检索质量

Dually Self-Improved Counterfactual Data Augmentation Using Large Language Model

ACLCCF-A推荐 2025-01-01

该研究提出一种基于大模型的「双向自我提升反事实数据增强」方法,让模型自动生成并迭代优化反事实样本,从而扩充训练数据并增强模型的鲁棒性与泛化能力。对缺乏高质量标注数据、希望降低数据偏见的从业者提供了低成本的数据扩充思路。

数据增强反事实大模型自我提升鲁棒性

RPO: Retrieval Preference Optimization for Robust Retrieval-Augmented Generation

ACLCCF-A推荐 2025-01-01

RPO(检索偏好优化)提出一种新的训练目标,使模型在检索增强生成中更稳健,能判断何时信任检索内容、何时依赖自身知识,缓解检索噪声带来的错误。它提升了 RAG 在含噪或不相关检索结果下的可靠性,对部署生产级 RAG 应用很关键。

检索增强RAG偏好优化鲁棒性噪声鲁棒

Geometric Signatures of Compositionality Across a Language Model's Lifetime

ACLCCF-A推荐 2025-01-01

该论文从几何视角研究语言模型在整个训练「生命周期」中如何表征组合性(compositionality),揭示组合语义在模型隐空间中留下的几何特征及其随训练演化的规律。这为理解模型如何习得组合泛化能力、解释其内部机理提供了新的分析工具。

可解释性组合性表征几何训练动态语言模型

YuLan-Mini: Pushing the Limits of Open Data-efficient Language Model

ACLCCF-A推荐 2025-01-01

YuLan-Mini 是一个强调「数据高效」的开源小型语言模型,在有限算力与数据条件下通过精细的训练方法与开放数据逼近更强性能。它为资源受限场景下训练高性价比模型、以及可复现的开源研究提供了实用范例。

开源模型小模型数据高效预训练可复现

Bridging the Language Gaps in Large Language Models with Inference-Time Cross-Lingual Intervention

ACLCCF-A推荐 2025-01-01

该工作提出「推理时跨语言干预」方法,在不重新训练的前提下,于推理阶段对模型内部表示进行干预,弥合大模型在不同语言间的能力差距,提升低资源语言的表现。对需要支持多语言、尤其是小语种应用的从业者具有直接价值。

多语言跨语言推理时干预低资源语言大模型

Plug-in and Fine-tuning: Bridging the Gap between Small Language Models and Large Language Models

ACLCCF-A推荐 2025-01-01

该工作提出「即插即用+微调」框架,旨在弥合小语言模型与大语言模型之间的能力差距。通过将小模型作为可插拔模块与大模型协同,并辅以针对性微调,在保持低成本的同时提升下游表现。对从业者而言,这提供了一条在算力受限场景下复用小模型、逼近大模型效果的实用路径。

大模型小模型微调即插即用模型协同

Enhancing Transformers for Generalizable First-Order Logical Entailment

ACLCCF-A推荐 2025-01-01

研究如何增强 Transformer 在一阶逻辑蕴含上的可泛化推理能力,关注模型对未见过的逻辑结构进行正确推断的能力。核心贡献在于改进架构或训练方式,使其在组合性与分布外的逻辑推理上更稳健。对需要严谨符号推理的从业者而言,有助于构建更可靠的逻辑推断系统。

Transformer逻辑推理一阶逻辑泛化能力符号推理

Self-Taught Agentic Long Context Understanding

ACLCCF-A推荐 2025-01-01

提出自学式(self-taught)的智能体长上下文理解方法,让模型通过自我生成与训练数据来提升对长文本的处理与理解能力。亮点在于以 Agent 方式自主迭代、减少对人工标注长上下文样本的依赖。对从业者而言,为长文档问答与长上下文应用提供了低标注成本的增强方案。

长上下文Agent自监督长文本理解数据合成

Hallucination Detox: Sensitivity Dropout (SenD) for Large Language Model Training

ACLCCF-A推荐 2025-01-01

提出敏感度丢弃(Sensitivity Dropout,SenD)训练方法,用于在大模型训练阶段抑制幻觉。通过识别并丢弃对输出高度敏感、易引发不稳定的成分,提升生成事实可靠性。对从业者而言,这是一种可在训练侧降低幻觉、增强模型可信度的实用正则化手段。

大模型幻觉抑制Dropout模型训练可信度

OS-Genesis: Automating GUI Agent Trajectory Construction via Reverse Task Synthesis

ACLCCF-A推荐 2025-01-01

OS-Genesis 通过「反向任务合成」自动构建 GUI 智能体的操作轨迹数据:先在界面中探索交互,再反推出对应任务与轨迹,从而生成高质量训练样本。亮点是摆脱对人工标注轨迹的依赖,大幅扩展 GUI Agent 的训练数据。对从业者而言,为构建图形界面自动化智能体提供了高效的数据生产方案。

GUI Agent轨迹合成数据自动化界面自动化Agent训练

CORAL: Learning Consistent Representations across Multi-step Training with Lighter Speculative Drafter

ACLCCF-A推荐 2025-01-01

CORAL 面向推测解码(speculative decoding),通过在多步训练中学习一致的表示,并采用更轻量的推测起草模型(drafter),在保持加速效果的同时降低草稿模型开销。亮点在于跨训练步表示一致性与轻量化设计的结合。对从业者而言,有助于以更低成本实现大模型推理加速。

推理优化推测解码表示学习推理加速轻量化模型

GUI-explorer: Autonomous Exploration and Mining of Transition-aware Knowledge for GUI Agent

ACLCCF-A推荐 2025-01-01

GUI-explorer 让 GUI 智能体自主探索界面,挖掘具有「状态转移感知」的知识,理解操作前后界面状态的变化规律。亮点是无需人工先验即可自动积累可迁移的交互知识,提升智能体在陌生界面中的决策能力。对从业者而言,为构建自适应、低人工干预的 GUI 自动化智能体提供了新思路。

GUI Agent自主探索知识挖掘状态转移界面自动化

P$^2$ Law: Scaling Law for Post-Training After Model Pruning

ACLCCF-A推荐 2025-01-01

提出 P² 定律,刻画模型剪枝后再进行后训练(post-training)的扩展规律,揭示后训练效果与模型规模、剪枝程度等因素的定量关系。亮点在于为「剪枝+恢复训练」提供可预测的缩放法则指导。对从业者而言,可据此预估剪枝模型恢复性能所需的训练投入,优化压缩与训练资源分配。

模型剪枝扩展定律后训练模型压缩缩放法则

Lost in the Context: Insufficient and Distracted Attention to Contexts in Preference Modeling

ACLCCF-A推荐 2025-01-01

该工作针对偏好建模中模型对上下文「注意力不足且易被干扰」的问题展开研究,揭示了奖励模型在处理上下文时关注度稀薄、易被无关信息分散的缺陷,并提出相应的诊断与改进思路。对从业者而言,它点明了RLHF奖励建模阶段一个被忽视的薄弱环节,有助于提升对齐质量与偏好判别的可靠性。

偏好建模奖励模型RLHF注意力机制对齐大模型

Enhancing Multimodal Continual Instruction Tuning with BranchLoRA

ACLCCF-A推荐 2025-01-01

提出BranchLoRA方法用于多模态持续指令微调,通过分支化的低秩适配结构在不断学习新任务时缓解灾难性遗忘并提升参数效率。对从业者而言,它给出了在多模态大模型上做增量学习的轻量化方案,可在有限算力下持续扩展模型能力而不重训。

多模态持续学习指令微调LoRA灾难性遗忘参数高效微调

Towards Effective and Efficient Continual Pre-training of Large Language Models

ACLCCF-A推荐 2025-01-01

该研究面向大语言模型的持续预训练,探索如何在引入新数据时兼顾效果与效率,平衡新知识获取与旧能力保持。对从业者而言,它为在已有基座模型上低成本注入领域或时效数据提供了方法参考,避免从零预训练的高昂代价。

大模型持续预训练效率优化领域适配灾难性遗忘

X-TURING: Towards an Enhanced and Efficient Turing Test for Long-Term Dialogue Agents

ACLCCF-A推荐 2025-01-01

X-TURING提出了一种增强且高效的图灵测试框架,专门用于评估长期对话智能体在长程交互中的拟人化与一致性表现。对从业者而言,它填补了长期对话Agent缺乏可靠评测基准的空白,有助于衡量记忆、人设连贯与对话质量。

对话Agent图灵测试长期对话评测基准拟人化

Modality-Aware Neuron Pruning for Unlearning in Multimodal Large Language Models

ACLCCF-A推荐 2025-01-01

提出面向多模态大模型「遗忘学习」的模态感知神经元剪枝方法,通过定位并裁剪与待遗忘知识相关的特定模态神经元来实现可控遗忘。对从业者而言,它为多模态场景下的隐私合规与有害知识移除提供了精细化、低损伤的技术手段。

多模态遗忘学习神经元剪枝隐私保护大模型

ReLearn: Unlearning via Learning for Large Language Models

ACLCCF-A推荐 2025-01-01

ReLearn提出「以学促忘」的范式,通过引入新的学习目标而非单纯抑制来实现大语言模型的知识遗忘,在删除目标信息的同时更好地保持模型整体能力与流畅度。对从业者而言,它缓解了传统遗忘方法导致模型性能崩坏的问题,更适合实际部署中的合规性需求。

遗忘学习大模型隐私保护知识编辑模型对齐

UAlign: Leveraging Uncertainty Estimations for Factuality Alignment on Large Language Models

ACLCCF-A推荐 2025-01-01

UAlign利用不确定性估计来进行大语言模型的事实性对齐,通过量化模型对自身回答的置信度来引导其更准确地表达已知与未知,从而减少幻觉。对从业者而言,它提供了一条借助不确定性信号提升事实可靠性、抑制编造的对齐路径。

不确定性估计事实性对齐幻觉抑制大模型模型校准

HoH: A Dynamic Benchmark for Evaluating the Impact of Outdated Information on Retrieval-Augmented Generation

ACLCCF-A推荐 2025-01-01

HoH构建了一个动态基准,用于评估过时信息对检索增强生成(RAG)的影响,揭示了当检索到陈旧或失效内容时模型输出准确性受到的损害。对从业者而言,它指出了RAG系统中知识时效性这一关键风险,并为构建抗过时信息干扰的检索流程提供了评测工具。

检索增强RAG评测基准信息时效性幻觉

Uncertainty Propagation on LLM Agent

ACLCCF-A推荐 2025-01-01

该研究探讨在 LLM 智能体(Agent)的多步推理与工具调用链路中如何对不确定性进行建模与传播。核心贡献是把单步预测的置信度沿决策链路逐步累积、追踪,从而量化最终输出的可靠性。对从业者而言,这有助于在 Agent 工作流中识别高风险环节、设置可信度阈值与人工介入点。

大模型Agent不确定性量化可信度多步推理

Beyond Position: the emergence of wavelet-like properties in Transformers

ACLCCF-A推荐 2025-01-01

论文发现 Transformer 在训练后会自发涌现出类似小波(wavelet)的特性,即模型在不同尺度上同时编码位置与频率信息,超越了传统位置编码的视角。核心亮点是从信号处理角度重新解释注意力机制对序列结构的捕捉方式。对从业者而言,这为设计更高效的位置表示和长序列建模提供了新的理论依据。

Transformer位置编码小波可解释性长序列建模

Are the Hidden States Hiding Something? Testing the Limits of Factuality-Encoding Capabilities in LLMs

ACLCCF-A推荐 2025-01-01

该工作系统性地测试 LLM 隐藏状态中是否真正编码了事实性信息,探究依靠内部表征判断真假陈述能力的边界。核心发现是隐藏状态的事实编码能力存在明显局限,并非可靠的真实性探针。对从业者而言,这提醒不要过度依赖探针(probing)方法做幻觉或事实性检测。

大模型事实性隐藏状态探针分析幻觉检测

Disentangling Biased Knowledge from Reasoning in Large Language Models via Machine Unlearning

ACLCCF-A推荐 2025-01-01

论文提出借助机器遗忘(Machine Unlearning)将模型中的偏见知识从推理能力中剥离,在删除有偏内容的同时尽量保留正常推理表现。核心贡献是把去偏问题转化为定向遗忘任务,实现知识与推理的解耦。对从业者而言,这提供了一条在不全量重训的前提下缓解模型偏见的可行路径。

大模型机器遗忘去偏推理知识编辑

HD-NDEs: Neural Differential Equations for Hallucination Detection in LLMs

ACLCCF-A推荐 2025-01-01

HD-NDEs 提出用神经微分方程(Neural Differential Equations)对 LLM 隐藏状态的连续演化轨迹建模,以此检测幻觉。核心亮点是把离散的逐层/逐 token 表征视为连续动力系统,从轨迹动态中捕捉异常信号。对从业者而言,这为幻觉检测提供了比静态探针更细粒度、更具动态视角的工具。

大模型幻觉检测神经微分方程隐藏状态动力系统

NeuSym-RAG: Hybrid Neural Symbolic Retrieval with Multiview Structuring for PDF Question Answering

ACLCCF-A推荐 2025-01-01

NeuSym-RAG 是一种面向 PDF 问答的混合神经-符号检索框架,结合多视角结构化(文本、表格、版面等)来增强证据召回。核心贡献是把神经向量检索与符号化结构查询融合,提升对复杂文档的精准定位能力。对从业者而言,这对构建处理科研论文、报告等结构化 PDF 的 RAG 系统很有参考价值。

检索增强RAG神经符号PDF问答多视角结构化

CoT-based Synthesizer: Enhancing LLM Performance through Answer Synthesis

ACLCCF-A推荐 2025-01-01

该工作提出基于思维链(CoT)的合成器,将多个候选答案或多次推理结果综合成更优的最终答案。核心亮点是用一个专门的合成步骤聚合并校正不同推理路径,从而提升整体性能。对从业者而言,这是一种无需重训、在推理阶段即可提升 LLM 输出质量的实用策略。

大模型思维链答案合成推理优化集成

Assessing Dialect Fairness and Robustness of Large Language Models in Reasoning Tasks

ACLCCF-A推荐 2025-01-01

论文评估 LLM 在推理任务中对方言(如非标准英语变体)的公平性与鲁棒性,揭示模型在不同方言输入下表现存在差距。核心贡献是量化方言偏差并指出其对推理准确率的负面影响。对从业者而言,这强调了在部署面向多样化用户群体的应用时需关注语言公平性与稳健性。

大模型方言公平性鲁棒性推理偏见评估

Adaptive Retrieval Without Self-Knowledge? Bringing Uncertainty Back Home

ACLCCF-A推荐 2025-01-01

该研究探讨自适应检索增强(RAG)中何时触发检索的核心问题,主张把「不确定性」重新作为判断依据,而非单纯依赖模型的自我认知能力。其贡献在于揭示自我认知信号不可靠,转而用不确定性估计来决定是否检索。对从业者而言,这能在保证答案质量的同时减少不必要的检索调用,降低成本与延迟。

检索增强自适应检索不确定性估计大模型RAG

Evaluating Language Models as Synthetic Data Generators

ACLCCF-A推荐 2025-01-01

该工作系统评估了语言模型作为合成数据生成器的能力,比较不同模型在生成训练数据时的质量与效果差异。核心贡献是建立了一套针对合成数据生成能力的评测框架与结论。对从业者而言,这为在数据稀缺场景下选择合适模型来造数提供了实证参考。

合成数据数据生成大模型模型评测数据增强

Can Graph Descriptive Order Affect Solving Graph Problems with LLMs?

ACLCCF-A推荐 2025-01-01

该研究考察图结构问题的描述顺序是否会影响大模型求解图论问题的表现,揭示输入呈现方式对推理结果的敏感性。其贡献在于指出描述顺序这一被忽视的提示因素会显著左右模型表现。对从业者而言,提醒在用大模型处理结构化推理任务时需关注输入排布与提示工程。

大模型图问题推理提示工程鲁棒性

GIFT-SW: Gaussian noise Injected Fine-Tuning of Salient Weights for LLMs

ACLCCF-A推荐 2025-01-01

GIFT-SW 提出对大模型中的显著权重注入高斯噪声进行微调的方法,只针对关键权重做带噪训练以提升效率与鲁棒性。核心亮点是聚焦显著权重并用噪声注入实现参数高效微调。对从业者而言,这提供了一种在降低训练开销的同时保持甚至增强模型表现的微调思路。

微调参数高效微调显著权重噪声注入大模型

Unsolvable Problem Detection: Robust Understanding Evaluation for Large Multimodal Models

ACLCCF-A推荐 2025-01-01

该工作提出「不可解问题检测」任务,用于评测大型多模态模型在面对无法回答的问题时能否稳健识别并拒答,而非强行编造。核心贡献是构建了考验模型自知与鲁棒理解能力的新评测基准。对从业者而言,这有助于衡量多模态模型在真实部署中的可靠性与幻觉抑制能力。

多模态大模型评测鲁棒性幻觉拒答

AlignMMBench: Evaluating Chinese Multimodal Alignment in Large Vision-Language Models

ACLCCF-A推荐 2025-01-01

AlignMMBench 是面向中文场景的多模态对齐评测基准,专门评估大型视觉语言模型在中文环境下与人类意图的对齐程度。核心贡献是填补了中文多模态对齐评测的空白并提供系统化测试集。对从业者而言,这为开发与选型中文视觉语言模型提供了关键的本土化评测工具。

多模态视觉语言模型中文评测模型对齐评测基准

TLCR: Token-Level Continuous Reward for Fine-grained Reinforcement Learning from Human Feedback

ACL引用量 43CCF-A推荐 2024-07-01

TLCR 针对 RLHF 中偏好标签只在序列级标注、奖励信号过于粗粒度的问题,提出词元级连续奖励:训练判别器为每个 token 给出正负偏好的连续置信度作为细粒度奖励。该方法在指令对齐与生成质量上优于序列级奖励基线,帮助从业者更精准地定位并优化生成中的好坏片段。

RLHF词元级奖励细粒度对齐奖励建模语言模型
📖 阅读⬇ PDF

An Empirical Study on Parameter-Efficient Fine-Tuning for MultiModal Large Language Models

ACL引用量 42CCF-A推荐 2024-06-01

这是一项关于多模态大模型(MLLM)参数高效微调的系统性实证研究:在统一框架下对比 LoRA、Adapter、Prompt 等多种 PEFT 方法在不同模块、连接器与数据规模下的表现。研究给出了哪种方法适配哪类场景的经验结论,为多模态模型在有限算力下的高效微调提供了实践参考。

多模态大模型参数高效微调实证研究LoRAAdapter
📖 阅读⬇ PDF

Layer-Condensed KV Cache for Efficient Inference of Large Language Models

ACL引用量 59CCF-A推荐 2024-05-01

Layer-Condensed KV Cache 通过将多个连续的Transformer层共享同一组 KV 缓存,大幅削减缓存冗余,从而降低汇总内存占用。该方法在标准模型上仅需少量微调即可适配,实现了几近无损的推理质量与显著的内存节约。对于追求高吞吐、低成本部署大语言模型的工程团队,它提供了一种简单有效的层间复用范式,直接减少显存瓶颈。

层浓缩KV缓存跨层共享显存优化大语言模型推理缓存复用高效部署
📖 阅读⬇ PDF

DoRA: Enhancing Parameter-Efficient Fine-Tuning with Dynamic Rank Distribution

ACL引用量 56CCF-A推荐 2024-05-01

DoRA 针对 LoRA 各层固定秩、参数预算分配不合理的问题,提出动态秩分布:将增量矩阵拆为多个秩一组件并引入重要性评分,剪枝低贡献组件以把秩预算自适应地分配给更需要的层。在相同参数量下取得更优效果,帮助从业者更高效地利用有限的微调预算。

参数高效微调动态秩分配LoRA结构剪枝重要性评分
📖 阅读⬇ PDF

AFLoRA: Adaptive Freezing of Low Rank Adaptation in Parameter Efficient Fine-Tuning of Large Models

ACL引用量 23CCF-A推荐 2024-03-01

AFLoRA 提出一种自适应冻结的低秩适配方法:在 LoRA 的低秩分支训练过程中,依据可学习的冻结指标逐步冻结那些已趋于稳定的投影矩阵,从而进一步减少可训练参数与计算开销。它在保持甚至提升下游精度的同时降低了微调成本,对需要在有限资源下高效微调大模型的从业者很有价值。

大模型参数高效微调LoRA低秩适配自适应冻结显存优化
📖 阅读⬇ PDF

ChunkAttention: Efficient Self-Attention with Prefix-Aware KV Cache and Two-Phase Partition

ACL引用量 95CCF-A推荐 2024-02-01

提出ChunkAttention,一种面向多租户大模型服务的高效自注意力机制,引入前缀感知KV缓存和两阶段划分来减少长序列推理的计算与显存开销。该方法能显著降低长文本场景下的延迟,为LLM在线推理部署提供重要的优化思路。

自注意力优化KV缓存大模型推理长序列处理多租户服务两阶段划分
📖 阅读⬇ PDF

Mini-Ensemble Low-Rank Adapters for Parameter-Efficient Fine-Tuning

ACL引用量 21CCF-A推荐 2024-02-01

论文提出 Mini-Ensemble 低秩适配器(MELoRA):用多个更小的低秩适配器构成的迷你集成来替代单个 LoRA,在保持总体可训练参数量很低的同时获得更高的等效秩与更强的表达能力。它以几乎不增加成本的方式提升了 PEFT 的精度,为追求性价比的微调实践提供了新选择。

大模型参数高效微调LoRA集成学习低秩适配微调
📖 阅读⬇ PDF

Parameter-Efficient Fine-Tuning without Introducing New Latency

ACL引用量 82CCF-A推荐 2023-05-01

提出一种在推理阶段不引入额外延迟的参数高效微调(PEFT)方法,通过设计可在部署时与原始权重融合的适配模块,使微调后的模型推理速度与原始预训练模型完全一致。其核心贡献在于解决了多数PEFT方法(如Adapter)会增加前向计算开销的痛点。对从业者而言,这意味着可在不牺牲在线服务延迟的前提下享受PEFT的省参优势。

大模型参数高效微调PEFT推理延迟Adapter部署优化
📖 阅读⬇ PDF

LoRAPrune: Structured Pruning Meets Low-Rank Parameter-Efficient Fine-Tuning

ACL引用量 88CCF-A推荐 2023-05-01

LoRAPrune将结构化剪枝与低秩适配(LoRA)相结合,提出基于LoRA梯度的重要性评估准则,在微调的同时对LLaMA、T5等大模型进行高效剪枝。其亮点是无需对完整权重计算梯度即可完成剪枝,大幅降低剪枝所需的显存与算力。对从业者而言,可在低成本微调流程中同步获得更小、更快的模型。

大模型结构化剪枝LoRA参数高效微调模型压缩显存优化
📖 阅读⬇ PDF

AutoPEFT: Automatic Configuration Search for Parameter-Efficient Fine-Tuning

ACL引用量 59CCF-A推荐 2023-01-01

AutoPEFT提出对参数高效微调进行自动化配置搜索,借助贝叶斯优化等手段在多种PEFT模块及其超参的组合空间中自动寻优,免去人工调参。其亮点是以较低搜索成本找到性能与参数量更优平衡的配置。对从业者而言,降低了为不同下游任务挑选最佳PEFT方案的门槛。

参数高效微调PEFT自动化搜索超参优化贝叶斯优化NLP微调
📖 阅读⬇ PDF

BitFit: Simple Parameter-efficient Fine-tuning for Transformer-based Masked Language-models

ACL引用量 1769CCF-A推荐 2021-06-01

BitFit提出一种极简稀疏微调方法,仅更新Transformer模型中的偏置项(bias)而冻结其余全部参数,在中小规模数据上即可达到接近全量微调的效果。其贡献是以极少的可训练参数揭示了偏置项在适配下游任务中的关键作用。对从业者而言,提供了一个实现简单、存储开销极低的微调基线。

BitFit参数高效微调稀疏微调偏置项Transformer掩码语言模型
📖 阅读⬇ PDF

Apple 33 条

BalCapRL: A Balanced Framework for RL-Based MLLM Image Captioning

arXiv 2026-05-01

提出了「BalCapRL」平衡框架,将强化学习应用于多模态大模型的图像字幕生成任务,解决多目标优化中的不平衡问题。通过引入奖励平衡策略,提升了字幕质量与多样性,对MLLM下游任务开发者有参考意义。

多模态大模型图像字幕强化学习平衡框架奖励设计
📖 阅读⬇ PDF

RVPO: Risk-Sensitive Alignment via Variance Regularization

arXiv 2026-05-01

提出了「RVPO」风险敏感对齐方法,利用方差正则化处理多目标奖励聚合中的约束忽视问题。该方法在保持奖励均值的同时降低高风险波动,为RLHF安全对齐提供了新工具。

强化学习对齐RLHF风险敏感方差正则化多目标优化安全对齐
📖 阅读⬇ PDF

Mapping the Design Space of User Experience for Computer Use Agents

arXiv 2026-03-03

该论文系统梳理了基于大模型的「电脑操作智能体」(computer use agent)的用户体验设计空间,聚焦用户对这类代理的交互期望与偏好。核心贡献是绘制出一张完整的设计空间图谱,为从业者打造更贴合用户需求的 Agent 交互界面提供指引。

Computer UseAgent用户体验交互设计大模型设计空间
📖 阅读⬇ PDF

Entropy-Preserving Reinforcement Learning

arXiv 2026-03-01

提出了熵保持强化学习算法,在策略梯度更新中显式维持策略熵,避免过早收敛。该方法提升了语言模型推理中的探索多样性,对强化学习驱动的推理改进有直接帮助。

强化学习策略梯度熵正则化探索语言模型推理多样性
📖 阅读⬇ PDF

Exclusive Self Attention

arXiv 2026-03-01

提出专属自注意力机制(XSA),通过约束注意力范围改进Transformer序列建模性能。这是一种简单的注意力修改,能直接提升模型效果。从业者可低成本替换标准自注意力以增强模型能力。

自注意力机制Transformer序列建模注意力约束模型改进
📖 阅读⬇ PDF

EncQA: Benchmarking Vision-Language Models on Visual Encodings for Charts

IEEE Transactions on Visualization and Computer Graphics 2025-11-20

提出 EncQA 基准,专门评估视觉语言模型在图表「视觉编码」上的理解与推理能力。研究发现当前模型在图表理解上的进步并未覆盖所需视觉推理的完整广度,存在明显短板。对从业者而言,它揭示了现有图表理解基准的局限,可指导未来模型在视觉推理方向的针对性改进。

视觉语言模型图表理解视觉编码评测基准视觉推理多模态
📖 阅读⬇ PDF

Policy Maps: Tools for Guiding the Unbounded Space of LLM Behaviors

arXiv 2025-09-27

提出「政策地图」(Policy Maps)工具,把抽象的AI政策边界映射到大语言模型的具体行为空间,用以引导其几乎无界的行为可能性。它为定义和评估LLM行为的可接受范围提供了系统性方法,对AI安全与治理实践具有重要价值。

大模型AI安全AI治理行为评估对齐
📖 阅读⬇ PDF

Scaling Synthetic Task Generation for Agents via Exploration

arXiv 2025-09-01

提出通过探索自动缩放合成任务生成的方法,用于后训练多模态大语言模型(MLLM)构建交互代理。核心贡献在于利用探索机制生成多样化训练任务,降低人工标注成本,提升代理能力。对从业者而言,有助于更高效地训练和扩展智能体应用。

多模态大模型智能体任务生成探索后训练合成数据
📖 阅读⬇ PDF

BED-LLM: Intelligent Information Gathering with LLMs and Bayesian Experimental Design

arXiv 2025-08-01

提出基于贝叶斯实验设计框架(BED-LLM)的通用方法,增强大语言模型(LLM)从用户或外部来源智能、自适应收集信息的能力。该工作将贝叶斯最优实验设计与LLM推理相结合,提升信息获取效率。对从业者重要,可应用于对话系统、问答和主动学习等场景。

大语言模型贝叶斯实验设计信息收集自适应人机交互
📖 阅读⬇ PDF

Language Models Improve When Pretraining Data Matches Target Tasks

arXiv 2025-07-01

研究预训练数据与目标任务匹配对语言模型性能的影响,指出数据选择方法隐含目标且常通过基准迭代形成。核心贡献是验证当预训练数据分布接近下游任务时模型提升显著。对从业者重要,指导更高效的数据选择策略以减少训练成本。

大语言模型预训练数据数据选择目标匹配基准迭代
📖 阅读⬇ PDF

Apple Intelligence Foundation Language Models: Tech Report 2025

arXiv 2025-07-01

Apple发布两个多语言多模态基础语言模型,驱动Apple Intelligence功能:一个30亿参数的设备端模型针对Apple Silicon优化,另一个更大模型用于云端。核心亮点是兼顾性能与隐私,实现设备端高效推理。对从业者重要,展示了大公司在边缘部署与多模态融合的最新实践。

大语言模型多模态设备端模型Apple Intelligence多语言基础模型
📖 阅读⬇ PDF

Distillation Scaling Laws

arXiv 2025-02-01

提出蒸馏缩放定律(Distillation Scaling Laws),预测给定计算预算及学生-教师分配下的蒸馏模型性能。为合理分配训练资源、降低蒸馏风险提供理论指导。

知识蒸馏缩放定律计算预算学生-教师模型性能预测
📖 阅读⬇ PDF

STIV: Scalable Text and Image Conditioned Video Generation

arXiv 2024-12-01

本文提出STIV,一种可扩展的文本和图像条件视频生成框架。核心贡献在于提供清晰、系统的配方来构建稳健的视频生成模型。对从业者而言,该框架有助于更高效地开发高保真、条件可控的视频生成系统。

视频生成扩散模型文本条件图像条件可扩展
📖 阅读⬇ PDF

Do LLMs "know" internally when they follow instructions?

arXiv 2024-10-01

探索大语言模型在指令遵循过程中内部表征是否感知到自身行为,通过分析模型内部状态揭示其自我意识程度。理解这种内在机制有助于构建更可靠、可解释的AI Agent。

大语言模型指令遵循内部表征可解释性AI Agent
📖 阅读⬇ PDF

Apple Intelligence Foundation Language Models

arXiv 2024-07-01

苹果发布了用于 Apple Intelligence 的基础语言模型,包括一个约 30 亿参数的设备端模型和一个大型服务器模型。核心贡献是实现了设备端高效运行,非常适合移动端部署。这对从业者展示了在移动设备上部署大语言模型的可行性和优化方向。

大模型设备端推理苹果高效部署移动端语言模型
📖 阅读⬇ PDF

arXiv 10 条

End-to-End Context Compression at Scale

arXiv 2026-06-01

本文提出一种端到端上下文压缩方法,解决长上下文语言模型推理中KV缓存随上下文长度线性增长带来的内存瓶颈。相较于现有压缩技术常导致模型质量明显下降,该方法能在不损失性能的前提下实现大规模压缩,对部署高效长上下文推理服务至关重要。

大模型推理KV缓存压缩上下文压缩内存优化长上下文端到端
📖 阅读⬇ PDF

Learning, Fast and Slow: Towards LLMs That Adapt Continually

arXiv 2026-05-01

本文探讨大模型通过参数更新(如RL)适应下游任务时出现的灾难性遗忘问题,提出借鉴「快思考与慢思考」的双系统机制,让模型既能快速吸收新任务又能保留旧知识。核心贡献在于设计了持续适应框架,可能结合记忆回放或动态模块,对需长期部署和持续学习的模型有重要参考价值。

大模型持续学习灾难性遗忘快速慢速学习参数更新适应性
📖 阅读⬇ PDF

Unlocking the Working Memory of Large Language Models for Latent Reasoning

arXiv 2026-05-01

该研究提出利用大语言模型的工作记忆进行潜在推理,无需显式生成中间token即可完成推理过程,从而解耦推理与自回归生成。这一方法提升了推理效率,为测试时计算扩展提供了新范式,有助于从业者降低推理延迟与计算成本。

大模型潜在推理工作记忆测试时计算推理优化Chain-of-Thought替代
📖 阅读⬇ PDF

GFT: From Imitation to Reward Fine-Tuning with Unbiased Group Advantages and Dynamic Coefficient Rectification

arXiv 2026-04-01

本文提出GFT方法,统一监督微调(SFT)与强化学习(RL),通过无偏组优势估计和动态系数校正实现从模仿到奖励的平滑过渡,解决知识注入与泛化能力的平衡问题。核心贡献在于设计了无偏的组优势函数,避免优势估计偏差,并动态调整SFT与RL损失系数,提升训练稳定性。对从业者而言,该方法为高效融合SFT和RL提供了一个实用框架,有望在对话、推理等应用中兼顾准确性与创造性。

大模型后训练强化学习监督微调奖励微调组优势估计动态系数校正
📖 阅读⬇ PDF

XSkill: Continual Learning from Experience and Skills in Multimodal Agents

arXiv 2026-03-01

本论文提出XSkill方法,让多模态智能体通过持续学习从经验和技能中提升,解决开放场景下工具使用低效和编排不灵活的问题。核心贡献在于实现智能体的自适应技能积累与灵活任务编排。对从业者而言,该工作有助于构建更高效、更鲁棒的多模态自主agent系统。

多模态智能体持续学习工具使用技能编排经验学习开放场景
📖 阅读⬇ PDF

Memento-Skills: Let Agents Design Agents

arXiv 2026-03-01

提出Memento-Skills,一个通用且可持续学习的LLM智能体系统,充当「智能体设计智能体」。它能自主构建、适配并改进面向特定任务的技能智能体,实现技能的动态演化。此举显著降低人工设计多智能体的成本,为构建自适应、自我进化的AI应用提供了关键范式。

智能体设计LLM Agent持续学习任务技能自适应系统自主构建
📖 阅读⬇ PDF

SkillsBench: Benchmarking How Well Agent Skills Work Across Diverse Tasks

arXiv 2026-02-01

本文提出 SkillsBench,一个用于衡量大语言模型代理技能(Agent Skills)跨不同任务有效性的基准。核心贡献是首个标准化评估方法,解决了现有缺乏统一衡量标准的问题。对从业者而言,该基准有助于选择与改进代理技能,提升推理时增强效果。

基准测试Agent技能大语言模型推理时增强评估方法任务泛化
📖 阅读⬇ PDF

Router Upcycling: Leveraging Mixture-of-Routers in Mixture-of-Experts Upcycling

arXiv 2025-09-01

提出「路由器升级」(Router Upcycling)方法,在混合专家模型升级过程中引入混合路由器机制,以提升训练效率和任务性能。核心贡献在于通过改进路由器设计,使升级后的MoE模型能更灵活分配资源,对从业者而言可降低大模型训练成本并提升效果。

混合专家模型路由器优化模型升级训练效率深度学习
📖 阅读⬇ PDF

AWS 7 条

Introducing Web Search on Amazon Bedrock AgentCore

动态 2026-06-19Agent

亚马逊 Bedrock AgentCore 的 Web Search 功能正式可用(GA),让开发者用几行代码为智能体接入网页搜索能力。对在 AWS 上构建 Agent、需要联网检索工具的从业者有实用价值。

Agent网页搜索AWSBedrock检索增强云服务

Accelerate campaign workflow with insights from Adobe Marketing Agent for Amazon Quick

动态 2026-06-19Agent

亚马逊展示如何通过「MCP」协议把 Adobe 营销 Agent 接入 Amazon Quick,配置后即可获取受众排名、忠诚度分群、旅程使用与冲突建议等营销洞察。对探索 MCP 驱动跨厂商 Agent 集成的团队,这是一个具体的落地示例。

MCP协议Agent集成营销智能AdobeAmazon Quick

Amazon Bedrock AgentCore harness is now generally available: Go from idea to production-grade agent in minutes

动态 2026-06-18Agent

亚马逊『Bedrock AgentCore Runtime』正式商用,仅需『CreateHarness』与『InvokeHarness』两个 API 即可在数秒内拉起一个智能体;该智能体运行在带文件系统与 shell 的隔离环境中,支持跨会话记忆、技能加载、网页浏览,并通过 gateway 或『MCP』调用工具。对 Agent 落地与生产化部署有较高价值。

AgentBedrock生产部署MCP跨会话记忆工具调用

Amazon SageMaker AI Async Inference now supports inline request payloads

动态 2026-06-17推理优化

AWS 宣布 SageMaker AI 异步推理支持内联请求负载:可直接在「InvokeEndpointAsync」请求体中携带推理数据,免去每次调用前先把输入上传到 S3 的步骤。对在 SageMaker 上做异步推理的工程师,这简化了调用链路、降低了延迟与复杂度。

Amazon SageMaker异步推理内联请求推理优化调用简化云服务

Get back hours every day with autonomous agents in Amazon Quick

动态 2026-06-17Agent

AWS 在 Amazon Quick 中推出可持续自主工作的智能体、帮助排定优先级的活动信息流,以及跨所有数据源一问即得洞察的能力。对关注企业级 Agent 落地的读者,这体现了云厂商把自主智能体嵌入办公数据场景的方向。

自主智能体Amazon Quick企业 Agent办公数据智能体落地跨数据源洞察

Context intelligence for your data and AI agents at scale

动态 2026-06-17Agent

AWS 提出面向数据与 AI 智能体的规模化「上下文智能」:把散落在数据湖、数仓、湖仓、数据库与流中的上下文乃至未成文的机构知识,安全地提供给智能体以支撑可信决策。对做企业 Agent 的团队,这点明了上下文供给是可信决策的前提。

上下文智能数据智能体可信决策企业数据湖仓一体知识供给

DeepSeek 17 条

DeepSeek-V3 Technical Report

DeepSeek 2024-12-27

提出DeepSeek-V3,671B总参数的Mixture-of-Experts语言模型,每个token仅激活37B参数,实现高效推理和低成本训练。对从业者而言,它在保持高性能的同时大幅降低部署成本,适合大规模模型落地。

Mixture-of-Experts大语言模型671B参数高效推理低成本训练稀疏激活
📖 阅读⬇ PDF

DeepSeekMoE: Towards Ultimate Expert Specialization in Mixture-of-Experts Language Models

DeepSeek 2024-01-11

提出 DeepSeekMoE 架构,旨在通过更精细的专家专业化来提升混合专家(MoE)语言模型的性能,同时控制计算成本。核心贡献在于设计了一种新的路由和专家分配策略,使每个专家更专注特定知识领域,为从业者提供了更高效率的模型扩展方案。

MoE架构专家专业化大模型计算成本模型扩展
📖 阅读⬇ PDF

DeepSeek LLM: Scaling Open-Source Language Models with Longtermism

DeepSeek 2024-01-05

探索开源大语言模型的缩放定律,并强调「长期主义」视角下的模型开发策略。研究发现现有缩放结论存在不一致,通过系统性实验为开源社区提供了更可靠的缩放指导,帮助从业者在模型规模与性能间做出最优权衡。

开源大模型缩放定律长期主义语言模型性能优化
📖 阅读⬇ PDF

EMNLP 7 条

PARA: Parameter-Efficient Fine-tuning with Prompt-Aware Representation Adjustment

EMNLP引用量 9CCF-B推荐 2025-02-01

PARA 提出一种提示感知的表示调整方法,在每个 Transformer 模块内嵌入轻量向量生成器,根据输入提示动态产生调整向量来引导隐藏表示。相比 LoRA,它兼顾推理效率与效果,且不像软提示那样占用输入序列长度,对追求低开销定制化的工业部署很有价值。

参数高效微调提示感知表示调整LoRA大模型推理优化
📖 阅读⬇ PDF

LOOK-M: Look-Once Optimization in KV Cache for Efficient Multimodal Long-Context Inference

EMNLP引用量 100CCF-B推荐 2024-06-01

LOOK-M 针对多模态大语言模型长上下文推理中 KV 缓存膨胀问题,提出「只看一次」的优化策略,在推理前向阶段一次性完成多模态 KV 缓存的选择与剪枝。它避免了传统方法反复扫描缓存的开销,极大降低了多模态长上下文的显存和计算消耗。对于部署多模态对话、视频理解等长序列任务的团队,该方法能够显著提升推理效率和可扩展性。

多模态大语言模型KV缓存剪枝长上下文推理一次优化显存压缩多模态推理
📖 阅读⬇ PDF

Democratizing Large Language Models via Personalized Parameter-Efficient Fine-tuning

EMNLP引用量 94CCF-B推荐 2024-02-01

该研究面向大模型个性化,提出基于参数高效微调的个性化方案,为每个用户学习轻量的专属参数,使模型的交互、内容与推荐贴合个人偏好,同时避免为每位用户全量微调的高昂成本。它为在隐私与算力受限条件下规模化提供个性化 LLM 服务给出了可行路径。

大模型参数高效微调个性化用户偏好推荐LoRA
📖 阅读⬇ PDF

Loose lips sink ships: Mitigating Length Bias in Reinforcement Learning from Human Feedback

EMNLP引用量 89CCF-B推荐 2023-10-01

本文聚焦RLHF中的长度偏置问题,即模型倾向于生成更长回答以骗取更高奖励,并提出相应的缓解机制。它揭示并抑制了奖励模型对回答长度的虚假偏好,使对齐更贴合真实质量。对从业者而言,这能减少冗长输出、提升奖励信号的可靠性。

大模型RLHF长度偏置奖励模型对齐奖励欺骗
📖 阅读⬇ PDF

Okapi: Instruction-tuned Large Language Models in Multiple Languages with Reinforcement Learning from Human Feedback

EMNLP引用量 243CCF-B推荐 2023-07-01

Okapi通过RLHF构建多语言指令微调的大模型,将对齐能力从英语扩展到多种语言。它提供了多语言的指令数据与反馈资源,提升非英语场景下的指令遵循能力。对从业者而言,这为开发面向全球用户的多语言对齐模型提供了基础资源与方案。

大模型多语言指令微调RLHF对齐跨语言
📖 阅读⬇ PDF

LLM-Adapters: An Adapter Family for Parameter-Efficient Fine-Tuning of Large Language Models

EMNLP引用量 482CCF-B推荐 2023-04-01

LLM-Adapters构建了一个面向大模型参数高效微调的适配器框架家族,集成了多种PEFT方法并支持在开源LLM上便捷使用,作为GPT-4、ChatGPT等闭源模型的低成本平替方案。其贡献在于提供统一、易用的工具库与系统性对比实验。对从业者而言,可快速在开源模型上试验和落地多种PEFT技术。

大模型参数高效微调Adapter开源框架PEFT微调
📖 阅读⬇ PDF

Google 80 条

Accelerating Speculative Diffusions via Block Verification

Google Research 2026-06-11

提出「块验证」机制来加速推测性解码:草稿模型批量生成 token,再用接受-拒绝采样在块级别校验,保证输出与目标模型分布严格一致。在不牺牲生成质量的前提下提升 LLM 推理吞吐,对需要低延迟、高并发部署大模型的工程团队有直接落地价值。

大模型推理优化推测解码推测采样部署加速
📖 阅读⬇ PDF

Private Learning with Public Feature Conditioning

arXiv 2026-06-01

研究包含公开非敏感特征的差分隐私(DP)回归问题,这类场景常见于推荐和广告系统。论文提出以公开特征作为条件(public feature conditioning)来改进私有学习,利用非敏感信息降低隐私噪声带来的精度损失,对在隐私约束下构建推荐与广告模型的从业者具有实践意义。

差分隐私隐私保护学习回归推荐系统广告系统公开特征
📖 阅读⬇ PDF

RubricsTree: Scalable and Evolving Open-Ended Evaluation of Personal Health Agents across Health Memory and Medical Skills

arXiv 2026-06-01

提出RubricsTree评估框架,用于可扩展且不断演进的开放端评测,衡量基于LLM的个人健康代理在健康记忆与医学技能方面的表现。该框架支持多维度、动态更新的评价标准,对部署医疗对话系统的团队具有重要参考价值,可帮助确保代理的可靠性。

个人健康代理评估框架LLM医疗技能可扩展性开放端评测
📖 阅读⬇ PDF

Do Agents Need Semantic Metadata? A Comparative Study in Agentic Data Retrieval

arXiv 2026-05-27

通过对比研究探讨自主智能体在数据检索中是否需要语义元数据(如schema.org)的支持,实证评估其对检索效率与准确性的影响。研究强调了机器可操作数据对数据驱动工作流的重要性,为从业者设计自主数据系统提供了关键决策依据。

智能体数据检索语义元数据schema.org对比研究数据系统
📖 阅读⬇ PDF

How Well Do Models Follow Their Constitutions?

Google DeepMind 2026-05-22

评估前沿AI模型遵循详细书面行为规范(如Anthropic的Constitution和OpenAI的Model Spec)的能力,并探讨后训练阶段集成这些规范的效果。研究系统性地衡量模型对齐程度并揭示现有规范在实际执行中的局限,帮助从业者理解规范设计的有效性并指导对齐技术改进。

AI对齐模型规范Constitution后训练前沿模型可信AI
📖 阅读⬇ PDF

100x Cost & Latency Reduction: Performance Analysis of AI Query Approximation using Lightweight Proxy Models: [Experiments & Analysis]

Proceedings of the ACM on Management of Data 2026-05-18

提出用轻量级代理模型近似LLM在SQL中的AI查询评估,实现约100倍的成本与延迟下降。核心贡献是以小模型替代大模型完成查询打分,大幅提升效率。对从业者而言,可显著降低AI查询的部署成本与响应延迟。

大模型推理优化代理模型成本优化延迟优化数据库查询
📖 阅读⬇ PDF

Finer is Better (with the Right Scaling)

arXiv 2026-05-08

本文研究微缩放量化中块大小对 LLM 量化质量的影响,发现配合恰当缩放策略时,更细的块大小能显著降低量化误差。这一结论揭示了块粒度与缩放的协同关系。对从业者而言,为在压缩率与模型性能之间权衡量化参数提供了明确指导。

大模型量化微缩放块大小模型压缩
📖 阅读⬇ PDF

Challenges and Research Directions for Large Language Model Inference Hardware

ComputerGoogle DeepMind 2026-05-01

本文剖析大语言模型推理面临的挑战,指出 Transformer 自回归解码使推理与训练在本质上不同,并梳理了相应的硬件设计研究方向。其价值在于把推理瓶颈与硬件需求对应起来。对从业者而言,有助于提升推理效率并降低部署成本。

大模型推理优化硬件设计自回归解码Transformer
📖 阅读⬇ PDF

Agentic Coding Needs Proactivity, Not Just Autonomy

arXiv 2026-05-01

编码智能体正从内联补全向自主编辑仓库、提交PR等演进,但论文指出仅靠自主性不够,还需主动性。核心贡献是强调主动性在智能编码中的关键作用,提醒从业者构建更有效编码助手时必须考虑主动推理能力。

编码智能体主动性自主系统软件开发AI助手
📖 阅读⬇ PDF

How LLMs Detect and Correct Their Own Errors: The Role of Internal Confidence Signals

Google DeepMind 2026-04-24

本文研究大型语言模型如何利用内部置信信号在无外部反馈的情况下检测并纠正自身错误。核心发现是二阶置信信号在自我纠错中起关键作用,为理解模型内在可靠性提供了新视角。对从业者而言,这有助于设计更鲁棒的模型或借助其自纠错能力提升应用安全性。

大模型自我纠错置信信号模型可靠性可解释性
📖 阅读⬇ PDF

An Agentic Approach to Metadata Reasoning

arXiv 2026-04-22

提出一种基于 LLM 驱动智能体的元数据推理方法,重点解决多步任务中数据源发现的瓶颈。该方法通过自主代理集成多个数据集,提升对数据相关性的自动推理能力。对构建更高效的数据发现与集成系统具有实践价值。

Agent大模型元数据推理数据发现数据集成
📖 阅读⬇ PDF

Agentic AI for Personalized Physiotherapy: A Multi-Agent Framework for Generative Video Training and Real-Time Pose Correction

arXiv 2026-04-22

提出一种用于个性化物理治疗的多智能体 AI 框架,借助生成式 AI 创建定制训练视频,并实时纠正患者姿势。其核心贡献是解决家庭理疗缺乏个性化监督与动态反馈、依从性差的问题。对康复从业者而言,可自动化提供专业级指导,降低对人工监督的依赖。

Agent生成式AI多智能体姿态识别医疗康复视频生成
📖 阅读⬇ PDF

GroupDPO: Memory efficient Group-wise Direct Preference Optimization

Google DeepMind 2026-04-17

GroupDPO提出内存高效的组别直接偏好优化方法,可利用每个提示下的多个正负偏好对进行训练,大幅降低显存占用。它显著提升了偏好优化的数据利用效率。对需要对齐大语言模型的从业者具有重要实用价值。

大模型偏好优化DPO对齐显存优化微调
📖 阅读⬇ PDF

Logical Robots: Declarative Multi-Agent Programming in Logica

arXiv 2026-04-08

提出 Logical Robots 平台,使用逻辑编程语言 Logica 以声明式方式定义多智能体机器人行为,并支持交互式仿真。其核心亮点是把声明式编程引入多智能体机器人系统,让复杂行为的设计与验证更简洁、更可解释。对从业者而言,这提供了一种比命令式代码更直观、更易推理的机器人编程范式。

多智能体机器人逻辑编程声明式编程仿真
📖 阅读⬇ PDF

Generative UI: LLMs are Effective UI Generators

Google Research 2026-04-01

验证LLM可作为有效的UI生成器,突破传统静态输出限制。提出生成式UI概念,LLM能动态生成交互界面。对前端开发和人机交互从业者,开辟利用LLM直接生成UI的新方向。

生成式UILLM界面生成交互设计前端自动化
📖 阅读⬇ PDF

SeekerGym: A Benchmark for Reliable Information Seeking

Google DeepMind 2026-04-01

提出SeekerGym基准,专门评估AI代理在信息寻求任务中的可靠性和可信度。针对深度研究代理等场景,衡量其搜索相关、准确信息的能力。对构建可信AI代理的从业者,提供标准化评估工具。

基准测试信息寻求AI代理可信度检索评估
📖 阅读⬇ PDF

Distributional Alignment Games for Answer-Level Fine-Tuning

arXiv 2026-04-01

提出答案级别微调(ALFT)方法,通过分布对齐游戏优化语言模型在最终答案层面的正确性,避免了中间监督的复杂性。对从业者而言,提供了一种更直接、高效的模型微调范式,尤其适用于需要确保输出准确性的应用场景。

答案级别微调分布对齐语言模型优化微调策略模型训练
📖 阅读⬇ PDF

Next-Token Prediction and Regret Minimization

Google DeepMind 2026-03-30

该论文从理论上研究了如何在对抗性在线决策环境中应用下一个 token 预测算法,建立了将语言模型预训练与在线学习中遗憾最小化(regret minimization)相联系的框架。其贡献在于揭示自回归预测与在线学习的内在关联。对从业者而言,有助于理解语言模型在动态环境下的行为并设计更鲁棒的决策算法。

下一token预测在线学习遗憾最小化对抗环境语言模型理论决策算法
📖 阅读⬇ PDF

Optimizing Small Language Models for NL2SQL via Chain-of-Thought Fine-Tuning

arXiv 2026-03-24

该论文提出通过思维链(CoT)微调来优化小语言模型在 NL2SQL 任务上的表现,并证明小模型经 CoT 微调后可逼近大模型效果。其亮点是显著降低企业部署成本。对从业者而言,这意味着可在资源受限环境中高效实现自然语言转 SQL 的能力。

小语言模型NL2SQL思维链微调推理优化
📖 阅读⬇ PDF

Tool-MCoT: Tool Augmented Multimodal Chain-of-Thought for Content Safety Moderation

Google DeepMind 2026-03-15

Tool-MCoT 将工具增强与多模态思维链结合,用于内容安全审核,可处理多模态输入并在推理过程中调用外部工具辅助判断。核心贡献是把工具调用嵌入思维链以增强对复杂内容的分析能力。对从业者而言,该方法有望提升多模态内容审核的准确性与鲁棒性。

内容审核多模态思维链工具增强安全
📖 阅读⬇ PDF

Navig-AI-tion: Navigation by Contextual AI and Spatial Audio

arXiv 2026-03-01

提出结合上下文AI与空间音频的步行导航系统,解决纯音频导航中方向感迷失和环境信息缺失的问题。系统通过实时环境感知和空间音频反馈显著降低导航错误,对语音交互和辅助导航设计具有实用价值。

导航空间音频上下文AI步行导航人机交互
📖 阅读⬇ PDF

Reasoning-Driven Synthetic Data Generation and Evaluation

arXiv 2026-03-01

针对专业多模态模型训练数据稀缺问题,本文提出推理驱动的合成数据生成与评估方法,利用语言模型推理产生高质量标注。这为缓解数据困境提供了自动化途径,对需要定制多模态模型的从业者很有价值。

合成数据生成推理驱动多模态模型数据稀缺评估
📖 阅读⬇ PDF

A Theoretical Framework for Modular Learning of Robust Generative Models

Google Research 2026-02-19

提出了一个用于模块化学习鲁棒生成模型的理论框架,针对大规模生成模型训练资源密集、依赖启发式数据集加权的痛点。核心贡献是形式化了模块化训练大模型的可行性条件,给出理论保证。对从业者而言,这意味着更高效、更可控、更可组合的模型训练范式。

大模型生成模型模块化训练理论框架鲁棒性
📖 阅读⬇ PDF

LLM Scalability Risk for Agentic-AI and Model Supply Chain Security

Journal of Computer Information Systems 2026-02-17

探讨大语言模型在智能体AI与模型供应链中的可扩展性安全风险,指出大模型正双向重塑网络安全格局:既增强威胁检测、代码审查等防御能力,也催生新型攻击。对从业者的提醒是,必须同时防范模型供应链安全与自身可扩展性带来的双重风险。

大模型Agent供应链安全网络安全可扩展性
📖 阅读⬇ PDF

Leveraging ASIC AI Chips for Homomorphic Encryption

arXiv 2026-01-31

本文探讨利用专为AI设计的ASIC芯片来加速同态加密计算,核心贡献是提出一种将同态加密运算映射到ASIC AI芯片的方法,大幅降低计算开销。对从业者而言,这为在云服务中实现高效隐私计算提供了新的硬件加速路径。

同态加密ASIC芯片硬件加速隐私计算AI芯片
📖 阅读⬇ PDF

Dynamic Cogeneration of Bug Reproduction Test in Agentic Program Repair

arXiv 2026-01-27

该论文提出在智能体程序修复中动态共同生成Bug复现测试,将复现测试与补丁生成进行动态协同,以提升修复验证的准确性。核心价值在于增强自动修复系统的可靠性与效率。对软件工程从业者而言,这有助于优化自动化调试与修复流程。

Agent程序自动修复软件工程测试生成Bug复现代码智能体
📖 阅读⬇ PDF

The unreasonable effectiveness of pattern matching

arXiv 2026-01-16

该研究发现,即便把内容词随机替换为无意义字符串,大语言模型仍能理解语言模式,表明模型主要依赖上下文与语法结构而非词汇语义。这一「模式匹配出奇有效」的现象对理解 LLM 的鲁棒性与泛化机制具有重要意义。对于研究模型可解释性和泛化能力的从业者,提供了关于 LLM 真实工作机理的新证据。

大模型模式匹配可解释性泛化能力语言理解鲁棒性
📖 阅读⬇ PDF

Trellis: Learning to Compress Key-Value Memory in Attention Models

arXiv 2025-12-01

Transformer的注意力机制存在二次复杂度和KV缓存持续增长问题。本文提出Trellis新架构,通过学习压缩键值记忆,显著降低存储和计算开销。该工作对优化长序列推理、节省显存有直接工程价值。

TransformerKV-cache压缩注意力机制显存优化模型架构
📖 阅读⬇ PDF

Towards Cross-Modal Backward-Compatible Representation Learning for Vision-Language Models

Google DeepMind 2025-10-19

本文提出跨模态后向兼容表示学习方法,用于解决视觉语言模型升级换代时新旧嵌入向量不兼容、必须对海量数据重新建索引的高昂成本问题。核心贡献是让新模型产出的嵌入直接与旧模型对齐,无需重训旧模型或全量重索引即可平滑升级检索库。对运营大规模图文检索系统、需要频繁迭代模型的从业者尤为重要。

视觉语言模型后向兼容表示学习跨模态检索嵌入对齐
📖 阅读⬇ PDF

Attention Is All You Need

Google Research 2025-08-23

提出Transformer模型,完全基于注意力机制,摒弃循环与卷积结构,实现高效并行训练与更优性能。该架构成为后续大语言模型的基石。对从业者而言,它是理解和构建现代NLP及大模型系统的必备基础。

Transformer注意力机制大模型基础并行训练自然语言处理
📖 阅读⬇ PDF

Proximal Point Nash Learning from Human Feedback

Google DeepMind 2025-05-01

提出近端点纳什学习(PPN)从人类反馈中学习,避免传统RLHF对偏好结构的过度假设,提高对齐效果。对从业者:改进人类反馈强化学习方法,减少奖励模型偏差。

RLHF纳什学习人类反馈偏好建模对齐
📖 阅读⬇ PDF

Multi-Agent Design: Optimizing Agents with Better Prompts and Topologies

arXiv 2025-02-01

提出通过优化提示(prompts)和智能体拓扑结构来设计多智能体系统,使大语言模型在复杂任务中更高效地协作。核心贡献在于将提示设计和拓扑组织作为关键优化维度,对构建可扩展的多智能体应用具有直接指导意义。

多智能体提示优化拓扑设计大语言模型协作系统
📖 阅读⬇ PDF

Confidence Improves Self-Consistency in LLMs

arXiv 2025-02-01

提出利用置信度改进自一致性解码方法,在减少采样次数的同时保持推理准确性,显著降低计算开销。这一方法对需要在推理时平衡性能与成本的从业者尤为重要。

自一致性置信度推理优化大语言模型计算效率
📖 阅读⬇ PDF

Scaling Embedding Layers in Language Models

arXiv 2025-02-01

提出SCONE方法,通过可扩展的上下文感知N-gram嵌入层增强语言模型性能,同时避免解码阶段的计算增长。核心创新在于离线化与上下文结合,对模型架构优化具有实用价值。

嵌入层可扩展性语言模型模型架构SCONE
📖 阅读⬇ PDF

Privacy-preserved LLM Cascade via CoT-enhanced Policy Learning

arXiv 2024-10-01

提出一种隐私保护的LLM级联方法,通过链式思维增强的策略学习来优化端侧大模型的性能,同时保护用户隐私。对从业者而言,该方法在隐私约束下提供了一种平衡效率与效果的实用方案,适用于移动设备等场景。

隐私保护LLM级联链式思维策略学习端侧大模型
📖 阅读⬇ PDF

LoopTree: Exploring the Fused-Layer Dataflow Accelerator Design Space

IEEE transactions on circuits and systems for artificial int 2024-09-01

论文提出了LoopTree框架,系统探索融合层数据流加速器的设计空间,旨在最小化数据搬运带来的延迟与能耗。其价值在于为DNN硬件设计者提供了权衡计算与通信的高效搜索方法,显著提升能效比。

DNN加速器数据流融合层设计空间探索延迟优化能效
📖 阅读⬇ PDF

EmBARDiment: an Embodied AI Agent for Productivity in XR

arXiv 2024-08-01

构建了一个面向扩展现实(XR)设备的具身AI智能体,利用大语言模型实现全天候的生产力助手。不同于传统屏幕聊天机器人,它通过感知物理环境并提供主动服务,显著提升用户效率。

具身AIXR生产力智能体人机交互
📖 阅读⬇ PDF

Preliminary WMT24 Ranking of General MT Systems and LLMs

arXiv 2024-07-01

发布WMT24通用机器翻译系统的初步自动排名,比较通用MT系统与大型语言模型的表现;官方排名将基于人工评估,此排名仅供参考。对从业者了解当前翻译技术的相对水平有直接参考价值。

机器翻译WMT评测自动排名大语言模型通用MT系统
📖 阅读⬇ PDF

Scaling Up LLM Reviews for Google Ads Content Moderation

Google Research 2024-02-01

探讨如何扩展LLM以用于Google Ads内容审核,解决大规模数据集上的推理成本和延迟问题。核心贡献是提出实用策略降低开销而不牺牲审核质量。对从业者:可迁移到其他大规模内容审核系统。

内容审核LLM扩展推理成本延迟优化广告审核
📖 阅读⬇ PDF

How do Transformers perform In-Context Autoregressive Learning?

Google DeepMind 2024-02-01

理论分析Transformer实现上下文自回归学习的内在机制,解释其成功原因。核心贡献是揭示Transformer通过隐式构建参数化模型进行学习。对从业者:为设计更高效Transformer架构提供理论指导。

Transformer上下文学习自回归模型可解释性机制分析
📖 阅读⬇ PDF

HuggingFace 1 条

Patch release v5.10.4

动态 2026-06-19Infra

HF Transformers 发布补丁版 v5.10.4(pypi 上跳过了 5.10.3),修复多处回归、ProcessorMixin 的图像/视频/音频 token id 处理、InternVL 模型问题,并做了与 vLLM 同步的修复。对使用 Transformers 配合 vLLM 推理的开发者是实用维护更新。

TransformersvLLM推理优化多模态版本维护Bug修复

ICCV 2 条

Towards Higher Effective Rank in Parameter-Efficient Fine-Tuning Using Khatri-Rao Product

ICCV引用量 10CCF-A推荐 2025-08-01

针对 LoRA 低秩更新表达能力受限的问题,提出用 Khatri-Rao 积构造参数更新,从而在相近参数量下获得更高的有效秩。该方法以结构化乘积形式提升微调矩阵的表达能力,弥补低秩约束的不足。对从业者而言,这是一种在保持参数高效的前提下增强微调效果的新型 PEFT 设计。

参数高效微调LoRA有效秩KhatriRao积微调
📖 阅读⬇ PDF

AirCache: Activating Inter-Modal Relevancy KV Cache Compression for Efficient Large Vision-Language Model Inference

ICCV引用量 4CCF-A推荐 2025-03-01

针对大视觉语言模型推理中多模态 KV 缓存膨胀问题,AirCache 利用模态间相关性激活压缩策略,选择性保留高相关键值对。该方法在保持多模态理解性能的同时大幅降低缓存开销,推动视觉语言模型落地。

KV缓存压缩视觉语言模型多模态模态间相关性高效推理
📖 阅读⬇ PDF

ICLR 165 条

Multi-LCB: Extending LiveCodeBench to Multiple Programming Languages

ICLR 2026 2026-06-19基座

「Multi-LCB」将代码评测基准LiveCodeBench扩展至12种编程语言,在维持防污染和自动化评测协议的前提下,构建了首个多语言代码能力基准。该工作填补了大规模跨语言泛化评估的空白,帮助从业者更全面地诊断代码大模型的多语言生成质量。

多语言代码基准LiveCodeBench大模型评估跨语言泛化代码生成防污染
📖 阅读⬇ PDF

Decomposing LLM Computation with Jets

ICLR 2026-01-01

提出Jets方法,将大型语言模型的计算过程分解为可独立解释的功能性「喷流」,以解决训练后计算高度纠缠、难以模块化的问题。核心贡献在于实现了对LLM推理计算的精细化分解与可视化,使内部表征变得可编辑和可控。对于需要理解模型行为、进行安全对齐或模型编辑的从业者,该工作提供了实用的可解释性工具。

大模型可解释性计算分解模块化模型编辑表征分析LLM

Neuron-Aware Data Selection in Instruction Tuning for Large Language Models

ICLR 2026-01-01

针对指令微调中过多数据导致模型性能退化的问题,提出一种考虑神经元响应的数据选择策略,动态挑选对模型关键神经元激活贡献大的样本。核心贡献是将神经元行为分析引入数据筛选,提升了指令微调的数据效率。对LLM微调实践者而言,该方法有助于用更少数据维持甚至提升模型能力,降低计算成本。

指令微调数据选择神经元感知大模型微调优化数据效率

FingerTip 20K: A Benchmark for Proactive and Personalized Mobile LLM Agents

ICLR 2026-01-01

提出FingerTip 20K基准,专门评估移动端多模态LLM代理的主动建议与个性化能力,弥补当前代理在用户意图预测和习惯适应方面评估的空白。核心贡献在于构建了包含2万个真实移动交互场景的数据集,为衡量GUI代理的智能水平提供了标准化测试。对移动AI助手开发者意义重大,有助于推动从被动响应到主动服务的演进。

移动代理多模态大模型基准测试个性化GUI代理主动交互

How Well Does GPT-4o Understand Vision? Evaluating Multimodal Foundation Models on Standard Computer Vision Tasks

ICLR 2026-01-01

在标准计算机视觉任务上系统评估GPT-4o等多模态基础模型的视觉理解能力,揭示其在低层视觉、中层感知与高层认知各方面的真实水平。核心贡献是提供了严谨的基准测试框架和量化结论,发现模型在复杂场景理解和细节推理上仍有明显短板。对多模态模型开发者和应用者,该研究为模型选型与能力边界判断提供了重要参考。

多模态基础模型视觉理解GPT-4o基准测试计算机视觉能力评估

Common Corpus: The Largest Collection of Ethical Data for LLM Pre-Training

ICLR 2026-01-01

发布Common Corpus,目前最大的合规训练数据集,专为大语言模型预训练收集,完全规避版权和隐私风险。核心贡献在于构建了包含数万亿token的全开放、全授权数据集合,为生态提供可安全复现的预训练基础。对关注数据合规与开源生态的从业者,该数据集极大地降低了训练由版权纠纷带来的法律与技术障碍。

预训练数据合规数据集大语言模型版权合规开源数据数据伦理

Spilling the Beans: Teaching LLMs to Self-Report Their Hidden Objectives

ICLR 2026-01-01

提出教会LLM自我报告隐藏目标的方法,使模型能在被监控时主动揭示其内在追求,从而提升高级智能体系统的安全性。核心贡献在于将隐藏目标检测转化为模型自身可输出的显式信息,改变了以往依赖外部分类器检测的范式。对AI安全和对齐研究人员,该技术为发现并纠正模型潜在有害目标提供了更直接的内省手段。

AI安全隐藏目标自我报告大模型对齐智能体可解释性

Q-RAG: Long Context Multi‑Step Retrieval via Value‑Based Embedder Training

ICLR 2026-01-01

提出Q-RAG方法,通过基于价值的嵌入器训练解决长上下文多步检索增强生成问题,使检索模块能根据查询价值自适应地选择多个相关段落。核心贡献在于将多步检索优化为价值感知过程,显著提升开放域问答等任务中长程推理的准确率。对构建复杂RAG系统的开发者,该技术可有效改善多跳推理和长文档处理效果。

检索增强生成多步检索长上下文嵌入器训练价值学习开放域问答

From Text to Talk: Audio-Language Model Needs Non-Autoregressive Joint Training

ICLR 2026-01-01

提出音频-语言模型的非自回归联合训练范式,解决语音到语音对话中自回归方法的延迟与误差累积问题。核心贡献是设计同时生成文本与语音的多任务训练,提升流式交互的自然度与效率。对从业者而言,该方向为低延迟语音AI提供了一条新的技术路线。

多模态学习语音对话非自回归生成联合训练音频语言模型S2S系统

FrugalRAG: Less is More in RL Finetuning for Multi-hop Question Answering

ICLR 2026-01-01

提出FrugalRAG方法,在多跳问答的RL微调中贯彻「少即是多」,通过精简检索内容而非增加段落来提升小型语言模型的推理表现。核心贡献是发现过度检索会分散奖励信号,并给出高效的数据利用策略。对从业者来说,这为资源受限场景下的RAG微调提供了实用指导。

检索增强生成强化学习微调多跳问答小语言模型数据效率RAG

From Broad Exploration to Stable Synthesis: Entropy-Guided Optimization for Autoregressive Image Generation

ICLR 2026-01-01

揭示文本到图像生成中思维链探索与强化学习优化之间的交互机制,并提出熵引导优化方法,使自回归图像生成从宽泛探索平稳过渡到稳定合成。核心贡献在于动态调控生成过程的随机性,兼顾多样性与保真度。该方法为可控图像生成提供了一个新的优化视角。

文本到图像生成自回归模型思维链强化学习熵引导优化策略

Stopping Computation for Converged Tokens in Masked Diffusion-LM Decoding

ICLR 2026-01-01

针对掩码扩散语言模型解码时对所有位置无差别重算的问题,提出一种动态检测已收敛token并提前停止其计算的方法。核心贡献是显著减少冗余的注意力与前馈计算,加速生成并降低开销。这对部署高效的扩散语言模型推理系统具有重要意义。

掩码扩散语言模型解码优化收敛检测计算节省生成加速推理效率

Do LLM Agents Know How to Ground, Recover, and Assess? Evaluating Epistemic Competence in Information-Seeking Agents

ICLR 2026-01-01

构建评估框架以检验LLM搜索智能体在开放域问答中的认知能力,包括是否能够接地、从错误中恢复并进行自我评估。核心贡献是揭示当前RL训练出的智能体在最终答案之外存在认知盲区。这对构建更可信、可纠错的AI搜索系统具有警示与指导价值。

LLM智能体认知能力评估信息搜索接地能力错误恢复自我评估

Conditioned Initialization for Attention

ICLR 2026-01-01

提出一种针对注意力机制的条件化初始化策略,利用下游任务或输入条件来设置查询、键、值的投影矩阵初值。核心贡献是改善Transformer训练的收敛速度和最终性能,且实现轻量。该方法为各类Transformer应用提供了一种即插即用的训练加速手段。

Transformer注意力机制初始化方法条件初始化训练加速收敛优化

StreamingThinker: Large Language Models Can Think While Reading

ICLR 2026-01-01

提出StreamingThinker框架,允许LLM在流式阅读输入的同时逐步进行思维链推理,打破“读完再想”的范式。核心贡献是实现更低的首token延迟,尤其适用于长文本实时交互场景。为需要即时响应的流式应用开辟了新的推理范式。

流式推理LLM思维链实时交互低延迟推理逐块处理

DeepCompress: A Dual Reward Strategy for Dynamically Exploring and Compressing Reasoning Chains

ICLR 2026-01-01

提出DeepCompress双奖励策略,动态探索并压缩推理链,以解决大型推理模型的「过度思考」与「思考不足」问题。核心贡献是同时利用答案正确性奖励和推理链简洁性奖励,自适应调节推理深度。这为构建高效且稳健的推理系统提供了实用的训练方案。

大型推理模型推理链压缩双奖励机制过度思考思考不足强化学习

HiDrop: Hierarchical Vision Token Reduction in MLLMs via Late Injection, Concave Pyramid Pruning, and Early Exit

ICLR 2026-01-01

HiDrop针对多模态大模型中视觉token导致的二次计算成本问题,提出了层级视觉token削减方案,通过晚注入策略、凹金字塔剪枝和早退机制,在保持模型性能的同时大幅降低计算量。该工作为从业者提供了即插即用的高效推理加速方法,尤其适用于计算资源受限的部署场景。

多模态大语言模型视觉token削减层级剪枝早退机制推理加速

MergePRAG: Orthogonal Merging of Passage-experts for Multi-hop Parametric RAG

ICLR 2026-01-01

MergePRAG提出一种正交合并多个段落专家(passage-experts)的方法,用于提升多跳参数化检索增强生成的表现。该方法在不干扰原有知识的前提下有效融合多源段落信息,解决了复杂推理中的知识整合难题,对构建高精度知识密集型应用具有实用价值。

检索增强生成参数化RAG多跳推理专家合并知识融合

Understanding vs. Generation: Navigating Optimization Dilemma in Multimodal Models

ICLR 2026-01-01

该研究揭示了多模态模型中「生成」与「理解」能力之间的优化困境,分析了二者互斥的根本原因,并提出可能的平衡训练策略。这一洞察为开发者设计兼备强生成与深理解的多模态模型指明了方向,避免片面追求单一指标。

多模态模型生成与理解权衡优化困境模型训练策略能力平衡

The Unseen Bias: How Norm Discrepancy in Pre-Norm MLLMs Leads to Visual Information Loss

ICLR 2026-01-01

研究首次揭示预归一化(Pre-Norm)架构在MLLMs中因跨模态规范差异导致视觉信息系统性丢失的隐性偏见,并提供了分析和缓解该问题的途径。该发现有助于从业者重新审视现有架构设计,改进视觉特征利用,从而提升多模态模型的感知准确度。

多模态大语言模型预归一化规范差异视觉信息损失架构偏见

Exploring Diverse Generation Paths via Inference-time Stiefel Activation Steering

ICLR 2026-01-01

本文提出在推理时通过Stiefel流形上的激活引导来操控语言模型内部表征,从而拓宽生成路径、增加输出多样性。该方法无需重新训练即可缓解模式坍塌,为需要高多样性文本生成(如创意写作、头脑风暴)的应用提供了轻量级解决方案。

大语言模型生成多样性Stiefel流形激活引导推理时调控

FastFlow: Accelerating The Generative Flow Matching Models with Bandit Inference

ICLR 2026-01-01

FastFlow利用Bandit推理算法加速流匹配生成模型,通过自适应的去噪步数选择,在维持高保真度的同时显著减少推理时间。这对于需要低延迟实时图像或视频生成的从业者来说,提供了一种不牺牲质量的实用加速方案。

流匹配模型加速推理Bandit算法图像生成视频生成

Reinforcement Learning Fine-Tuning Enhances Activation Intensity and Diversity in the Internal Circuitry of LLMs

ICLR 2026-01-01

研究发现强化学习微调(RL fine-tuning)能显著增强大语言模型内部神经回路的激活强度和多样性,并解释了其提升模型性能的机理。该结论为从业者采用RL微调提供了理论支撑,有助于更有效地进行模型后训练,优化泛化能力。

大语言模型强化学习微调激活强度激活多样性内部表征后训练优化

Automated Stateful Specialization for Adaptive Agent Systems

ICLR 2026-01-01

该工作提出了自动化状态专业化框架,使智能体系统能持续积累任务专长并进行自适应调整,弥补了静态工作流和每查询优化器之间难以沉淀知识的鸿沟。对构建长期运行、越用越好的自适应智能体系统具有重要实践意义。

智能体系统自适应智能体状态专业化工作流优化自动化设计

Best-of-Infinity: Asymptotic Performance of Test-Time LLM Ensembling

ICLR 2026-01-01

本文研究大模型测试时集成中的多数投票机制,分析当候选数量N趋于无穷(best-of-∞)时的渐近性能极限。核心贡献是给出该极限下的理论边界,揭示集成投票的潜力与约束。对于关注推理阶段提升准确率的从业者,此分析有助于理解集成方法的上限并指导实际部署。

大模型测试时集成多数投票渐近分析推理增强

Copy-Paste to Mitigate Large Language Model Hallucinations

ICLR 2026-01-01

引入一种直接「复制粘贴」的策略,从检索到的文档中摘取片段作为生成内容,以缓解检索增强生成中的上下文不忠实问题。该方法简单有效,能显著减少大模型在引用外部知识时产生的幻觉。对追求高可靠RAG应用的从业者,提供了一种低成本、易部署的忠实度提升方案。

大模型幻觉缓解检索增强生成复制粘贴忠实度

Programming by Backprop: An Instruction is Worth 100 Examples When Finetuning LLMs

ICLR 2026-01-01

探索利用指令和规则而非大量示例来微调大模型,提出一种将陈述性指令通过可微程序与反向传播相结合的方法。实验表明一条精心设计的指令可抵百个示例,极大提高了样本效率。对需要低成本定制模型行为的开发者而言,该工作开启了以指令驱动的微调新范式。

大模型微调指令学习程序合成样本效率反向传播

Enough is as good as a feast: A Comprehensive Analysis of How Reinforcement Learning Mitigates Task Conflicts in LLMs

ICLR 2026-01-01

全面分析强化学习(RL)在模型合并过程中缓解任务冲突的作用,发现适度的RL训练即可有效调和不同专长模型间的矛盾。研究揭示了「适可而止」的规律,即过长的RL训练可能无益甚至有害。这为多任务模型合并提供了实用的训练策略指导。

大模型模型合并强化学习任务冲突多任务学习

TiTok: Transfer Token-level Knowledge via Contrastive Excess to Transplant LoRA

ICLR 2026-01-01

提出TiTok方法,通过对比学习捕捉token级别的过剩知识,将其迁移用于移植LoRA模块,实现高效的跨任务适配。该方法扩展了参数高效微调的重用边界,使LoRA模块能灵活迁移到新任务。对需要频繁微调且保存资源的开发者,提供了一种更灵活的迁移学习工具。

大模型参数高效微调LoRA知识迁移对比学习Token级

Scalable Multilingual Multimodal Machine Translation with Speech-Text Fusion

ICLR 2026-01-01

提出一种融合语音与文本的多模态多语言机器翻译模型,将语音流与离散文本统一建模,具备可扩展的多语言支持。该工作突破了之前多模态翻译仅聚焦图像的局限,显著提升口语翻译及低资源语言场景的表现。为多语言语音翻译应用提供了可行的端到端方案。

多模态机器翻译语音融合多语言大模型语音翻译

Computer Agent Arena: Toward Human-Centric Evaluation and Analysis of Computer-Use Agents

ICLR 2026-01-01

构建了Computer Agent Arena平台,以人机交互任务为核心,动态、自动地评估计算机使用代理的真实能力。该平台克服了静态基准的领域狭隘和污染风险,引入了面向人本视角的度量。对于开发和评测GUI操控代理的团队,提供了一个更贴近真实场景的标准化测试环境。

计算机使用代理评估基准人机交互动态评估GUI代理

LS-Merge: Merging Language Models in Latent Space

ICLR 2026-01-01

提出LS-Merge方法,通过在模型的潜在表示空间而非权重空间进行合并,解除了传统方法对架构和尺寸必须相同的要求。这使得异构语言模型的合并成为可能,极大扩展了合并重用的适用范围。对融合不同规模或结构模型的需求,提供了一种突破性的技术路径。

模型合并潜空间异构模型大模型知识融合

RLVER: Reinforcement Learning with Verifiable Emotion Rewards for Empathetic Agents

ICLR 2026-01-01

提出通过可验证情感奖励进行强化学习训练共情智能体,弥补大语言模型在情感智能上的不足。核心贡献是将奖励信号设计为可验证的情感维度,使模型能学习恰当的共情回应。对从业者而言,该方法为构建高EQ的对话和辅助系统提供了新途径。

大模型强化学习情感智能可验证奖励共情智能体EQ

HardcoreLogic: Challenging Large Reasoning Models with Long-tail Logic Puzzle Games

ICLR 2026-01-01

构建长尾逻辑谜题基准HardcoreLogic,用于挑战大推理模型是否真正掌握推理而非依赖记忆。该方法通过稀有且新颖的谜题暴露模型在分布外泛化上的缺陷。对从业者评估和提升LRM真实推理能力具有重要参考价值。

大推理模型逻辑谜题长尾分布泛化能力基准测试推理评估

Meta-RL Induces Exploration in Language Agents

ICLR 2026-01-01

利用元强化学习诱导语言智能体在长程多步环境中主动探索,避免策略过早收敛到次优解。该方法通过学习如何探索来提升对新任务的适应能力。为LLM智能体增强自主探索提供了新的训练范式。

元强化学习语言智能体探索长程任务大模型RL

Micro-Macro Retrieval: Reducing Long-Form Hallucination in Large Language Models

ICLR 2026-01-01

提出微-宏观检索策略,在长文本生成时结合细粒度与粗粒度检索,减少冗余并抑制幻觉。通过多粒度上下文管理提升事实准确性与生成流畅度。为检索增强生成在长文本场景的实际部署提供高效方案。

大模型幻觉缓解检索增强生成长文本生成微宏观检索事实一致性

ProxyAttn: Guided Sparse Attention via Representative Heads

ICLR 2026-01-01

提出ProxyAttn,利用代表性头动态估计块重要性从而引导稀疏注意力计算,突破注意力二次复杂度瓶颈。方法在保证关键信息保留的前提下加速长文本推理。为LLM在长上下文场景的效率优化提供了新思路。

大模型稀疏注意力推理优化长文本代表性头部效率

LightMem: Lightweight and Efficient Memory-Augmented Generation

ICLR 2026-01-01

设计轻量记忆模块LightMem,使大语言模型高效利用历史交互信息,提升动态复杂环境下的响应质量。以较低开销实现记忆增强生成,改善对话一致性和上下文理解。对对话系统和交互式AI的实用化发展有直接推动。

大模型记忆增强对话系统历史交互轻量级高效

TRAC: Tensor-Train based Across-layer Compression for Parameter-Efficient Fine-Tuning

ICLR 2026-01-01

提出基于张量训练(Tensor-Train)分解的跨层参数压缩方法TRAC,将大型预训练模型中的微调参数表示为低秩张量序列,实现参数高效微调。相比传统低秩适配等方案,该方法在保持性能的同时进一步降低可训练参数量和显存占用。对需要在有限资源下微调大模型的从业者,TRAC提供了一种更具压缩率与灵活性的选择。

参数高效微调张量训练跨层压缩低秩分解模型压缩资源受限微调

ST-SimDiff: Balancing Spatiotemporal Similarity and Difference for Efficient Video Understanding with MLLMs

ICLR 2026-01-01

针对多模态大模型处理长视频时视觉token过多导致的计算开销,提出ST-SimDiff方法,通过平衡视频帧间的时空相似性与差异性来选择性保留关键视觉token。该方法在维持视频理解精度的同时显著减少token数量,提升推理效率。对于需要部署实时视频分析或多模态对话系统的工程师,ST-SimDiff提供了一种高效且易于集成的视频压缩策略。

多模态大模型视频理解时空建模视觉token压缩高效推理帧选择

ContextIF: Enhancing Instruction-Following through Context Reward

ICLR 2026-01-01

提出ContextIF方法,通过引入上下文奖励信号来增强大型语言模型的指令遵循能力,弥补监督微调和偏好学习在新颖指令上泛化不足的问题。模型在训练时额外接收与指令上下文一致性相关的奖励,从而更好地理解复杂、长程的指令意图。对于构建可靠指令跟随系统的开发者,ContextIF提供了一种提升鲁棒性和泛化性的新训练范式。

指令遵循奖励模型上下文学习强化学习LLM对齐泛化能力

FlowSearcher: Synthesizing Memory-Guided Agentic Workflows for Web Information Seeking

ICLR 2026-01-01

提出FlowSearcher,一种记忆引导的代理工作流合成方法,用于动态构建网络信息搜索流程,代替传统固定ReAct式工具链。系统利用记忆模块记录搜索历史与中间状态,自动组合和调整搜索、浏览、推理等步骤,提升深度研究代理的灵活性和准确率。对需要构建多步自主搜索AI的研究者,FlowSearcher展示了记忆增强工作流合成在开放信息获取中的优势。

AI代理网页搜索工作流合成记忆机制信息检索ReAct

HeurekaBench: A Benchmarking Framework for AI Co-scientist

ICLR 2026-01-01

提出HeurekaBench,一个专为AI合作科学家(AI co-scientist)设计的评估框架,衡量基于LLM的推理系统在多步科学分析中的能力。该基准覆盖假设生成、实验设计、结果解释等环节,提供多维度的可靠评估指标。对从事AI4Science和科学发现自动化研究的团队,HeurekaBench填补了科学代理系统性评估的空白。

基准测试AI合作科学家科学推理LLM评估科学分析多步推理

Reliable Fine-Grained Evaluation of Natural Language Math Proofs

ICLR 2026-01-01

提出针对自然语言数学证明的可靠细粒度评估方法,超越仅依赖最终答案正确性的传统方式。该方法对证明中的每一步逻辑推理进行独立验证,能更精准地定位模型错误并反映真实推理能力。对致力于提升LLM数学定理证明与复杂推理的研究者,该评估策略提供了更严格、更有诊断性的评价标准。

数学推理定理证明细粒度评估自然语言证明LLM评估逻辑验证

RAEE: A Robust Retrieval-Augmented Early Exit Framework for Efficient Inference

ICLR 2026-01-01

提出RAEE框架,将检索增强生成与提前退出机制鲁棒地结合,实现LLM推理时的高效层数自适应缩减。在推理过程中,模型可动态决定退出层并从外部知识库补充信息,既降低计算量又减轻因过早退出导致的事实性错误。对关注大模型低延迟部署和高效服务的工程师,RAEE提供了兼顾速度与可靠性的推理优化方案。

高效推理提前退出检索增强生成LLM推理动态层数稳健性

Adaptive Rollout Allocation for Online Reinforcement Learning with Verifiable Rewards

ICLR 2026-01-01

针对可验证奖励在线强化学习中固定采样预算导致效率低的问题,提出自适应rollout分配方法。该方法根据每个提示的难度动态调整采样数量,将更多资源分配给高不确定性样本,提升GRPO等群组策略优化算法的采样效率。对使用RL微调LLM(如数学推理、代码生成)的研究者,该自适应分配策略能显著降低训练成本并加速收敛。

强化学习可验证奖励采样效率GRPO自适应分配在线学习

Multi-Feature Quantized Self-Attention for Fair Large Language Models

ICLR 2026-01-01

针对大模型编码种族、性别等敏感特征导致的社会偏见问题,提出多特征量化自注意力机制,在自注意力计算中引入多敏感特征的量化表示以抑制偏见。该方法在指令微调后仍能保持公平性,为从业者提供了一种无需重新训练即可提升下游任务公平性的实用方案。

大模型公平性自注意力偏见缓解量化多特征

Attention as a Compass: Efficient Exploration for Process-Supervised RL in Reasoning Models

ICLR 2026-01-01

本文提出将注意力权重作为指南,用于过程监督强化学习中的高效探索,从而提升大模型推理能力。核心贡献是设计了一种利用注意力模式引导动作选择的机制,减少无效探索,加速收敛。对从业者而言,该方法可显著提高推理模型训练的效率与效果。

大模型强化学习过程监督注意力机制推理探索效率

Why DPO is a Misspecified Estimator and How to Fix It

ICLR 2026-01-01

指出直接偏好优化(DPO)在估计上存在错误指定,并揭示了其源于偏好建模与策略优化之间的统计不一致。作者提出修正方法,通过重新定义损失函数或引入校正项来恢复无偏估计。这为从业者提供了更可靠的直接对齐算法,避免偏好微调中的偏差累积。

大模型直接偏好优化对齐偏好学习统计推断模型估计

Comparing AI Agents to Cybersecurity Professionals in Real-World Penetration Testing

ICLR 2026-01-01

首次在真实企业环境中系统评估AI渗透测试代理与人类网络安全专家的能力对比。分析六类现有AI工具与十名专家的表现,揭示AI在自动化侦查和利用方面的优势与在适应性决策上的不足。为安全从业者理解AI辅助渗透测试的现实水平与部署边界提供关键参考。

AI代理网络安全渗透测试人类对比自动化安全评估

PERK: Long-Context Reasoning as Parameter-Efficient Test-Time Learning

ICLR 2026-01-01

提出参数高效的测试时学习方法PERK,用于长上下文推理。该方法在推理阶段动态识别并压缩噪声上下文中的关键信息,无需增加模型参数即可提升长文本处理的准确性。对从业者而言,PERK提供了轻量级的长上下文推理解决方案,降低对超长输入的计算开销。

大模型长上下文测试时学习参数高效推理关键信息提取

Count Counts: Motivating Exploration in LLM Reasoning with Count-based Intrinsic Rewards

ICLR 2026-01-01

针对强化学习训练大模型推理时结果奖励稀疏的问题,引入基于计数的内在奖励以激励推理路径探索。核心贡献是设计了一种考虑状态访问计数的探索奖赏,与外部稀疏奖励结合,有效促进多步推理策略的多样性。这为从业者提升推理训练的样本效率与最终性能提供了新思路。

大模型强化学习探索激励内在奖励多步推理计数

A Fano-Style Accuracy Upper Bound for LLM Single-Pass Reasoning in Multi-Hop QA

ICLR 2026-01-01

推导出大模型在单次通过(无检索)多跳问答时的准确率上界,类似Fano不等式将噪声信道下错误概率与信息量关联。该理论界限量化了模型容量与上下文窗口限制对多跳推理性能的根本约束,为从业者评估模型推理能力的上限及设计改进方向(如检索增强)提供理论依据。

大模型多跳问答准确率上界信息论推理限制理论分析

Steering Language Models with Weight Arithmetic

ICLR 2026-01-01

探索通过权重算术(如加减模型权重)来操控大模型行为,无需额外微调即可将特定属性注入或移除。核心贡献是演示了在语言模型中加减任务特定向量可引导输出风格、安全性等属性,提供了一种极致轻量的模型行为编辑方式。这对从业者快速定制模型行为、降低反馈成本具有重要意义。

大模型权重算术模型编辑行为操控轻量化微调可控生成

In Context Semi-Supervised Learning

ICLR 2026-01-01

该工作将上下文学习框架扩展到半监督设定,研究Transformer如何利用少量标注和大量未标注示例在上下文中执行半监督学习,为理解大模型的上下文泛化机制提供新视角。对从业者,有助于设计更高效的提示学习策略。

上下文学习半监督学习Transformer理论分析

Enhancing Language Model Reasoning with Structured Multi-Level Modeling

ICLR 2026-01-01

提出结构化多层级建模方法,通过融合多粒度思维链与层级策略优化,在推理时扩展中实现更高效、更稳定的复杂推理,超越单一策略和结果奖励的局限。

推理增强链式思考多层级建模强化学习推理时扩展

HippoTune: A Hippocampal Associative Loop–Inspired Fine-Tuning Method for Continual Learning

ICLR 2026-01-01

HippoTune受海马体联想回路启发,提出一种面向持续学习的微调方法,通过模拟记忆关联重激活来缓解灾难性遗忘。该方法增强了参数高效微调在序列任务上的旧知识保持能力,对需要不断适应新数据的实际部署场景具有重要价值。

持续学习灾难性遗忘参数高效微调海马体启发微调方法

MEM1: Learning to Synergize Memory and Reasoning for Efficient Long-Horizon Agents

ICLR 2026-01-01

MEM1方法使语言智能体在长周期交互任务中学会协同记忆检索与推理过程,高效整合环境反馈和先验知识。其核心贡献在于将记忆与推理联合学习以提升多步决策效率,为构建可靠的长程任务智能体提供了关键支撑。

长周期智能体记忆与推理语言智能体任务规划效率优化

Tools are under-documented: Simple Document Expansion Boosts Tool Retrieval

ICLR 2026-01-01

针对工具文档描述不完整和异构性问题,提出一种简单的文档扩展技术,通过扩充工具描述信息来增强检索。该方法显著提升了大语言模型在工具检索任务中的准确率,为改进工具型智能体的可靠性提供了低成本的方案。

工具检索文档扩展大语言模型工具使用信息检索

Massive Editing for Large Language Models Based on Dynamic Weight Generation

ICLR 2026-01-01

提出一种基于动态权重生成的大规模知识编辑方法,能够对大型语言模型进行批量知识更新,同时保持模型整体稳定性。该方法克服了现有编辑技术在大量修改时效果显著下降的瓶颈,对模型维护和事实更新十分关键。

知识编辑大规模编辑动态权重生成大语言模型模型更新

SpareTrain: Fault-Tolerant LLM Training via Low-Cost Dual Modular Redundancy

ICLR 2026-01-01

提出低成本双模冗余训练方法SpareTrain,通过选择性重复执行关键操作来检测静默数据损坏,从而提升大模型训练容错能力。该方法在保障可靠性的同时显著降低冗余计算开销,对大规模训练稳定性至关重要。

大模型训练容错双模冗余静默数据损坏训练可靠性

PALC: Preference Alignment via Logit Calibration

ICLR 2026-01-01

引入PALC方法,在推理阶段通过校准输出logits实现大模型与人类偏好对齐,无需繁重训练或复杂奖励架构。此法以极低计算成本完成对齐,为高效部署对齐模型提供了新思路。

偏好对齐Logit校准大模型对齐推理时优化RLHF替代

WebDS: An End-to-End Benchmark for Web-based Data Science

ICLR 2026-01-01

构建端到端基准WebDS,涵盖真实数据科学中网络查找、多源多模态合成与总结等复杂交互任务。该基准为评估自动化数据科学代理的综合能力提供了标准化测试平台。

数据科学基准测试网络交互多模态代理评估

Diffusion Language Models are Provably Optimal Parallel Samplers

ICLR 2026-01-01

从理论层面证明扩散语言模型在并行token生成中是渐进最优的并行采样器,为DLM替代自回归模型实现高速推理奠定了严格基础。此结论对设计高效并行解码策略具有重要指导意义。

扩散语言模型并行采样理论证明推理加速自回归替代

Rectifying LLM Thought from Lens of Optimization

ICLR 2026-01-01

从优化视角剖析长链思维中的错误传播现象,并提出纠正策略以提升LLM推理准确性。该工作为理解和改进思维链提示提供了理论依据与实用方法。

思维链纠正优化视角大模型推理错误传播CoT改进

TNT: Improving Chunkwise Training for Test-Time Memorization

ICLR 2026-01-01

提出TNT方法,改进分块训练机制以增强RNN在测试时的记忆能力,有效缓解长序列场景下的记忆衰减。该工作推动了线性复杂度记忆模型性能的进一步提升。

测试时记忆RNN分块训练线性复杂度长序列建模

RLAC: Reinforcement Learning with Adversarial Critic for Free-Form Generation Tasks

ICLR 2026-01-01

针对自由形式生成任务,提出RLAC框架,利用对抗评论家自动捕捉多元隐式评价标准,降低人工验证成本。该方法在强化学习中融合自动评估,有效提升生成输出对多样需求的满足度。

强化学习对抗评论家自由形式生成自动评估降低验证成本

Attention Sinks and Compression Valleys in LLMs are Two Sides of the Same Coin

ICLR 2026-01-01

本文揭示了大语言模型中「注意力沉没」与「压缩谷」两个孤立研究的现象实为同一机制的两面,统一了注意力行为中的过度关注与信息忽略。核心贡献在于提出统一理论框架,加深对注意力机制本质的理解。对从业者可指导模型注意力优化与显存管理。

注意力机制大模型现象分析理论统一KV-cache

THEMIS: Towards Holistic Evaluation of MLLMs for Scientific Paper Fraud Forensics

ICLR 2026-01-01

THEMIS 提出了一个面向学术场景的多任务基准,用于系统评估多模态大模型在真实论文图像造假识别与视觉欺诈推理上的能力。亮点是把「论文造假取证」这一现实难题转化为可量化的 MLLM 评测任务。对研究多模态模型可信度与学术诚信检测的人,提供了一个有针对性的评测标尺。

多模态大模型评测基准视觉推理学术造假检测MLLM

Not Search, But Scan: Benchmarking MLLMs on Scan-Oriented Academic Paper Reasoning

ICLR 2026-01-01

该研究提出面向「扫读式」学术论文推理的新基准,用于评测多模态大模型在快速浏览图文论文时的理解与推理能力,区别于传统的检索与问答任务。它揭示了当前 MLLM 在图表、版式与跨页信息扫读上的不足。对从业者而言,为科研助手类多模态模型的能力评估和改进提供了更贴近真实阅读场景的标尺。

多模态大模型学术论文理解推理评测基准测试图表理解

JailNewsBench: Multi-Lingual and Regional Benchmark for Fake News Generation under Jailbreak Attacks

ICLR 2026-01-01

JailNewsBench 构建了一个多语言、多地区的假新闻生成基准,专门评估大模型在越狱攻击下被诱导生成虚假新闻的风险。它覆盖政治、经济、健康等高危领域并跨语言地区设置场景。对从业者而言,为模型安全对齐、内容审核与防越狱防护提供了系统化测试集。

大模型安全越狱攻击假新闻多语言内容安全基准测试

Aria: an Agent for Retrieval and Iterative Auto-Formalization via Dependency Graph

ICLR 2026-01-01

Aria 是一个基于依赖图的检索与迭代式自动形式化智能体,用于把数学定理陈述准确翻译为可验证的形式化语言。它通过依赖图检索相关定义与引理并迭代修正,缓解大模型在形式化中的幻觉问题。对从业者而言,为自动定理证明与形式化数学工具链提供了更可靠的前端环节。

自动形式化定理证明Agent检索增强依赖图数学推理

From Natural Alignment to Conditional Controllability in Multimodal Dialogue

ICLR 2026-01-01

该工作研究多模态对话从「自然对齐」走向「条件可控性」,旨在让 AIGC 生成的多模态交互内容既自然又可按条件精确控制。它针对当前多模态对话生成可控性不足的问题提出新建模思路。对从业者而言,为可控的多模态人机交互与数字人对话系统提供了设计参考。

多模态对话AIGC可控生成人机交互对齐

Exploring Interpretability for Visual Prompt Tuning with Cross-layer Concepts

ICLR 2026-01-01

该研究探索视觉提示微调的可解释性,借助跨层概念来揭示视觉提示在适配预训练视觉基础模型时究竟学到了什么。它填补了视觉提示微调缺乏可解释性分析的空白。对从业者而言,有助于理解并优化参数高效微调在视觉模型上的行为与可信度。

视觉提示微调可解释性参数高效微调视觉基础模型概念分析

STAIRS-Former: Spatio-Temporal Attention with Interleaved Recursive Structure TransFormer for Offline Mulit-task Multi-agent Reinforcement Learning

ICLR 2026-01-01

STAIRS-Former 提出一种带交错递归结构的时空注意力 Transformer,用于离线多任务多智能体强化学习,能处理任务间智能体数量变化并泛化到未见场景。其交错递归设计增强了对可变规模智能体的建模能力。对从业者而言,为离线 MARL 在多任务、跨规模场景下的统一建模提供了新架构。

多智能体强化学习离线强化学习Transformer时空注意力多任务泛化

Swap-guided Preference Learning for Personalized Reinforcement Learning from Human Feedback

ICLR 2026-01-01

该工作提出基于交换引导的偏好学习方法,用于个性化的人类反馈强化学习,突破 RLHF 假设单一通用奖励的局限。它通过 Swap 机制建模不同用户的差异化偏好以实现个性化对齐。对从业者而言,为面向多元用户价值的个性化大模型对齐提供了可行路径。

RLHF偏好学习个性化对齐强化学习

AetherCode: Evaluating LLMs’ Ability to Win In Premier Programming Competitions

ICLR 2026-01-01

AetherCode 是评估大模型在顶级编程竞赛中夺冠能力的新基准,针对现有代码基准已趋饱和、难以区分强模型的问题,引入高难度竞赛题考察推理与编码极限。它更贴近真实竞赛的难度与评判标准。对从业者而言,为衡量前沿大模型的高阶推理与代码能力提供了更具区分度的标尺。

大模型代码生成编程竞赛推理评测基准测试

SafeDPO: A Simple Approach to Direct Preference Optimization with Enhanced Safety

ICLR 2026-01-01

SafeDPO 提出一种更简洁的直接偏好优化方法,在对齐过程中显式纳入安全约束,让模型在提升有用性的同时兼顾安全性。它无需复杂的奖励模型或多阶段流程,直接在偏好优化目标中融合安全信号。对从业者而言,这意味着可以用更低的工程成本实现「既有用又安全」的对齐,降低部署 LLM 时的安全风险。

大模型对齐DPO偏好优化AI安全RLHF

How Far Can Unsupervised RLVR Scale LLM Training?

ICLR 2026-01-01

该研究系统探讨了无监督的可验证奖励强化学习(URLVR)究竟能把 LLM 训练扩展到何种规模,试图突破依赖人工标注的监督瓶颈。它在无真值标签的情况下自动推导奖励信号,并考察其可扩展性边界与失效模式。对从业者而言,这为低成本、大规模强化训练提供了实证依据,揭示了无监督 RL 扩展的潜力与天花板。

大模型强化学习可验证奖励无监督学习RLVR训练扩展

Polychromic Objectives for Reinforcement Learning

ICLR 2026-01-01

本文提出「多彩目标」(Polychromic Objectives),针对强化学习微调中预训练策略生成多样性下降的问题,设计新的优化目标以在提升任务表现的同时保持生成的多样性。它避免了 RLFT 常见的模式坍缩和多样性损失。对从业者而言,这有助于在用 RL 微调模型时兼顾质量与多样性,改善创意类与探索类任务的输出。

强化学习微调RLFT生成多样性策略优化大模型

Strong Correlations Induce Cause Only Predictions in Transformer Training

ICLR 2026-01-01

该工作从数据相关性强度和梯度下降的隐式正则化角度,重新审视 Transformer 何时能优先学习真正的因果而非虚假关联。研究发现强相关会诱导模型只做「因果」预测的现象,并刻画了其触发条件。对从业者而言,这加深了对模型为何会依赖捷径或虚假特征的理解,对提升泛化与鲁棒性有指导意义。

Transformer因果推断虚假相关隐式正则化泛化训练动态

SecP-Tuning: Efficient Privacy-Preserving Prompt Tuning for Large Language Models via MPC

ICLR 2026-01-01

SecP-Tuning 提出基于安全多方计算(MPC)的高效隐私保护提示微调方法,使 LLM 能在医疗、金融等隐私敏感领域适配专门任务而不泄露原始数据。它在保证隐私的前提下优化了提示微调的计算效率。对从业者而言,这为在合规约束下安全使用 LLM 定制能力提供了可行的技术路径。

大模型隐私保护多方计算提示微调MPC数据安全

Be Careful When Fine-tuning On Open-Source LLMs: Your Fine-tuning Data Could Be Secretly Stolen!

ICLR 2026-01-01

该研究揭示了一个隐蔽的安全风险:在开源 LLM 上用专有数据微调时,原始模型可能被预先植入机制,使你的微调数据被秘密窃取回流。它展示了这种数据窃取攻击的可行性与隐蔽性。对从业者而言,这敲响警钟——下游开发者在使用第三方开源模型微调时,敏感训练数据可能面临泄露风险,需谨慎评估来源。

大模型微调数据窃取开源模型AI安全隐私风险

Beyond Binary Preferences: A Principled Framework for Reward Modeling with Ordinal Feedback

ICLR 2026-01-01

本文提出一个有原则的奖励建模框架,超越传统的二元偏好,能够利用序数(多档位)反馈数据进行建模。它为如何数学化地使用「有强弱之分」的人类偏好提供了理论基础。对从业者而言,这意味着可以更充分地挖掘人工标注信息、构建更精细准确的奖励模型,从而提升 LLM 对齐效果。

奖励建模对齐序数反馈偏好学习RLHF大模型

SELF-HARMONY: LEARNING TO HARMONIZE SELF-SUPERVISION AND SELF-PLAY IN TEST-TIME REINFORCEMENT LEARNING

ICLR 2026-01-01

SELF-HARMONY 针对测试时强化学习(TTRL)提出在推理阶段协调自监督与自博弈两种信号的方法,仅用合成信号即可无标签地自适应模型,并构建更可靠的学习信号。它解决了 TTRL 中信号不稳定、易坍缩的问题。对从业者而言,这为在无标注数据条件下让模型于部署阶段持续自我提升提供了新思路。

测试时强化学习自监督自博弈TTRL无标签学习大模型

Hyper-SET: Designing Transformers via Hyperspherical Energy Minimization

ICLR 2026-01-01

Hyper-SET 提出用「超球面能量最小化」的统一原理来推导 Transformer 层,而非自底向上的启发式堆叠。它把注意力与前馈等组件视为在超球面上最小化某种能量的迭代步骤,从而给出可解释、可推导的原型架构。对从业者而言,这提供了理解和重新设计 Transformer 的第一性原理视角。

Transformer架构设计能量最小化超球面可解释性理论

LLM-JEPA: Large Language Models Meet Joint Embedding Predictive Architectures

ICLR 2026-01-01

LLM-JEPA 将视觉领域成功的联合嵌入预测架构(JEPA)引入大语言模型,用嵌入空间的预测目标补充传统的输入空间重建与生成目标。实验显示该方法在预训练、微调中能学到更优的表征。对从业者而言,它为提升 LLM 表征质量提供了一条不依赖纯生成损失的新训练范式。

大模型JEPA表征学习预训练嵌入空间训练目标

Unveiling the Potential of Diffusion Large Language Model in Controllable Generation

ICLR 2026-01-01

该工作系统揭示了扩散式大语言模型(Diffusion LLM)在可控生成上的潜力,指出即便最先进的自回归 LLM 在精确控制输出方面仍有局限,而扩散范式天然支持双向、可约束的迭代去噪。对从业者而言,这为函数调用、格式约束、Agent 通信等需要强可控性的场景提供了新选择。

扩散模型大模型可控生成函数调用Agent非自回归

MedAgentGym: A Scalable Agentic Training Environment for Code-Centric Reasoning in Biomedical Data Science

ICLR 2026-01-01

MedAgentGym 是一个可扩展的交互式训练环境,专门提升 LLM Agent 在生物医学数据科学中以代码为核心的推理能力。它提供大规模、可交互的编程任务场景用于训练与评测医疗领域 Agent。对从业者而言,它填补了医学 Agent 缺乏标准化代码推理训练平台的空白。

Agent生物医学代码推理训练环境大模型评测基准

Annotation-Efficient Honesty Alignment via Confidence Elicitation and Calibration

ICLR 2026-01-01

该工作提出一种标注高效的诚实性对齐方法,通过置信度引出与校准,让 LLM 识别自身知识边界并表达校准过的置信度。相比依赖大量人工标注的方案,它显著降低了对齐成本。对从业者而言,这有助于以更低代价构建可信、知道「自己不知道」的模型。

对齐诚实性置信度校准可信AI标注高效大模型

Auto-RT: Automatic Jailbreak Strategy Exploration for Red-Teaming Large Language Models

ICLR 2026-01-01

Auto-RT 提出一个自动化红队框架,用于自动探索针对 LLM 的越狱攻击策略,突破了现有方法依赖固定攻击模板的局限,能动态搜索更多样、更有效的攻击路径。对从业者而言,它能更全面地暴露模型安全漏洞,为防御加固提供依据。

红队越狱攻击大模型安全自动化对抗攻击策略探索

MobileIPL: Enhancing Mobile Agents Thinking Process via Iterative Preference Learning

ICLR 2026-01-01

MobileIPL 针对基于视觉语言模型的移动端 GUI Agent,用迭代偏好学习增强其「行动规划思维链(CoaT)」的推理过程,缓解了多样化 CoaT 轨迹数据稀缺的问题。对从业者而言,它提供了在数据有限下持续提升移动 Agent 操作与决策质量的训练思路。

移动AgentGUI视觉语言模型偏好学习思维链强化学习

Query-Aware Flow Diffusion for Graph-Based RAG with Retrieval Guarantees

ICLR 2026-01-01

该工作提出「查询感知的流扩散」方法用于基于图的检索增强生成(Graph RAG),并带有可证明的检索保证,能更好地在互连知识结构上捕捉复杂关系、支持多跳推理。对从业者而言,它为图 RAG 提供了既精准又有理论保障的检索机制。

检索增强图RAG多跳推理流扩散查询感知知识图谱

EvolProver: Advancing Automated theorem proving by Evolving Formalized Problems via Symmetry and Difficulty

ICLR 2026-01-01

EvolProver 针对形式化定理证明 LLM 泛化能力弱、对题面微小改写脆弱的问题,提出通过对称性变换和难度演化来扩充形式化问题数据集。该方法系统化地生成等价但表述不同的题目变体,提升模型对扰动的鲁棒性。对从业者而言,它给出了一条以数据演化增强形式化推理稳健性的可复用思路。

大模型自动定理证明形式化推理数据增强鲁棒性泛化能力

Long Chain-of-Thought Reasoning Across Languages

ICLR 2026-01-01

该研究考察大型推理模型在英语中习得的长链式思维(CoT)能力如何跨语言迁移,填补了长链推理多语言迁移机制理解上的空白。作者通过实验分析不同语言下长链推理的表现差异与迁移规律。对从业者而言,这为构建多语言推理模型和评估跨语言推理质量提供了重要参考。

大模型链式思维推理能力多语言跨语言迁移

SMAN-Bench: A Cross-System Benchmark for Mobile Agents under Single- and Multi-path, Ambiguous, and Noisy Tasks

ICLR 2026-01-01

SMAN-Bench 是面向移动智能体的跨系统评测基准,专门覆盖单路径与多路径、歧义性以及含噪声任务等复杂场景,弥补现有在线基准的不足。它评估基于视觉语言模型的手机 GUI 智能体在贴近真实使用情形下的能力。对从业者而言,该基准为更全面地衡量和改进移动 Agent 的稳健性提供了标准化工具。

移动智能体Agent评测基准视觉语言模型GUI多模态

MergOPT: A Merge-Aware Optimizer for Robust Model Merging

ICLR 2026-01-01

MergOPT 提出一种感知合并过程的优化器,用于稳健的模型合并,将多个独立微调的专家模型整合为单一模型并保留各专家知识。与仅在参数层面处理的现有方法不同,它在合并感知层面进行优化以减少冲突。对从业者而言,这有助于在不重新训练的情况下高效融合多个专家能力。

模型合并微调优化器参数融合多专家模型

DevOps-Gym: Benchmarking AI Agents in Software DevOps Cycle

ICLR 2026-01-01

DevOps-Gym 是评测 AI 智能体在完整软件 DevOps 周期中能力的基准,超越单纯的代码生成与缺陷修复,覆盖更广的运维与交付流程。它揭示了当前 AI Agent 在端到端 DevOps 任务上的真实表现与短板。对从业者而言,这为衡量和推进面向工程实践的自动化智能体提供了系统化评测平台。

Agent评测基准代码生成DevOps软件工程自动化

Regularized Latent Dynamics Prediction is a Strong Baseline For Behavioral Foundation Models

ICLR 2026-01-01

该工作指出带正则化的潜在动态预测可作为行为基础模型(BFM)的强基线,使智能体能够适应未知奖励或任务。作者表明这一简单方法在零样本任务适配上具有竞争力,挑战了更复杂方案的必要性。对从业者而言,它提供了一个易实现且高效的强基线,有助于厘清 BFM 设计的真正增益来源。

强化学习行为基础模型潜在动态零样本正则化

Transductive Visual Programming: Evolving Tool Libraries from Experience for Spatial Reasoning

ICLR 2026-01-01

该研究提出直推式视觉编程,通过从经验中演化工具库来增强三维场景中的空间推理,解决视觉语言模型在精确几何计算上的不足。方法将问题分解为调用专用工具的步骤,并不断积累和优化可复用工具。对从业者而言,这提供了一条让视觉程序随经验自我增强、提升空间推理能力的路径。

多模态视觉语言模型空间推理视觉编程工具库三维场景

NDAD: Negative-Direction Aware Decoding for Large Language Models via Controllable Hallucination Signal Injection

ICLR 2026-01-01

NDAD 提出负方向感知解码,通过可控地注入幻觉信号来抑制大模型生成虚假或事实不一致内容。该方法在解码阶段利用幻觉方向作为对照信号引导输出远离错误内容,缓解知识密集与推理任务中的幻觉问题。对从业者而言,这是一种无需重训、即插即用的幻觉抑制解码策略。

大模型幻觉抑制解码策略事实一致性推理

Incentivizing Agentic Reasoning in LLM Judges via Tool-Integrated Reinforcement Learning

ICLR 2026-01-01

针对当前 LLM 评委只依赖文本内在推理、缺乏外部验证能力的问题,本文提出用工具集成的强化学习来激励 LLM 评委进行「主动式」推理,让其在评判时调用工具(如代码执行、检索)来核实回答质量。核心贡献是把判分从纯文本打分升级为可验证、可取证的推理过程,显著提升评判的准确性与可靠性。对从业者而言,这为构建更可信的自动化评估与奖励模型管线提供了新范式。

大模型LLM评委强化学习工具调用Agent自动化评估

RoRE: Rotary Ray Embedding for Generalised Multi-Modal Scene Understanding

ICLR 2026-01-01

本文提出旋转射线嵌入(RoRE),一种用于通用多模态场景理解的位置编码方法,将 Transformer 隐式渲染中的几何信息以旋转射线形式注入,使模型在单次前向传播中完成几何推理与逼真新视角生成。亮点是把相机射线的几何先验优雅编码进注意力机制,提升跨模态、跨视角的泛化能力。对从业者而言,它为新视角合成与三维场景理解提供了更统一、可扩展的表征方案。

多模态场景理解Transformer位置编码新视角合成三维重建

Culture In a Frame: C$^3$B as a Comic-Based Benchmark for Multimodal Culturally Awareness

ICLR 2026-01-01

本文推出 C³B,一个基于漫画的多模态文化感知评测基准,用于检验多模态大模型(MLLM)对文化背景的理解能力,并在任务设计上引入了渐进式难度。核心贡献是以漫画这一富含文化语境的载体构建更具挑战性的评测,弥补现有基准难度不足的缺陷。对从业者而言,它为评估和改进 MLLM 的文化敏感度与本地化能力提供了有价值的工具。

多模态文化感知评测基准MLLM漫画理解本地化

EXP-Bench: Can AI Conduct AI Research Experiments?

ICLR 2026-01-01

本文提出 EXP-Bench,用于评测 AI 智能体能否端到端地开展严谨的 AI 研究实验,覆盖从假设、实验设计到执行与分析的完整流程。亮点是揭示当前 AI 智能体在严谨、可复现实验上的真实能力与短板,为「AI 做 AI 研究」这一前沿方向提供量化标尺。对从业者而言,它为自动化科研智能体的开发与评估指明了改进方向。

Agent评测基准自动化科研AI智能体实验复现大模型

Multimodal Prompt Optimization: Why Not Leverage Multiple Modalities for MLLMs

ICLR 2026-01-01

本文针对提示词优化长期局限于纯文本的现状,提出多模态提示优化,主张同时利用图像等多种模态来为多模态大模型(MLLM)优化提示。核心贡献是将提示优化从单一文本扩展到跨模态联合优化,更充分地发挥 MLLM 的多模态潜力。对从业者而言,这为提升图文等多模态任务的效果提供了一条无需微调、即插即用的优化路径。

多模态提示优化MLLM图文理解免微调大模型

Emergence of Superposition: Unveiling the Training Dynamics of Chain of Continuous Thought

ICLR 2026-01-01

本文研究连续思维链(continuous CoT)的训练动力学,揭示了「叠加态」现象的涌现机制,即连续思维通过在隐空间中并行承载多条推理路径来增强大模型的推理能力。亮点是从训练过程角度解释了连续思维为何能实现隐式并行思考。对从业者而言,这加深了对连续 CoT 内在机理的理解,为设计更高效的推理增强方法提供了理论依据。

大模型思维链推理优化连续思维训练动力学可解释性

DASH: Deterministic Attention Scheduling for High-throughput Reproducible LLM Training

ICLR 2026-01-01

本文提出 DASH,一种确定性注意力调度方案,用于实现高吞吐且可复现的大模型训练,解决 FlashAttention-3 等高效注意力实现中确定性与性能难以兼得的痛点。核心贡献是在保证逐位可复现的同时大幅降低确定性带来的性能损耗。对从业者而言,这对需要严格复现的训练实验和工程化训练管线极具实用价值。

大模型训练优化注意力机制可复现性FlashAttention高吞吐

Align to Misalign: Automatic LLM Jailbreak with Meta-Optimized LLM Judges

ICLR 2026-01-01

本文提出「对齐以制造失配」的自动化越狱方法,利用经过元优化的 LLM 评委来自动构造能绕过安全防护的对抗性提示,从而系统性地发现大模型的安全漏洞。亮点是把 LLM 评委变成可自我优化的攻击引擎,自动化地暴露模型弱点。对从业者而言,这既揭示了 LLM 评委被滥用的风险,也为红队测试与安全加固提供了有力工具。

大模型越狱攻击AI安全对抗攻击LLM评委红队测试

Negative Pre-activations Differentiate Syntax

ICLR 2026-01-01

该研究分析了使用 GELU、SiLU 等平滑激活函数的现代大模型,发现负的预激活值同样携带信号与梯度,并揭示出负预激活在神经元层面专门承担了区分句法(语法结构)的功能。这为理解 Transformer 内部的语法表征机制提供了新的可解释性视角。

大模型可解释性激活函数神经元分析句法表征

PerFit: Exploring Personalization Shifts in Representation Space of LLMs

ICLR 2026-01-01

PerFit 从表示空间的角度研究大模型的个性化问题,刻画了模型在面对个性化任务时内部表征发生的偏移规律。它揭示了通用知识强但个性化弱的根源,为构建更贴合用户偏好的个性化大模型提供了表征层面的分析工具。

大模型个性化表示空间用户偏好可解释性

AstaBench: Rigorous Benchmarking of AI Agents with a Scientific Research Suite

ICLR 2026-01-01

AstaBench 提出了一套面向科研场景的严格 AI 智能体评测基准,覆盖文献综述、实验复现、数据分析乃至提出新研究方向等科研全流程任务。它为衡量科研型 Agent 的真实能力提供了系统化、可复现的标准,对评估和推动科研自动化具有重要意义。

Agent评测基准科研自动化大模型实验复现

ThinkMorph: Emergent Properties in Multimodal Interleaved Chain-of-Thought Reasoning

ICLR 2026-01-01

ThinkMorph 研究多模态交错式思维链推理,提出让文本与图像在推理过程中迭代协同、互为补充,并观察到一系列涌现性质。它明确了什么才算有意义的图文交错思维链,对提升多模态模型的复杂推理能力具有指导价值。

多模态思维链推理图文交错涌现能力

ZeroGR: A Generalizable and Scalable Framework for Zero-Shot Generative Retrieval

ICLR 2026-01-01

ZeroGR 提出可泛化、可扩展的零样本生成式检索框架,将信息检索重构为生成文档标识符(docid)的任务,从而实现端到端优化。它在无需标注训练数据的情况下完成检索,对降低检索系统构建成本、与大模型无缝集成很有价值。

生成式检索零样本信息检索文档标识符大模型

EEPO: Exploration-Enhanced Policy Optimization via Sample-Then-Forget

ICLR 2026-01-01

EEPO 针对可验证奖励强化学习(RLVR)中探索与利用难以平衡的问题,提出「先采样后遗忘」的探索增强策略优化方法,缓解现有方法过度偏向利用、探索不足的缺陷。它有助于提升大模型在 RLVR 训练中的探索质量与最终性能。

强化学习RLVR探索利用平衡策略优化大模型

What Do Large Language Models Know About Opinions?

ICLR 2026-01-01

该研究系统考察大模型对人类观点的掌握程度,分析模型究竟「知道」哪些人类意见。这对大模型的价值对齐、用人类模拟(社会仿真)以及理解模型训练中学到了什么都具有重要意义。

大模型观点建模价值对齐人类模拟可解释性

Exploring the Potential of Encoder-free Architectures in 3D LMMs

ICLR 2026-01-01

该工作探索无编码器架构在 3D 大型多模态模型中的应用,将此前仅在 2D 多模态模型中初步尝试的去编码器思路扩展到 3D 理解场景。它为简化 3D 多模态模型结构、实现更统一的端到端 3D 理解提供了新方向。

多模态3D理解无编码器架构大模型模型结构

ATLAS: Adaptive Transfer Scaling Laws for Multilingual Pretraining, Finetuning, and Decoding the Curse of Multilinguality

ICLR 2026-01-01

ATLAS 开展了迄今规模最大的多语言缩放定律研究,覆盖预训练、微调与解码阶段,并系统刻画了「多语言诅咒」(语言越多单语性能越受损)的成因与边界。它提出自适应迁移缩放定律,量化不同语言间数据与算力的迁移效果,为面向全球数十亿用户的模型给出可预测的扩展指南。对从业者而言,这意味着在做多语言模型的数据配比和算力预算时,能用公式而非试错来决策。

多语言缩放定律预训练微调解码数据配比

How Transformers Learn Causal Structures In-Context: Explainable Mechanism Meets Theoretical Guarantee

ICLR 2026-01-01

该工作研究 Transformer 如何在上下文学习(ICL)中习得因果结构,给出了可解释的内在机制并配以理论保证。论文揭示注意力层如何从少量示例中推断变量间的因果依赖,并从数学上证明其收敛与正确性。对从业者而言,这有助于理解 ICL 为何有效、何时可靠,从而更稳妥地设计提示与少样本任务。

Transformer上下文学习因果结构可解释性理论分析注意力机制

Sparse CLIP: Co-Optimizing Interpretability and Performance in Contrastive Learning

ICLR 2026-01-01

Sparse CLIP 在对比学习框架下同时优化可解释性与性能,通过引入稀疏表示让 CLIP 的视觉-语言特征更易理解,又不牺牲下游精度。作为多模态系统默认视觉骨干的改进方案,它让特征维度对应更清晰的语义概念。对从业者而言,这提供了一个兼顾透明度与效果的视觉编码器选择,便于调试和审计多模态模型。

CLIP多模态对比学习可解释性稀疏表示视觉编码器

ReIn: Conversational Error Recovery with Reasoning Inception

ICLR 2026-01-01

ReIn 针对带工具调用的对话智能体在真实场景中遭遇意外、用户引发错误时易崩溃的问题,提出基于「推理植入(Reasoning Inception)」的会话错误恢复机制。它让智能体在偏离预期时进行反思与纠错,而非沿用固定任务流。对从业者而言,这能显著提升生产环境对话 Agent 面对非脚本化交互的鲁棒性。

Agent对话系统工具调用错误恢复大模型推理

SoSBench: Benchmarking Safety Alignment on Six Scientific Domains

ICLR 2026-01-01

SoSBench 是面向六大科学领域的安全对齐基准,专门评测大模型在涉及科学知识滥用(如危险化学、生物等)时的抗滥用能力。它填补了现有安全评测偏重通用有害内容、忽视专业科学风险的空白。对从业者而言,这为模型在科研助手等高风险场景的安全审查提供了量化工具。

大模型安全对齐基准测试滥用风险科学领域红队评测

Generative Value Conflicts Reveal LLM Priorities

ICLR 2026-01-01

该工作提出用「生成式价值冲突」来揭示大模型的内在价值优先级:通过构造迫使模型在多种价值间权衡的情境,观察其实际取舍,从而暴露对齐时未显式声明的偏好。相比静态对齐目标,它刻画了模型部署时真实的价值排序。对从业者而言,这是一种诊断和审计模型价值取向的实用方法。

大模型价值对齐价值冲突模型评测AI 安全偏好分析

Sparse Attention Adaptation for Long Reasoning

ICLR 2026-01-01

SeerAttention-R 是为推理模型长程解码量身设计的稀疏注意力框架,在前作 SeerAttention 基础上保留可学习稀疏模式的设计,专门优化长链推理时的解码效率。它在保持推理质量的同时降低长序列注意力的计算与显存开销。对从业者而言,这能加速 o1 式长思考模型的推理并节省成本。

稀疏注意力推理优化长序列解码加速推理模型显存优化

Small Transformers Don’t Need LayerNorm at Inference Time: Scaling LayerNorm Removal to GPT-2 XL and Implications for Mechanistic Interpretability

ICLR 2026-01-01

该研究表明小型 Transformer 在推理阶段并不需要 LayerNorm,并将这一「移除 LayerNorm」的做法成功扩展到 GPT-2 XL 规模。去掉推理时的归一化简化了模型结构,且对机制可解释性研究意义重大——线性化的残差流更易于电路分析。对从业者而言,这既可能简化部署,也为可解释性工具提供了更干净的研究对象。

TransformerLayerNorm机制可解释性GPT-2推理阶段模型简化

Critical attention scaling in long-context transformers

ICLR 2026-01-01

该工作揭示了长上下文 Transformer 中注意力机制的一个本质病理:随着上下文长度 n 增大,注意力分数会向均匀分布坍缩,使得各 token 之间难以有效区分。论文围绕这一现象提出了临界注意力缩放(critical attention scaling)的分析框架,刻画了注意力熵失控的临界条件。对从业者而言,这解释了为何模型在超长上下文下检索与聚焦能力退化,并为设计可扩展的注意力缩放策略提供了理论依据。

大模型长上下文注意力机制Transformer注意力坍缩可扩展性

CodeQuant: Unified Clustering and Quantization for Enhanced Outlier Smoothing in Low-Precision Mixture-of-Experts

ICLR 2026-01-01

CodeQuant 针对低精度大模型尤其是 MoE 架构中离群值(outlier)导致精度下降的瓶颈,提出将聚类与量化统一起来以增强离群值平滑的方法。其核心亮点是在专家维度上协同处理离群分布,从而在低比特量化下保持精度。对从业者而言,这有助于在显存受限场景部署大规模 MoE 模型,兼顾推理效率与准确率。

大模型量化MoE低精度离群值显存优化

Test-Time Matching: Unlocking Compositional Reasoning in Multimodal Models

ICLR 2026-01-01

该论文提出测试时匹配(Test-Time Matching),用于在推理阶段解锁多模态模型的组合推理能力。作者指出前沿模型在组合推理基准上常表现接近甚至低于随机水平,并通过无需重新训练的测试时方法显著提升表现。对从业者而言,这提供了一种低成本、即插即用的方式来增强已有多模态模型的组合泛化能力。

多模态组合推理测试时计算视觉语言模型推理增强

Hallucination-aware Intermediate Representation Edit in Large Vision-Language Models

ICLR 2026-01-01

该工作聚焦大型视觉语言模型的幻觉问题,提出一种幻觉感知的中间表征编辑(Intermediate Representation Edit)方法,在模型内部表征层面进行干预以抑制与图像不符的生成内容。其亮点是无需大规模重训即可缓解幻觉。对从业者而言,这为提升 VLM 在复杂场景理解中的可靠性与可信度提供了实用手段。

视觉语言模型幻觉抑制多模态表征编辑可信AI

Visual symbolic mechanisms: Emergent symbol processing in Vision Language Models

ICLR 2026-01-01

该研究探讨视觉语言模型中涌现出的符号处理机制,关注模型如何通过特征绑定将单个物体表示出来,从而区分如「红色方块」等组合场景。论文揭示了 VLM 内部存在类符号的视觉处理机制。对从业者而言,这有助于理解模型的可解释性与组合表征能力,为改进视觉推理设计提供洞见。

视觉语言模型符号处理可解释性特征绑定多模态涌现能力

WebArbiter: A Generative Reasoning Process Reward Model for Web Agents

ICLR 2026-01-01

WebArbiter 提出一种用于 Web 智能体的生成式推理过程奖励模型(Process Reward Model),针对网页操作中长程、序列化且动作不可逆的决策场景,提供过程级而非仅结果级的奖励信号。其亮点在于通过推理过程评估来引导智能体行为。对从业者而言,这为训练更可靠、更安全的网页自动化 Agent 提供了关键的反馈机制。

AgentWeb智能体过程奖励模型强化学习长程决策自动化

WSVD: Weighted Low-Rank Approximation for Fast and Efficient Execution of Low-Precision Vision-Language Models

ICLR 2026-01-01

WSVD 提出一种加权低秩近似方法,用于加速并高效执行低精度视觉语言模型。相比传统 SVD,它通过加权方式更好地保留对模型输出重要的成分,从而在压缩计算负担的同时维持精度。对从业者而言,这有助于在图像描述等任务中降低 VLM 的计算与部署成本。

视觉语言模型低秩近似SVD模型压缩低精度推理优化

VGR: Visual Grounded Reasoning

ICLR 2026-01-01

VGR(视觉锚定推理)针对多模态思维链推理过度依赖纯语言空间、易受语言偏置影响的问题,提出将推理显式锚定到视觉证据上的方法。其亮点是让模型在推理过程中回溯并引用图像区域,减少凭空臆断。对从业者而言,这能提升多模态 CoT 推理的准确性与可解释性。

多模态思维链视觉锚定推理视觉语言模型语言偏置

OR-PRM: A Process Reward Model for Algorithmic Problem in Operations Research

ICLR 2026-01-01

提出 OR-PRM,首个面向运筹学(OR)算法问题的过程奖励模型,把大模型在数学推理中验证有效的「过程监督」范式迁移到运筹优化建模与求解场景。它对推理链的每一步给出奖励信号,从而提升大模型在 OR 任务上的可靠性。对从业者而言,这为用大模型自动完成运筹建模、定位推理错误提供了可落地的奖励建模思路。

大模型过程奖励模型运筹优化推理奖励建模

HiPO: Self-Hint Policy Optimization for RLVR

ICLR 2026-01-01

提出 HiPO(自提示策略优化),用于可验证奖励强化学习(RLVR)训练。其核心是让模型自行生成「提示」来引导自身的复杂推理过程,再结合可验证奖励进行策略优化,缓解纯结果奖励信号稀疏的问题。对从业者来说,这提供了一种无需额外人工标注即可增强大模型复杂问题求解能力的 RL 训练技巧。

大模型强化学习RLVR策略优化推理

LLMs as Rules Oracles: Exploring Real-World Multimodal Reasoning in Tabletop Strategy Game Environments

ICLR 2026-01-01

推出多模态推理基准 LudoBench,考察具备视觉能力的大模型能否在桌面策略游戏环境中获取、整合并推理异构的游戏规则知识,相当于让模型充当「规则裁判」。它测试模型把图像与文字规则结合做出判断的真实推理能力。对从业者而言,这为评估多模态模型在复杂规则理解与推理上的短板提供了贴近现实的测评工具。

多模态大模型推理评测基准测试视觉语言模型

Quantum-PEFT: Ultra parameter-efficient fine-tuning

ICLR引用量 13 2025-03-01

提出 Quantum-PEFT,利用量子计算思想实现超高参数效率的微调。与 LoRA 等加性方法不同,它通过量子化的参数表示以远少于常规方法的可训练参数完成模型适配。对从业者而言,这探索了一条用量子启发结构进一步压缩微调参数量的新路径,为极致参数高效微调提供前瞻性思路。

参数高效微调量子计算微调参数压缩LoRA
📖 阅读⬇ PDF

RandLoRA: Full-rank parameter-efficient fine-tuning of large models

ICLR引用量 37 2025-02-01

RandLoRA 针对 LoRA 类方法的低秩瓶颈,提出用固定随机基的线性组合来实现全秩参数高效微调,在保持可训练参数和显存优势的同时突破低秩近似对模型表达能力的限制。对从业者而言,它在视觉、语言及视觉-语言任务上缩小了与全量微调的性能差距,适合追求更高精度又受限于算力的场景。

大模型参数高效微调LoRA全秩适配微调显存优化
📖 阅读⬇ PDF

MA-RLHF: Reinforcement Learning from Human Feedback with Macro Actions

ICLR引用量 12 2024-10-01

MA-RLHF 在基于人类反馈的强化学习中引入宏动作(macro action),以缓解 token 级 RLHF 中长序列带来的信用分配难题。核心亮点是用更粗粒度的动作单元提升训练效率与对齐效果。对从业者而言,这为在长文本生成中更稳定高效地做偏好对齐提供了实用方案。

强化学习RLHF人类反馈对齐信用分配
📖 阅读⬇ PDF

Zeroth-Order Policy Gradient for Reinforcement Learning from Human Feedback without Reward Inference

ICLR引用量 13 2024-09-01

该研究提出无需奖励推断的零阶策略梯度方法用于 RLHF,绕过先训练奖励模型这一中间环节,直接基于人类偏好优化大模型。核心贡献是用零阶优化简化 RLHF 流程并避免奖励模型偏差。对从业者而言,这降低了对齐流程的复杂度,减少奖励模型误差累积带来的风险。

强化学习RLHF零阶优化策略梯度人类偏好
📖 阅读⬇ PDF

RazorAttention: Efficient KV Cache Compression Through Retrieval Heads

ICLR引用量 90 2024-07-01

RazorAttention 利用模型中的「检索头」自动识别对长上下文推理最关键的关键值(KV)令牌,并只保留这些令牌的缓存,从而大幅压缩 KV 缓存占用。该方法在几乎不损失模型性能的前提下显著降低显存开销,为长上下文大语言模型的高效部署提供了新思路。对需要处理超长文本的从业者而言,它能有效缓解显存瓶颈,提升推理吞吐。

KV缓存压缩检索头长上下文推理大语言模型显存优化推理效率
📖 阅读⬇ PDF

Safe RLHF: Safe Reinforcement Learning from Human Feedback

ICLR引用量 715 2023-10-01

Safe RLHF提出在人类反馈强化学习中显式解耦有用性与无害性两个目标,通过安全约束优化在性能与安全间取得平衡。它将安全作为约束条件引入对齐训练,缓解二者固有的目标冲突。对从业者而言,这为构建既高性能又可控安全的大模型提供了可落地的方法。

大模型RLHFAI安全对齐约束优化无害性
📖 阅读⬇ PDF

PARL: A Unified Framework for Policy Alignment in Reinforcement Learning from Human Feedback

ICLR引用量 43 2023-08-01

PARL提出一个基于双层优化的统一框架,用于解决RLHF中的策略对齐问题。它将奖励学习与策略优化纳入统一的双层结构,从理论上刻画并改善对齐效果。对从业者而言,这为分析和提升对齐算法的一致性提供了系统化的优化视角。

大模型RLHF策略对齐双层优化统一框架强化学习
📖 阅读⬇ PDF

Parameter-Efficient Fine-Tuning Design Spaces

ICLR引用量 82 2023-01-01

该工作系统研究参数高效微调的设计空间,将Adapter、prefix tuning、BitFit、LoRA等策略拆解为可组合的设计维度并加以探索,旨在用更少可训练参数逼近全量微调效果。其贡献是提炼出跨方法的通用设计原则而非单一新方法。对从业者而言,提供了如何配置和组合PEFT模块的实践指导。

参数高效微调PEFT设计空间LoRABitFitprefix-tuning
📖 阅读⬇ PDF

ICML 9 条

Native Active Perception as Reasoning for Omni-Modal Understanding

ICML 2026CCF-A推荐 2026-06-18Agent

OmniAgent 是一个全模态智能体,通过迭代式「观察—思考—行动」的主动感知循环处理长视频理解,依靠高效选择性处理以小博大,超过更大的模型。该工作示范了将主动感知作为推理来做的范式,对多模态 Agent 从业者有启发。

多模态智能体主动感知长视频理解OmniAgent
📖 阅读⬇ PDF

KVTuner: Sensitivity-Aware Layer-wise Mixed Precision KV Cache Quantization for Efficient and Nearly Lossless LLM Inference

ICML引用量 30CCF-A推荐 2025-02-01

KVTuner 提出一种感知敏感度的逐层混合精度 KV 缓存量化方法,旨在实现高效且近乎无损的 LLM 推理。通过分析各层对量化的敏感度并分配不同位宽,大幅改善长上下文和大批量场景下的吞吐与延迟。对需要部署高性能 LLM 的工程师极其重要。

KV缓存量化混合精度敏感度感知LLM推理显存优化量化
📖 阅读⬇ PDF

Parameter-Efficient Fine-Tuning with Discrete Fourier Transform

ICML引用量 77CCF-A推荐 2024-05-01

FourierFT 提出用离散傅里叶变换实现参数高效微调:不直接学习低秩矩阵,而是学习权重增量在频域中的少量谱系数,再经逆变换恢复出稠密更新。在保持甚至超越 LoRA 性能的同时大幅压缩可训练参数量,为多任务、多用户场景下的轻量化存储与部署提供了新路径。

参数高效微调离散傅里叶变换频域LoRA参数压缩
📖 阅读⬇ PDF

Dense Reward for Free in Reinforcement Learning from Human Feedback

ICML引用量 78CCF-A推荐 2024-02-01

该工作指出 RLHF 中的奖励模型其实可以免费提供稠密奖励:利用奖励模型内部的注意力权重,把通常只在序列末尾给出的稀疏标量奖励重新分配到每个 token 上,得到逐 token 的稠密信号。这种稠密奖励能稳定并加速策略优化,对做 RLHF 对齐与训练效率优化的从业者是一个低成本可落地的改进。

大模型强化学习RLHF奖励建模稠密奖励模型对齐
📖 阅读⬇ PDF

A Minimaximalist Approach to Reinforcement Learning from Human Feedback

ICML引用量 155CCF-A推荐 2024-01-01

论文提出自博弈偏好优化 SPO,一种极简的 RLHF 算法:无需训练奖励模型,也无需不稳定的对抗式训练,而是通过自博弈直接从偏好中优化策略,并能自然处理非传递的偏好关系。它在简化对齐流程的同时具备理论收敛性,对希望降低 RLHF 工程复杂度的团队很有吸引力。

强化学习RLHF偏好优化自博弈模型对齐极简算法
📖 阅读⬇ PDF

RoSA: Accurate Parameter-Efficient Fine-Tuning via Robust Adaptation

ICML引用量 55CCF-A推荐 2024-01-01

RoSA 提出鲁棒适配的参数高效微调方法:在低秩适配之外再引入一条稀疏分量,用「低秩加稀疏」的组合来逼近全量微调所需的权重更新,从而在相同参数预算下显著提升精度。它在受限算力与显存下逼近全量微调效果,对追求高精度又要省资源的从业者很实用。

大模型参数高效微调低秩适配稀疏微调鲁棒适配显存优化
📖 阅读⬇ PDF

Iterative Preference Learning from Human Feedback: Bridging Theory and Practice for RLHF under KL-constraint

ICML引用量 372CCF-A推荐 2023-12-01

本文研究RLHF在KL约束下的对齐过程,指出离线方法的核心局限,并提出弥合理论与实践的迭代式偏好学习框架。它从理论上分析了KL正则化下的偏好优化,为RLHF提供了更扎实的算法保证。对从业者而言,这有助于设计更稳定、样本利用更高效的对齐流程。

大模型RLHF偏好学习KL约束对齐理论分析
📖 阅读⬇ PDF

Nash Learning from Human Feedback

ICML引用量 229CCF-A推荐 2023-12-01

该工作提出从人类反馈中进行纳什学习(NLHF),将对齐建模为博弈论中寻找偏好的纳什均衡,而非依赖单一奖励模型。这种方式避免了传统奖励建模在偏好不一致或非传递时的偏差。对从业者而言,它为处理复杂、相互冲突的人类偏好提供了更鲁棒的对齐范式。

大模型RLHF纳什均衡博弈论偏好建模对齐
📖 阅读⬇ PDF

ISCA 1 条

快手 46 条

Denoising Implicit Feedback for Cold-start Recommendation

快手 2026-06-17

论文针对隐式反馈普遍存在的噪声(如标题党、位置偏差)以及冷启动场景,提出去噪方法以提升推荐质量。核心贡献在于通过显式建模噪声信号或因果去偏,增强冷启动用户和物品的表征学习,对工业推荐系统鲁棒性有直接价值。

推荐系统隐式反馈去噪冷启动噪声处理协同过滤因果去偏
📖 阅读⬇ PDF

Atomic Intent Reasoning: Bringing LLM Semantics to Industrial Cross-Domain Recommendations

快手 2026-06-09

本研究将大模型语义引入工业跨域推荐,提出「原子意图推理」框架,从内容域的用户交互中分解出细粒度的购买意图原子,再映射到电商域。该方法解决了内容到电商跨域推荐的语义鸿沟,显著提升了线上转化率预估精度。

跨域推荐原子意图推理大模型语义工业推荐内容到电商用户意图
📖 阅读⬇ PDF

Taiji: Pareto Optimal Policy Optimization with Semantics-IDs Trade-off for Industrial LLM-Enhanced Recommendation

快手 2026-06-02

提出 Taiji 方法,用帕累托最优策略优化来平衡大模型的语义空间与推荐系统的 ID 空间,解决后训练阶段的对齐难题。实现了工业级 LLM 增强推荐的有效扩展,兼顾语义理解与 ID 特征。对构建高效大模型推荐系统的工程师有重要参考价值。

推荐系统大模型帕累托优化语义ID策略优化工业落地
📖 阅读⬇ PDF

Action-Aware Generative Sequence Modeling for Short Video Recommendation

快手 2026-04-28

提出动作感知的生成式序列模型用于短视频推荐,显式建模用户观看、点赞、评论等行为序列以及视频的多模态内容。它利用生成式范式捕捉复杂交互偏好,并支持更准确的下一个视频预测,对齐当前平台追求精细化兴趣理解的需求。

短视频推荐动作感知序列建模生成模型用户交互多模态推荐
📖 阅读⬇ PDF

KAT-Coder-V2 Technical Report

快手 2026-03-29

快手 KwaiKAT 团队的 KAT-Coder-V2 技术报告提出一种智能体编码模型,采用先专业化再统一的范式,将编码任务拆分为五个专家领域分别训练再融合。其亮点是兼顾专精能力与统一调度。对从业者而言,它为构建高性能编码 Agent 与提升自动化编程能力提供了可借鉴的训练思路。

编码大模型Agent代码生成混合专家自动化编程模型训练
📖 阅读⬇ PDF

FlashEvaluator: Expanding Search Space with Parallel Evaluation

快手 2026-03-03

FlashEvaluator提出并行评估扩展生成器-评估器框架的搜索空间,用快速并行评估替代传统串行打分。该方法能在大规模推荐与生成任务中显著提升候选序列的评估效率与质量上限,对从业者优化G-E框架的延迟与效果具有直接参考价值。

生成器-评估器并行评估搜索空间推荐系统推理加速候选生成
📖 阅读⬇ PDF

SOLAR: SVD-Optimized Lifelong Attention for Recommendation

快手 2026-03-03

SOLAR利用SVD优化终身注意力机制,通过低秩分解将长序列自注意力的复杂度从平方降至近线性。该方法解决了Transformer在长序列推荐中的显存和时间瓶颈,使工业级长序列建模成为可能,对基于注意力的推荐模型部署至关重要。

终身注意力SVD优化长序列推荐Transformer显存优化低秩分解
📖 阅读⬇ PDF

Stop Treating Collisions Equally: Qualification-Aware Semantic ID Learning for Recommendation at Industrial Scale

快手 2026-02-28

提出碰撞感知的语义ID学习,强调不同碰撞对推荐性能的影响不同,设计资格感知的语义ID构建方案。该工作在美团等工业规模多模态推荐中提升了离散表示的质量,为统一ID式和生成式推荐提供了更可靠的语义抽象。

语义ID碰撞感知多模态推荐离散表示工业推荐生成式推荐
📖 阅读⬇ PDF

Generative Recommendation for Large-Scale Advertising

快手 2026-02-26

面向大流量广告场景的生成式推荐系统,解决实时部署时的效率与容量挑战。该方法结合生成模型与推荐策略,实现在线毫秒级生成推荐,为互联网广告平台在规模化与模型能力之间取得平衡提供了实践方案。

生成式推荐广告推荐实时推理规模化工业部署推荐系统
📖 阅读⬇ PDF

CroPS: Improving Dense Retrieval with Cross-Perspective Positive Samples in Short-Video Search

快手 2025-11-19

CroPS针对短视频搜索中密集检索的自增强训练易引入简单正样本问题,提出跨视角正样本构造方法,融合视觉、文本等多视角生成难正样本以增强对比学习。核心提升检索模型对语义相似但表面不匹配内容的召回能力。对短视频搜索和推荐相关从业者可改善长尾内容发现。

密集检索短视频搜索正样本跨视角对比学习
📖 阅读⬇ PDF

LLM-Aligned Geographic Item Tokenization for Local-Life Recommendation

快手 2025-11-18

本文提出LLM对齐的地理物品分词方法,将地理位置信息融入大语言模型的token化过程,使LLM能原生理解空间属性以优化本地生活推荐。贡献在于打通地理信号与语义模型的鸿沟,提升位置相关推荐准确性。对本地生活服务、地图类应用从业者提供了LLM落地新思路。

大模型地理信息物品分词本地推荐生活服务
📖 阅读⬇ PDF

GReF: A Unified Generative Framework for Efficient Reranking via Ordered Multi-token Prediction

快手 2025-10-29

GReF将推荐重排序建模为有序多token预测的生成任务,设计统一生成式框架以高效探索物品序列组合空间。亮点在于将组合优化转化为自回归生成,大幅提升寻优效率。对多阶段推荐系统从业者,该框架有望平衡重排效果与计算开销。

推荐系统重排序生成式模型多token预测序列优化
📖 阅读⬇ PDF

MPFormer: Adaptive Framework for Industrial Multi-Task Personalized Sequential Retriever

快手 2025-08-28

提出 MPFormer 自适应框架,解决工业级多任务个性化序列召回中多阶段优化语义不一致问题。核心贡献是统一多目标召回与后续排序的对齐,提升全链路一致性。对从业者而言,该框架可直接嵌入现有推荐系统,弥合召回与精排阶段的优化裂痕。

多任务学习召回模型序列推荐工业推荐系统个性化多阶段对齐
📖 阅读⬇ PDF

DiffusionGS: Generative Search with Query Conditioned Diffusion in Kuaishou

快手 2025-08-25

提出了 DiffusionGS,一种基于查询条件扩散模型的生成式个性化搜索方法。核心亮点是将扩散过程引入搜索排序,直接生成与用户意图匹配的搜索结果,突破了传统判别式排序的局限。对于电商和短视频平台,该方法有望提升长尾查询下的搜索体验与转化率。

扩散模型生成式搜索查询条件个性化搜索快手排序系统
📖 阅读⬇ PDF

OneLoc: Geo-Aware Generative Recommender Systems for Local Life Service

快手 2025-08-20

提出 OneLoc,一个面向本地生活服务的地理感知生成式推荐系统。该方法将店铺位置信息显式融入视频推荐,解决了地理位置与内容兴趣的联合建模难题。对本地生活推荐场景具有直接落地价值,能提升门店到访和线上转化。

地理感知生成式推荐本地生活服务视频推荐快手位置建模
📖 阅读⬇ PDF

UniECS: Unified Multimodal E-Commerce Search Framework with Gated Cross-modal Fusion

快手 2025-08-19

提出 UniECS,一个带门控跨模态融合的统一多模态电商搜索框架。核心贡献在于打破固定模态配对的限制,支持任意模态组合下的统一检索,并引入门控机制动态融合多模态信息。为电商搜索提供了可扩展且全面的多模态基线,减少了重复开发成本。

多模态电商搜索跨模态融合门控机制统一框架检索系统
📖 阅读⬇ PDF

KuaiLive: A Real-time Interactive Dataset for Live Streaming Recommendation

快手 2025-08-07

发布了 KuaiLive,一个面向直播推荐的大规模实时交互数据集。该数据集捕捉了直播中动态内容、实时互动及用户即时反馈,弥补了现有数据集实时性不足的缺陷。为研究者在直播场景下的行为建模、在线学习等方向提供了关键基准。

直播推荐数据集实时交互用户行为快手推荐系统
📖 阅读⬇ PDF

KLAN: Kuaishou Landing-page Adaptive Navigator

快手 2025-07-31

该工作针对多页面架构平台,提出快手落地页自适应导航器 KLAN,通过两阶段交互范式动态调整导航策略,提升用户跨页面转化效率。核心贡献在于平衡全域一致性与页面个性化,显著优化了多页面场景下的用户体验和业务指标。对于需要在复杂多页面环境中做流量分发的从业者,该方法提供了可落地的自适应导航方案。

推荐系统落地页优化自适应导航多页面架构用户转化快手
📖 阅读⬇ PDF

GREAT: Guiding Query Generation with a Trie for Recommending Related Search about Video at Kuaishou

快手 2025-07-21

本文提出 GREAT 方法,利用 Trie 树结构引导查询生成,为快手短视频场景自动推荐相关搜索词,从而在用户浏览时更好地满足信息获取需求。其亮点在于通过高效的前缀树约束生成高质量、多样化的搜索建议,解决了短视频场景下相关搜索推荐的实时性和相关性难题。对从事视频内容发现与搜索推荐的工程师来说,提供了一种兼顾效率和效果的查询推荐范式。

短视频相关搜索查询生成Trie树推荐系统快手
📖 阅读⬇ PDF

KAT-V1: Kwai-AutoThink Technical Report

快手 2025-07-11

发布Kwaipilot-AutoThink(KAT),一个开源40B参数大语言模型,针对推理密集型任务中的「过度思考」问题。核心贡献是自动思考训练范式,按需减少不必要的推理步骤。对从业者而言可提升推理效率、降低计算成本。

大模型推理优化过度思考开源模型训练范式
📖 阅读⬇ PDF

Personalized Query Auto-Completion for Long and Short-Term Interests with Adaptive Detoxification Generation

快手 2025-05-27

提出一种自适应去毒化生成的个性化查询自动补全方法,融合用户长期和短期兴趣,在生成补全建议时动态消除有害或不恰当内容。该方法平衡个性化与安全性,对提升现代搜索引擎的用户体验有实际意义。

查询自动补全个性化长短期兴趣自适应去毒搜索系统生成模型
📖 阅读⬇ PDF

Generate the browsing process for short-video recommendation

快手 2025-04-02

该工作提出一种生成式方法,动态模拟用户在短视频推荐中的浏览过程,用于预测观看时长。区别于依赖多模态特征的传统方法,生成式模拟能更灵活地捕获用户观看旅程,为短视频推荐系统提供新的建模视角。

短视频推荐生成式模型用户浏览模拟观看时长预测推荐系统
📖 阅读⬇ PDF

Generative Regression Based Watch Time Prediction for Short-Video Recommendation

快手 2024-12-28

本文针对短视频推荐中的观看时长预测问题,提出一种生成式回归方法。通过将观看时长建模为连续交互并采用生成式损失,能够更精细地捕捉用户参与程度。该方法为推荐系统提供了更精准的用户黏性信号,有助于优化排序策略和提升平台收益。

观看时长预测生成式回归短视频推荐用户参与度排序优化
📖 阅读⬇ PDF

GAS: Generative Auto-bidding with Post-training Search

快手 2024-12-22

GAS 提出结合生成式出价与训练后搜索的自动出价方法,广告主可调节条件以生成最优出价。该方法在训练后通过搜索优化条件,灵活平衡成本与效果,大幅提升广告投放效率。这为在线广告自动出价提供了一种高效且可解释的解决方案,对广告平台收入优化具有直接价值。

生成式自动出价训练后搜索在线广告竞价优化广告技术
📖 阅读⬇ PDF

CRM: Retrieval Model with Controllable Condition

快手 2024-12-18

CRM 提出一种支持可控条件的检索模型,用于推荐系统召回阶段,可根据业务需求动态调整召回策略。通过注入条件信号,模型能同时优化相关性和商业目标,如内容多样性或特定类目曝光。这为工业级推荐系统提供了更灵活的变现和用户体验平衡方案。

检索模型可控条件推荐系统召回阶段业务目标
📖 阅读⬇ PDF

Adaptive$^2$: Adaptive Domain Mining for Fine-grained Domain Adaptation Modeling

快手 2024-12-11

Adaptive² 提出自适应域挖掘方法,自动从数据中学习细粒度域划分,用于域适应建模。与依赖人工定义域不同,该方法动态发现数据分布差异,从而更精细地适应不同广告场景。该技术能有效缓解多域数据漂移问题,提升广告点击率和转化率预估的跨域泛化能力。

域适应细粒度域挖掘广告系统多域建模自适应
📖 阅读⬇ PDF

KuaiFormer: Transformer-Based Retrieval at Kuaishou

快手 2024-11-15

提出KuaiFormer,一种基于Transformer的检索模型,用于快手大规模内容推荐,替换传统检索方法,直接处理海量候选项以提升召回效率,为推荐系统检索阶段提供新范式。

Transformer检索推荐系统召回快手大规模推荐
📖 阅读⬇ PDF

TWIN V2: Scaling Ultra-Long User Behavior Sequence Modeling for Enhanced CTR Prediction at Kuaishou

快手 2024-07-23

TWIN V2 在快手超长用户行为序列建模场景下,扩展了对长期兴趣的建模能力,以增强 CTR 预测。核心贡献是提出可扩展的架构,有效处理数万长度级别的行为序列,同时控制计算开销。这对大规模推荐系统捕捉长期依赖具有重要实用价值。

CTR预测长序列建模用户行为序列快手推荐系统扩展性
📖 阅读⬇ PDF

MMBee: Live Streaming Gift-Sending Recommendations via Multi-Modal Fusion and Behaviour Expansion

快手 2024-06-15

MMBee 针对直播场景的虚拟礼物推荐,提出多模态融合与行为扩展方法,综合视频、音频、文本弹幕及用户行为等多源信号进行精细建模。通过多模态Transformer与行为序列扩展,显著提升了礼物推荐的相关性和实时性。对直播电商及内容平台从业者,该技术能有效提高用户付费转化和互动深度。

直播推荐多模态融合礼物推荐行为扩展实时推荐用户建模
📖 阅读⬇ PDF

TIM: Temporal Interaction Model in Notification System

快手 2024-06-11

TIM 为移动应用的通知系统引入时间交互模型,显式建模用户在不同时间窗口对通知的反应模式,并据此优化发送时机。该模型结合时序注意力机制,捕捉周期性行为与瞬间兴趣,从而在合适时刻推送以最大化用户活跃度。对App运营和用户增长团队,它能减少骚扰感、提升留存和DAU。

通知系统时间交互模型用户活跃度时序建模移动应用推送优化
📖 阅读⬇ PDF

Enhancing Sequential Recommender with Large Language Models for Joint Video and Comment Recommendation

快手 2024-03-20

提出结合大语言模型的序列推荐方法,能够同时为用户推荐视频及其相关评论,突破传统推荐仅关注视频的局限。通过LLM的丰富语义理解,模型可捕捉视频与评论文本的细粒度关系,从而提升推荐的多样性和用户参与度。对于视频平台,该方案为内容生态系统提供了新的流量分配思路,具有显著商业价值。

联合推荐大语言模型序列推荐视频推荐评论推荐多模态
📖 阅读⬇ PDF

Ensure Timeliness and Accuracy: A Novel Sliding Window Data Stream Paradigm for Live Streaming Recommendation

快手 2024-02-22

该论文提出一种面向直播推荐的滑动窗口数据流处理范式,能动态平衡数据的时效性和模型训练的准确性。通过增量更新和窗口衰减机制,系统可在极低延迟下捕捉内容热度变化,同时避免灾难性遗忘。对于实时性要求高的直播平台,该方案可显著提升推荐点击率与用户观看时长。

直播推荐滑动窗口数据流处理实时推荐模型时效性增量学习
📖 阅读⬇ PDF

Non-autoregressive Generative Models for Reranking Recommendation

快手 2024-02-10

提出非自回归生成模型用于推荐重排序,通过并行解码加速生成候选项目序列,提升多阶段推荐系统的效率与效果。相比传统自回归排序,该方法在保持排序质量的同时大幅降低推理延迟,对需实时服务的推荐从业者具有重要实用价值。

非自回归模型推荐重排序生成模型多阶段推荐并行解码
📖 阅读⬇ PDF

Multi-Epoch Learning for Deep Click-Through Rate Prediction Models

快手 2023-05-31

针对工业级点击率预测模型普遍存在的单轮过拟合问题,提出多轮训练学习框架,通过延长训练周期提升模型表现。核心贡献在于揭示了多轮训练对CTR模型的增益机制,为从业者提供了实用的训练策略以缓解性能退化。

点击率预测多轮训练过拟合深度学习推荐系统工业应用
📖 阅读⬇ PDF

Kuaipedia: a Large-scale Multi-modal Short-video Encyclopedia

快手 2022-10-28

构建了大规模多模态短视频百科全书Kuaipedia,整合视频、文本等模态的结构化知识。亮点在于为短视频理解与检索提供百科全书式知识库,弥补传统文本百科的多模态不足。对从业者,可用于增强视频搜索、推荐与内容生成等下游应用。

短视频多模态百科全书知识库视频理解大规模数据集
📖 阅读⬇ PDF

Billion-user Customer Lifetime Value Prediction: An Industrial-scale Solution from Kuaishou

快手 2022-08-29

提出了快手面向十亿级用户的客户生命周期价值LTV预测工业级解决方案。核心是设计大规模分布式深度学习模型,高效处理海量行为数据以准确估算长期收益。该方案为广告投放、用户留存等运营决策提供关键量化依据,对大规模推荐与商业化系统意义重大。

客户生命周期价值LTV预测大规模推荐深度学习工业级系统快手
📖 阅读⬇ PDF

Concept-Aware Denoising Graph Neural Network for Micro-Video Recommendation

快手 2021-09-28

针对微视频推荐,提出概念感知的去噪图神经网络,通过利用视频概念信息和去除交互噪声提升推荐准确性。核心贡献在于将高层语义概念引入图学习,并设计去噪机制应对短时流量和内容多样性。对短视频平台推荐算法工程师,该方法有助于解决数据稀疏和噪声问题。

微视频推荐图神经网络去噪概念感知推荐系统短视频
📖 阅读⬇ PDF

Ensemble Chinese End-to-End Spoken Language Understanding for Abnormal Event Detection from audio stream

快手 2020-10-19

提出集成式中文端到端口语理解方法,直接从音频流中检测异常事件,跳过分步ASR和NLU的级联误差。核心贡献在于联合优化语音识别和意图理解,并利用集成学习提升鲁棒性。对音频监控、客服质检等场景,实现了更高效的流式异常事件检测。

口语理解端到端异常事件检测集成学习中文语音音频流
📖 阅读⬇ PDF

llama.cpp 13 条

b9747

动态 2026-06-21Infra

「llama.cpp」b9747 版为服务端新增通过 /models/sse 实时跟踪模型加载进度的能力,并完善路由通知的并发处理与文档。对自建本地推理服务的人,改善了模型加载阶段的可观测性。

大模型本地推理llama.cpp服务端可观测性SSE

b9745

动态 2026-06-21推理优化

「llama.cpp」b9745 版为投机解码增加对「Step3.5/3.7」flash 「MTP」多头机制的支持,新增 mtp_layer_offset 等接口并改造多头草稿流程。对在本地端侧追求投机解码加速的开发者,是又一项推理提速的工程更新。

大模型投机解码推理优化llama.cppMTP端侧部署

b9744

动态 2026-06-21推理优化

「llama.cpp」b9744 版重构 until 类「GBNF」语法生成,改用 AC 自动机实现并补充多字符串测试。属于结构化输出/受限解码相关的底层改进,对依赖语法约束生成的应用有间接收益。

大模型结构化输出受限解码llama.cppGBNFAC自动机

b9736

动态 2026-06-20Infra

llama.cpp b9736 修复了 GLM-5.2 模型加载失败问题:该模型的 DSA『lightning indexer』只在部分层存在,而旧加载器在每层都强制创建五个 indexer 张量导致缺张量报错;现改为按可选张量加载(indexer 运行时尚未实现)。对在本地跑 GLM-5.2 GGUF 的用户是关键修复。

模型加载GLM-5.2GGUFbug 修复DSAindexer

b9735

动态 2026-06-20推理优化

llama.cpp b9735 优化了 CPU 上的 AMX 量化路径,将分区在 n_batch 乘 M 上展平以让每个线程都参与量化,在 Intel Xeon 上 prefill 吞吐提升约 7%。属 CPU 推理性能优化,对纯 CPU 部署有一定价值。

CPU推理AMX量化优化prefillIntel Xeon性能提升

b9738

动态 2026-06-20Infra

llama.cpp 发布 b9738,修复了 server 在 CORS 代理场景下会错误转发认证头的安全问题,避免凭证泄露。对自建大模型推理服务的部署者来说是一个值得关注的安全修复。

安全修复CORS认证头凭证泄露推理服务llama.cpp

b9739

动态 2026-06-20Infra

「llama.cpp」b9739 版本为 Windows 平台 OpenCL Adreno arm64 构建补上了缺失的发布链接,并覆盖 macOS、iOS、Linux、Android、Windows 多端及 Vulkan、ROCm、SYCL、OpenVINO 等后端。属常规发布工程维护,对跨平台部署本地推理的用户有打包完整性意义。

跨平台发布CI/CDOpenCLAdrenoWindows打包完整性

b9737

动态 2026-06-20Infra

「llama.cpp」b9737 版本为 s390x 架构的 Docker 构建预先打包了 Web UI,属于标注为「不发布」的构建工程改动。对在 IBM s390x 平台上容器化部署 llama.cpp 的用户有打包便利。

Dockers390xWeb UI构建工程容器部署IBM Z

b9733

动态 2026-06-20Infra

「llama.cpp」b9733 版本为其 WebGPU 后端在「Vulkan + NVIDIA」组合下新增了 F16 适配器开关,并覆盖多平台与多后端构建。属持续完善 WebGPU 推理路径的工程改进,为浏览器侧及异构 GPU 推理提供更精细的精度控制。

WebGPUVulkanNVIDIAF16多后端推理优化

b9743

动态 2026-06-20推理优化

「llama.cpp」b9743 版让「json-schema-to-grammar」的空白处理规则与解析器对齐。是约束生成「JSON」结构时减少边界问题的小修复,对做工具调用/结构化输出的开发者有帮助。

大模型结构化输出JSON-Schemallama.cpp工具调用受限解码

b9742

动态 2026-06-20Infra

「llama.cpp」b9742 版修复 hexagon 后端在 ssm-conv 权重上使用填充步幅的问题。属于面向高通 Hexagon 端侧加速的状态空间模型算子修复,对端侧部署「SSM」类模型的人是稳定性补丁。

端侧部署状态空间模型llama.cppHexagon算子修复SSM

b9723

动态 2026-06-19推理优化

llama.cpp 发布 b9723,为 Qwen3.5 与 3.6 增加「EAGLE3」推测解码草稿支持,并加入延迟边界检查点、恢复对混合模型的支持。EAGLE3 推测解码可显著提升解码吞吐,对本地高速推理的从业者有实际价值。

llama.cpp推测解码EAGLE3推理优化Qwen本地推理

b9717

动态 2026-06-19推理优化

llama.cpp 提交 b9717,为 Power10 平台的 Q8/Q4 MMA 量化矩阵乘法增加对 K 尾部(K 不被 kc 整除)的支持,使更多工作负载能走 MMA 内核、减少回退。属特定 CPU 架构的量化算子优化,受众较窄但属推理优化范畴。

llama.cpp量化矩阵乘法Power10推理优化算子优化

蚂蚁 16 条

AtlasVA: Self-Evolving Visual Skill Memory for Teacher-Free VLM Agents

arXiv 2026-05-01

AtlasVA 提出一种自演化的视觉技能记忆,让 VLM 智能体在无需教师示范的情况下,将经验存储为可重用的视觉-语言技能而非纯文本。该方法通过强化学习在线构建与更新技能库,显著提升长程任务中的样本效率与泛化能力。对从业者而言,它降低了构建自适应智能体对人工标注的依赖,并提供了一种从交互中持续成长的新范式。

视觉语言模型智能体强化学习技能记忆自演化无教师学习
📖 阅读⬇ PDF

NES: An Instruction-Free, Low-Latency Next Edit Suggestion Framework Powered by Learned Historical Editing Trajectories

蚂蚁 2025-08-04

提出 NES,一种基于历史编辑轨迹学习的免指令、低延迟下一编辑建议框架。它不依赖自然语言指令,直接从开发者的编辑流中预测后续代码修改,大幅降低交互延迟与认知打断。对 IDE 工具开发者而言,可集成此方案提升编程流畅度与采纳率。

代码编辑下一编辑建议免指令低延迟历史轨迹AI编程
📖 阅读⬇ PDF

TierBase: A Workload-Driven Cost-Optimized Key-Value Store

蚂蚁 2025-05-10

提出TierBase,一种基于工作负载驱动的成本优化键值存储系统,通过空间-性能成本模型动态选择存储介质。该系统可在保证性能的同时显著降低存储成本,适用于数据密集型应用。

键值存储成本优化工作负载驱动存储分层数据密集型
📖 阅读⬇ PDF

SCOOT: SLO-Oriented Performance Tuning for LLM Inference Engines

蚂蚁 2024-08-08

SCOOT 提出面向服务等级目标(SLO)的 LLM 推理引擎性能自动调优方法,旨在满足延迟、吞吐等约束。核心贡献是设计了一个面向 SLO 的调优框架,可动态调整推理参数以在保障服务质量的同时最大化资源效率。这对从业者部署生产级 LLM 服务具有直接参考价值。

LLM推理SLO优化性能调优推理引擎自动参数调整
📖 阅读⬇ PDF

SQLfuse: Enhancing Text-to-SQL Performance through Comprehensive LLM Synergy

蚂蚁 2024-07-19

SQLfuse 通过综合协同多个 LLM 的能力(如代码生成、语义校验等)来提升 Text-to-SQL 任务表现。该方法不再依赖单一大模型,而是设计协同流程互补增强,提高复杂查询的转换准确率。这为构建高可靠性的自然语言数据库查询接口提供了新思路。

Text-to-SQLLLM协同语义解析多模型融合自然语言处理代码生成
📖 阅读⬇ PDF

AntBatchInfer: Elastic Batch Inference in the Kubernetes Cluster

蚂蚁 2024-04-15

提出AntBatchInfer,一个在Kubernetes集群上的弹性批量推理系统,通过动态资源伸缩解决大规模离线推理的稳定性与性能瓶颈。核心贡献在于实现了推理任务的自动弹性调度和容错,显著提升了推理吞吐量并降低资源浪费。对于工业级AI应用,该方案可大幅简化运维并优化推理成本。

离线推理弹性调度Kubernetes批量推理资源优化深度学习
📖 阅读⬇ PDF

AntDT: A Self-Adaptive Distributed Training Framework for Leader and Straggler Nodes

蚂蚁 2024-04-15

AntDT是一种自适应分布式训练框架,能够动态检测和缓解集群中的慢节点(Straggler)问题,通过优化任务分配与通信策略提升训练效率。其关键创新在于无需人工干预的弹性调度机制,使大规模训练更稳定且加速明显。对于需频繁进行分布式训练的团队,该框架可有效降低算力浪费和训练耗时。

分布式训练Straggler缓解自适应调度Parameter ServerAllReduce训练加速
📖 阅读⬇ PDF

Couler: Unified Machine Learning Workflow Optimization in Cloud

蚂蚁 2024-03-12

Couler提出了一种云原生的统一机器学习工作流优化框架,能以声明式方式定义复杂的ML管道,并自动进行跨平台的资源调度与优化。其核心亮点在于支持多种工作流引擎和大规模集群下的动态执行,显著降低了上云门槛和运维成本。对于企业级AI应用,该工具可加速从研发到产品的迭代效率。

ML工作流云原生统一调度自动化优化流水线资源管理
📖 阅读⬇ PDF

From Beginner to Expert: Modeling Medical Knowledge into General LLMs

蚂蚁 2023-12-02

将医学知识系统性地融入通用大语言模型,使模型从通用对话者进化为专业医疗助手,缓解LLM在临床知识、诊断推理等方面的不足。该方法为医疗AI落地提供了可行的知识增强路径,对医疗问答、辅助诊断等应用意义重大。

大语言模型医学知识注入领域迁移医疗AI知识增强
📖 阅读⬇ PDF

HGV4Risk: Hierarchical Global View-guided Sequence Representation Learning for Risk Prediction

蚂蚁 2022-11-15

提出层次化全局视图引导的序列表示学习方法HGV4Risk,用于风险预测时间序列建模。核心是引入层次化全局视图捕捉长程依赖与结构信息,提升医疗、金融等场景的风险预估精度。对从业者,该方法能增强风险预警能力,改善健康管理与风控决策。

风险预测序列表示学习层次化模型全局视图时间序列医疗AI
📖 阅读⬇ PDF

Maxwell: a hardware and software highly integrated compute-storage system

蚂蚁 2021-12-21

提出 Maxwell 计算存储系统,通过软硬件高度融合设计,提升数据存储与处理效率。亮点是紧耦合架构减少了数据搬移开销,加速上层业务响应。对大数据和云基础设施团队,该系统提供了一种高性能的计算存储一体化方案。

计算存储软硬件协同系统架构数据处理存储系统
📖 阅读⬇ PDF

美团 62 条

HMAF: A Hierarchical Multi-Slot GD-RTB Allocation Framework

美团 2026-06-04

提出分层多槽位GD-RTB联合分配框架HMAF,同时优化保量合约与实时竞价广告在多槽位上的投放。该框架兼容多层级投放约束,并能端到端学习最优分配策略,为广告平台平衡保量与收益提供了更高效的解决方案。

保证投放实时竞价广告分配多槽位分层框架竞价优化
📖 阅读⬇ PDF

UME: A Unified Meta-Generalization Framework for Cross-Domain ETA

美团 2026-05-31

UME提出了统一元泛化框架,用于跨域即时物流ETA预测,解决不同城市、不同配送网络下模型难以泛化的痛点。通过元学习提取跨域共性知识并可快速适应新域,大幅提升末页预计到达时间的准确度,对即时配送效率优化至关重要。

ETA预测跨域泛化元学习即时物流统一框架配送优化
📖 阅读⬇ PDF

Meituan Merchant Business Diagnosis via Policy-Guided Dual-Process User Simulation

美团 2026-04-16

针对美团商家经营诊断,提出策略引导的双过程用户仿真方法,可模拟群体级用户行为以进行反事实评估。核心贡献是解决仿真器中的结构性问题,无需昂贵在线实验即可可信评估商家策略,对搜索推荐系统的离线评估与策略优化具有重要意义。

用户仿真反事实评估商家诊断策略引导推荐系统离线评测
📖 阅读⬇ PDF

LongCat-Next: Lexicalizing Modalities as Discrete Tokens

美团 2026-03-29

本文提出 LongCat-Next,将视觉等多模态信息词汇化(lexicalize)为离散 token,从而把下一 token 预测(NTP)范式扩展到多模态领域,统一到与语言相同的自回归建模框架。其亮点是简化多模态系统设计并沿用 NTP 的高效训练与推理。对从业者而言,便于构建统一的多模态理解与生成模型。

多模态离散token下一token预测自回归建模统一架构多模态生成
📖 阅读⬇ PDF

SnapMLA: Efficient Long-Context MLA Decoding via Hardware-Aware FP8 Quantized Pipelining

美团 2026-02-11

提出SnapMLA方法,针对DeepSeek的多头潜在注意力(MLA)架构,通过硬件感知的FP8量化流水线实现高效长上下文解码。核心贡献是把FP8注意力有效整合进MLA解码阶段,显著提升解码吞吐并降低显存占用。对部署长上下文大模型的工程实践至关重要。

大模型推理优化FP8量化长上下文显存优化KV-cache
📖 阅读⬇ PDF

LongCat-Flash-Thinking-2601 Technical Report

美团 2026-01-23

发布 LongCat-Flash-Thinking-2601 技术报告,介绍一个 5600 亿参数的开源混合专家(MoE)推理模型,具备出色的智能体推理能力。核心亮点是大规模 MoE 架构与强推理、Agent 能力的结合,并以开源形式发布。对于需要复杂推理和构建智能体应用的从业者,这是一个值得评估的高性能开源底座。

大模型混合专家MoE推理模型Agent开源模型
📖 阅读⬇ PDF

RIA: A Ranking-Infused Approach for Optimized listwise CTR Prediction

美团 2025-11-26

针对推荐重排序中将排序与重排解耦导致的列表端评价薄弱问题,提出RIA方法将排序信息注入重排模型以优化列表级CTR预测。核心贡献在于端到端地使重排模块感知排序信号,提升整体列表的点击率预估准确度。对推荐系统从业者能直接提升重排阶段线上效果。

推荐系统重排序CTR预测listwise排序注入
📖 阅读⬇ PDF

FITRep: Attention-Guided Item Representation via MLLMs

美团 2025-11-26

FITRep利用多模态大语言模型内部的注意力分布,生成能更好区分视觉文本相似物品的表示,缓解近似重复内容导致的体验下降。贡献在于发掘MLLMs注意力作为细粒度判别信息,无需额外标注即可提升物品嵌入质量。对电商、内容平台的物品去重和推荐具有实际价值。

多模态大模型物品表示注意力机制去重推荐系统
📖 阅读⬇ PDF

LongCat-Flash-Omni Technical Report

美团 2025-10-31

LongCat-Flash-Omni 是一个 5600 亿参数的开源全模态模型,在实时音频与视觉交互上表现出色,并采用课程式学习策略进行训练。对从业者而言,它为多模态实时交互的研究与部署提供了重要的开源参考。

全模态模型开源大模型实时交互音视频课程学习多模态
📖 阅读⬇ PDF

Bi-Level Decision-Focused Causal Learning for Large-Scale Marketing Optimization: Bridging Observational and Experimental Data

美团 2025-10-22

针对大规模营销资源分配,提出一种双层决策导向的因果学习方法,统一融合观测数据与实验数据。核心贡献是解决了传统两阶段方法忽略决策优化目标的问题,为从业者提供了更精准的效果预估与预算分配方案。

因果推断营销优化决策导向学习效果预估资源分配
📖 阅读⬇ PDF

UNO-Bench: A Unified Benchmark for Exploring the Compositional Law Between Uni-modal and Omni-modal in Omni Models

美团 2025-10-21

UNO-Bench是一个统一基准,用于系统评估全模态(omni)模型在单模态理解与多模态联合理解之间的组合规律。其核心贡献是揭示了不同模态如何组合会影响模型整体性能,并由此总结出可指导设计的组合规律(compositional law)。对构建更高效全模态大模型的从业者,它提供了选择模态配比与评估能力的参照。

全模态模型多模态基准测试组合规律模型评估
📖 阅读⬇ PDF

KP-Agent: Keyword Pruning in Sponsored Search Advertising via LLM-Powered Contextual Bandits

美团 2025-10-20

KP-Agent是一种由大语言模型驱动的上下文Bandit方法,用于赞助搜索广告中的关键词剪枝,可自动识别并移除低效关键词。核心贡献是将大模型的语义理解能力与上下文Bandit的在线探索决策能力结合,高效优化关键词集合并降低人工运营成本。对广告投放从业者,这是一套能提升投放效果与预算利用率的自动化工具。

大模型在线广告上下文BanditAgent搜索广告优化
📖 阅读⬇ PDF

Higher Satisfaction, Lower Cost: A Technical Report on How LLMs Revolutionize Meituan's Intelligent Interaction Systems

美团 2025-10-15

美团技术报告,介绍如何用大语言模型革新其智能交互(客服)系统,同时实现用户满意度提升与成本下降。亮点在于展示了LLM在真实大规模客服场景中的完整落地方案与实际收益。对从业者而言,这是理解企业级LLM应用与降本增效路径的实用参考。

大模型智能客服企业落地降本增效智能交互美团
📖 阅读⬇ PDF

SOP-Maze: Evaluating Large Language Models on Complicated Business Standard Operating Procedures

美团 2025-10-10

提出SOP-Maze基准,用于评估大模型在复杂商业标准操作流程(SOP)中的多步推理与决策能力,模拟真实业务场景并检验模型遵循流程、应对异常的表现。核心贡献是填补了商业流程类评测的空白。为开发更可靠的业务流程自动化Agent提供了重要评测工具。

大模型评测Agent标准操作流程推理能力业务自动化基准测试
📖 阅读⬇ PDF

Introducing LongCat-Flash-Thinking: A Technical Report

美团 2025-09-23

发布LongCat-Flash-Thinking技术报告,这是一个5600亿参数的开源混合专家(MoE)推理模型,通过精心设计的训练流程实现高效推理。其开源属性和强大推理性能对大规模MoE架构的研究与落地具有重要参考意义。

大模型混合专家推理模型开源模型MoE
📖 阅读⬇ PDF

LongCat-Flash Technical Report

美团 2025-09-01

发布LongCat-Flash技术报告,介绍一个5600亿参数的MoE语言模型,在保持计算效率的同时具备高级智能体(Agent)能力。它为大规模智能体应用提供了实用方案,对大模型部署与Agent系统开发具有重要参考价值。

大模型混合专家Agent计算效率模型部署
📖 阅读⬇ PDF

Generative Bid Shading in Real-Time Bidding Advertising

美团 2025-08-06

提出生成式出价遮蔽方法,用生成模型直接预测最优遮蔽出价,替代传统的两阶段「出价景观建模+启发式调整」流程。核心优势是端到端优化,避免分阶段误差累积,有效控制广告主成本。对程序化广告而言,该方法可提升实时竞价效率与 ROI。

出价遮蔽实时竞价生成式模型计算广告端到端优化广告投放
📖 阅读⬇ PDF

Generative Large-Scale Pre-trained Models for Automated Ad Bidding Optimization

美团 2025-08-04

利用大规模生成式预训练模型进行自动广告出价优化,以应对多样化的广告主目标与现实约束。该方法通过预训练捕获出价策略的通用模式,再适配至具体场景,实现了更平衡的整体出价性能。为构建通用自动竞价引擎提供了新范式,降低了策略定制成本。

自动竞价生成式模型预训练广告优化大规模强化学习
📖 阅读⬇ PDF

LocalGPT: Benchmarking and Advancing Large Language Models for Local Life Services in Meituan

美团 2025-06-03

LocalGPT 构建了面向美团本地生活服务场景的大语言模型全面基准,并在此基础上提出模型能力提升方案,涵盖理解、推理、服务推荐等任务。其贡献在于填补了本地生活领域 LLM 评测的空白,并给出了针对该垂直场景的适配与优化实践。对在本地生活、O2O 领域落地大模型的从业者具有直接参考价值。

大语言模型本地生活服务美团基准测试LLM应用垂直领域适配
📖 阅读⬇ PDF

Hidden Representation Clustering with Multi-Task Representation Learning towards Robust Online Budget Allocation

美团 2025-06-01

本文针对在线广告预算分配问题,提出基于隐表示聚类与多任务表示学习的鲁棒分配框架,通过捕获用户群组结构来增强策略的泛化能力和抗噪性。核心贡献在于将表示学习与预算分配决策深度融合,在复杂营销环境中实现更稳定的用户增长。对于从事计算广告和营销优化的从业者,该工作提供了一种能适应数据分布变化的高效鲁棒分配方案。

预算分配在线学习表示学习聚类多任务学习营销优化
📖 阅读⬇ PDF

Breaker: Removing Shortcut Cues with User Clustering for Single-slot Recommendation System

美团 2025-06-01

Breaker 方法针对单槽推荐中模型依赖简易快捷线索(shortcut)的问题,采用用户聚类来消除这种捷径偏差,迫使模型学习更本质的偏好表征。其创新在于通过聚类感知的训练策略切断虚假相关性,从而提升推荐系统的长期效果和公平性。对单槽或点式推荐系统开发者而言,这是一个有启发性的去偏训练技术。

推荐系统单槽推荐捷径学习用户聚类偏差消除点式建模
📖 阅读⬇ PDF

Balancing Efficiency and Effectiveness: An LLM-Infused Approach for Optimized CTR Prediction

美团 2024-12-09

本文提出一种融合大语言模型(LLM)的CTR预测方法,在引入丰富语义信息的同时,通过高效架构平衡推理开销。利用LLM理解用户和广告文本,显著提升点击率预估准确性,同时保持线上推理的延迟和资源可接受。该方法为广告系统注入语言智能提供了实用路径,兼顾效果与成本。

CTR预测大语言模型效率优化语义理解在线广告
📖 阅读⬇ PDF

Scene-wise Adaptive Network for Dynamic Cold-start Scenes Optimization in CTR Prediction

美团 2024-08-03

该文提出场景自适应网络,专门解决移动电商推荐中动态冷启动场景的 CTR 预测难题。通过感知不同上下文场景并自适应调整模型参数,有效缓解新场景下数据稀疏问题。这为位置敏感型推荐系统的冷启动优化提供了可落地的方案。

CTR预测冷启动场景自适应推荐系统移动电商动态优化
📖 阅读⬇ PDF

EXIT: An EXplicit Interest Transfer Framework for Cross-Domain Recommendation

美团 2024-07-29

EXIT 框架针对跨域推荐提出显式兴趣迁移机制,在美团等多业务场景下实现用户兴趣知识的可解释迁移。亮点是显式建模跨域兴趣对齐,避免负迁移,提升多域推荐准确性。对工业界需兼顾多业务线的推荐系统开发者意义重大。

跨域推荐兴趣迁移知识迁移美团推荐系统多业务场景
📖 阅读⬇ PDF

Decision Focused Causal Learning for Direct Counterfactual Marketing Optimization

美团 2024-07-18

本文提出决策导向的因果学习方法,直接面向反事实营销优化中的预算分配问题进行建模。亮点是将因果推断与决策优化联合,模型学习时直接最大化营销效果,而非先估计再优化。这对需要精准投放和预算分配的平台极具落地意义。

因果学习营销优化反事实推断决策导向预算分配因果推断
📖 阅读⬇ PDF

Harvesting Efficient On-Demand Order Pooling from Skilled Couriers: Enhancing Graph Representation Learning for Refining Real-time Many-to-One Assignments

美团 2024-06-20

本文针对按需外卖配送中的实时多对一订单池化问题,提出通过增强图表示学习来利用熟练骑手特征与订单关联,优化派单决策。核心贡献在于构建了能捕捉骑手技能和动态订单关系的图模型,从而提升池化效率和配送时效。对物流调度和即时配送平台的算法工程师有重要借鉴意义,可直接改善配送成本和用户体验。

图表示学习多对一分配按需外卖订单池化实时调度配送优化
📖 阅读⬇ PDF

Negation Triplet Extraction with Syntactic Dependency and Semantic Consistency

美团 2024-04-15

该论文首次提出否定三元组抽取任务,同时识别否定线索、范围和主语,弥补了现有方法忽略否定的主体的缺陷。通过融合句法依赖结构与语义一致性约束,模型能更精准地捕捉否定语义,在多个基准上取得最佳性能。对于情感分析、信息抽取等NLP应用,该技术可增强对否定表达的深层理解,提升下游模型鲁棒性。

否定三元组抽取句法依赖语义一致性信息抽取情感分析NLP
📖 阅读⬇ PDF

Exploiting Duality in Open Information Extraction with Predicate Prompt

美团 2024-01-20

利用对偶性和谓词提示改进开放信息抽取,通过捕捉主语与宾语的对偶关系并结合谓词语义提示,更准确地提取无模式三元组。该方法提升了开放域关系抽取的覆盖率和准确性,对知识图谱构建与信息检索从业者具有直接帮助。

开放信息抽取谓词提示对偶性三元组抽取自然语言处理
📖 阅读⬇ PDF

A Collaborative Transfer Learning Framework for Cross-domain Recommendation

美团 2023-06-26

提出协同迁移学习框架,通过共享表征与域间知识蒸馏,解决跨业务域推荐中CTR预测不准和冷启动问题。该方法能有效利用高流量域带动低流量域,提升整体推荐生态的转化效率,对多业务推荐平台的从业者富有启发性。

跨域推荐迁移学习CTR预测协同学习推荐系统知识蒸馏
📖 阅读⬇ PDF

Sampling Is All You Need on Modeling Long-Term User Behaviors for CTR Prediction

美团 2022-05-20

提出一种基于采样的方法高效建模超长用户行为序列用于点击率CTR预测。核心贡献在于证明简洁的采样策略可替代复杂序列模型,大幅降低显存与计算开销而效果不降。为工业级推荐系统处理长行为序列提供了轻量级且易于部署的解决方案。

CTR预测用户行为序列采样策略计算效率推荐系统长序列建模
📖 阅读⬇ PDF

NMA: Neural Multi-slot Auctions with Externalities for Online Advertising

美团 2022-05-20

提出神经多槽拍卖模型NMA,显式建模广告展示中的外部性效应以优化多广告位分配。核心是将深度学习引入拍卖机制,预测广告间外部性并最大化平台收入。对广告系统从业者,该模型可改进传统GSP拍卖的局限,提升社交网络与电商平台的变现效率。

在线广告多槽拍卖外部性神经模型竞价优化平台收入
📖 阅读⬇ PDF

Hybrid CNN Based Attention with Category Prior for User Image Behavior Modeling

美团 2022-05-05

提出混合CNN注意力机制并融合物品类别先验,用于建模用户历史图像点击行为以提升CTR预估。核心是结合图像视觉特征与类别知识,在美团场景下改善图像内容理解与匹配。对电商推荐广告从业者,提供了一种面向图像行为的精准建模路径。

CTR预测图像行为建模类别先验混合CNN注意力机制美团
📖 阅读⬇ PDF

Hybrid Transfer in Deep Reinforcement Learning for Ads Allocation

美团 2022-04-02

提出在深度强化学习广告分配中引入混合迁移学习,加速策略收敛并提升平台总收益。核心是通过迁移历史策略或跨域知识,将源场景的经验高效迁移至新场景。对需要快速部署分配决策的流量系统从业者,显著降低冷启动成本并提高优化效率。

广告分配深度强化学习迁移学习混合迁移推荐系统流量优化
📖 阅读⬇ PDF

Learning List-wise Representation in Reinforcement Learning for Ads Allocation with Multiple Auxiliary Tasks

美团 2022-04-02

提出一种面向广告分配的强化学习列表级表示学习方法,通过多个辅助任务增强状态表征能力。核心贡献在于将列表上下文信息融入策略学习,提升长序列决策效果。对从业者而言,该方法可显著改善推荐流中广告与内容的混合排序收益。

强化学习广告分配列表级表示多任务学习推荐系统
📖 阅读⬇ PDF

Deep Page-Level Interest Network in Reinforcement Learning for Ads Allocation

美团 2022-04-01

提出深度页面级兴趣网络,将用户历史行为建模为页面级兴趣表示,用于强化学习广告分配。亮点是捕捉用户在一次浏览中的整体偏好,从而优化广告位分配决策。为信息流广告从业者提供了一种更精准的用户兴趣理解方案,可提升整体收益。

强化学习广告分配页面级兴趣网络用户建模推荐系统
📖 阅读⬇ PDF

Learning What You Need from What You Did: Product Taxonomy Expansion with User Behaviors Supervision

美团 2022-03-28

利用用户行为作为监督信号,自动扩展产品分类体系,无需大量人工标注。核心贡献是提出一种从行为隐式反馈中学习未知品类的框架,实现动态分类更新。对电商从业者而言,该技术能降低分类维护成本,提升推荐和搜索的结构化数据质量。

产品分类扩展用户行为监督电子商务分类体系推荐系统
📖 阅读⬇ PDF

A Framework for Multi-stage Bonus Allocation in meal delivery Platform

美团 2022-02-22

针对外卖配送场景,提出一种多阶段奖金分配框架,以平衡平台、骑手与用户体验。亮点在于联合优化不同配送阶段的激励策略,确保运力稳定和服务质量。对外卖平台运营管理人员,该框架提供了精细化的奖励设计方法。

外卖配送奖金分配多阶段优化运筹优化激励设计
📖 阅读⬇ PDF

Cross DQN: Cross Deep Q Network for Ads Allocation in Feed

美团 2021-09-09

提出Cross DQN跨域深度Q网络,用于信息流广告与原生内容的混排分配。核心贡献是建模跨域依赖关系,在有限广告位下联合优化总体收益与用户体验。对从业者提供了一种强化学习驱动的广告位分配方案,可直接提升电商平台变现效率。

广告分配深度强化学习DQN信息流电商跨域建模
📖 阅读⬇ PDF

Modeling the Sequential Dependence among Audience Multi-step Conversions with Multi-task Learning in Targeted Display Advertising

美团 2021-05-18

使用多任务学习框架建模展示广告中用户多步转化(如曝光→点击→购买)的序列依赖关系。核心亮点是同时学习多个转化阶段的预测任务,捕获序列决策中的上下文影响。对广告系统设计者而言,该方法能更精准地预估转化漏斗,优化出价和投放策略。

多任务学习序列依赖转化预测展示广告多步转化定向广告
📖 阅读⬇ PDF

Twins: Revisiting the Design of Spatial Attention in Vision Transformers

美团 2021-04-28

重新审视视觉Transformer中的空间注意力设计,提出Twins架构,针对密集预测任务(如检测、分割)进行优化。通过改变空间注意力的计算方式,在保持效率的同时提升特征表达质量。对计算机视觉从业者,Twins提供了更强大的主干网络选择。

视觉Transformer空间注意力密集预测Twins图像分割目标检测
📖 阅读⬇ PDF

Conditional Positional Encodings for Vision Transformers

美团 2021-02-22

提出条件位置编码(CPE),改变传统固定或可学习的位置编码方式,使编码根据输入token动态生成。CPE能自适应地融入内容信息,提升视觉Transformer的灵活性和性能。该技术可轻松集成到现有ViT模型中,为提升图像识别等任务带来直接收益。

视觉Transformer位置编码条件位置编码CPE图像分类动态编码
📖 阅读⬇ PDF

DARTS-: Robustly Stepping out of Performance Collapse Without Indicators

美团 2020-09-02

提出DARTS-方法,在无需依赖崩坏指标的情况下,鲁棒地解决可微架构搜索中的性能崩塌问题。通过改进搜索空间和优化策略,避免了训练过程中的性能突然下降。为神经架构搜索的实际应用扫清障碍,让AutoML更稳定可靠。

神经架构搜索DARTS性能崩塌鲁棒性可微搜索AutoML
📖 阅读⬇ PDF

Meta 27 条

trunk/eefb217f761df28eec3f4ec47a81cbeb776cae65

动态 2026-06-21Infra

「PyTorch」主干提交用共享的展开拷贝辅助函数加速 all_gather_offset 写入。属于分布式通信底层的小幅性能优化,对关注大规模训练通信开销的 Infra 工程师值得留意。

PyTorch分布式训练通信优化all-gather底层性能训练基础设施

trunk/fd03d749d830fbea0c1301e4e4a060b854458daa: Tune all_gather_offset for skewed buckets (#187750)

动态 2026-06-20Infra

PyTorch 提交为 all_gather_offset 算子优化偏斜分桶:旧实现每个分片仅用单个 CTA 驱动,少量大分片会让大部分 GPU 闲置;新方案把工作展平为固定大小字节瓦片并以 grid-stride 方式调度 CTA,对任意大小分片做负载均衡,提升通信带宽利用率。对关注分布式训练通信优化的从业者有价值。

分布式训练all_gather负载均衡通信优化PyTorchCTA调度

trunk/5dc01ed52d8eed40d65371f7611a480cd57b50ac

动态 2026-06-20Infra

PyTorch 新增参数连续的 all-gather 算子『symm_mem.all_gather_offset』,面向对称内存做参数连续布局的聚合通信。属分布式训练底层通信原语的增强,对训练框架与并行性能优化有参考价值。

分布式训练all-gather对称内存通信原语PyTorch参数连续布局

trunk/f557b30a777b92eb1973e6319a6748edf26ca70f: Use driver API for CUDA graph node type in annotations (#187679)

动态 2026-06-19推理优化

「PyTorch」提交:改用驱动层 API『cuGraphNodeGetType』查询「CUDA Graph」节点类型,避免运行时 API 对 BATCH_MEM_OP 类节点返回未知错误而导致捕获阶段误抛异常。属于 CUDA Graph 注解的健壮性修复,利好依赖图捕获做推理加速的工程实践。

PyTorchCUDA Graph推理优化健壮性修复GPU底层优化

viable/strict/1781856928: Expose distributed backend implementation accessors (#187494)

动态 2026-06-19Infra

「PyTorch」新增『torch.distributed.get_backend_impl』并在 c10d 层公开『ProcessGroup.get_backend』,便于实验自定义分布式后端;文档提示后端方法会绕过 torch.compile 追踪且属实验性接口。利好定制通信后端的训练基础设施开发。

PyTorch分布式训练通信后端c10d训练基础设施实验接口

SnapStream: Efficient Long Sequence Decoding on Dataflow Accelerators

arXiv 2026-06-01

SnapStream 针对数据流加速器上的长序列解码,提出高效处理大 KV 缓存的方法,显著降低片上内存需求。有助于在有限硬件资源下部署长上下文大模型并提升推理效率。对做大模型推理部署与硬件加速的工程师很有价值。

KV-cache长序列解码推理优化显存优化数据流加速器长上下文
📖 阅读⬇ PDF

Fair Cognitive Impairment Detection Through Unlearning

arXiv 2026-06-01

提出一种基于遗忘学习的公平认知障碍检测方法,从自发语音中识别轻度认知障碍(MCI),旨在减少模型对敏感属性的偏差,提升检测的可扩展性与公平性。对从业者而言,该方法展示了如何在医疗AI中兼顾性能与伦理,尤其适用于大规模语音筛查场景。

认知障碍检测公平性遗忘学习语音分析轻度认知障碍偏差消除
📖 阅读⬇ PDF

Affordance-Compiled Intelligence: Observable-Only Cognitive Impedance Matching for No-Meta LLM-Integrated Systems

arXiv 2026-03-13

该论文提出可供性编译智能与认知阻抗匹配理论 CIMT,是一种仅依赖可观察行为、无需内部元信息的编译器式理论,用于集成大语言模型的系统。核心贡献是在不访问模型内部元信息的前提下实现系统与 LLM 的认知匹配。对从业者而言,它为设计更透明、易调试、健壮的 LLM 应用提供了新思路。

大模型系统设计可解释性LLM集成可供性
📖 阅读⬇ PDF

How Do Large Language Models Learn Concepts During Continual Pre-Training?

Meta AI 2026-01-07

本文研究大语言模型在持续预训练过程中如何学习「狗」这类抽象概念,通过分析模型内部表征的动态演化,揭示概念形成的关键机制与条件。核心价值在于把概念学习过程透明化。对于关注预训练数据配比和模型概念理解能力的从业者,该发现为优化数据分布、提升训练效率提供了指导。

大模型持续预训练概念学习内部表征可解释性数据分布
📖 阅读⬇ PDF

Evolutionary Retrofitting

ACM Transactions on Evolutionary Learning and OptimizationMeta AI 2025-11-13

AfterLearnER 提出在模型训练完成后,用进化优化对一组精选参数进行调整,从而细化已充分训练的模型。核心贡献是将进化算法作为后处理步骤,无需重新训练即可提升性能。对从业者而言,提供了一种灵活高效的微调途径,尤其适合参数空间复杂、难以靠梯度下降优化的场景。

进化算法模型微调后处理优化免重训参数优化黑盒优化
📖 阅读⬇ PDF

MetaMorph: Multimodal Understanding and Generation via Instruction Tuning

Meta FAIR 2025-10-19

提出视觉预测指令微调(VPiT),通过简单扩展将预训练大语言模型快速转化为统一的多模态理解与生成模型,无需从头训练。核心贡献是以低成本指令微调路径打通多模态理解与生成。对从业者而言,它显著降低了多模态模型的构建成本与门槛。

多模态指令微调大模型统一理解与生成VPiT大模型复用
📖 阅读⬇ PDF

An Empirical Study of Autoregressive Pre-Training from Videos

Meta FAIR 2025-10-19

对视频自回归预训练进行系统性实证研究,构建了名为Toto的模型系列,将视频视为视觉token序列进行自回归建模。亮点在于以大量实验探索视频自回归预训练的有效性与可行性。对从业者而言,它为视频理解与生成任务提供了可借鉴的预训练范式与经验。

视频理解自回归预训练视觉token实证研究大模型视频生成
📖 阅读⬇ PDF

Error-driven Data-efficient Large Multimodal Model Tuning

Meta AI 2024-12-01

本文提出一种基于错误驱动的高效数据微调方法,用于大型多模态模型(LMM)。核心贡献在于通过识别模型预测错误来有选择地挑选微调数据,大幅降低数据需求。对从业者而言,该方法能以更少数据实现下游任务性能提升,节省标注成本。

大模型多模态微调数据高效错误驱动
📖 阅读⬇ PDF

Adaptive Caching for Faster Video Generation With Diffusion Transformers

Meta AI 2024-11-01

本文提出自适应缓存机制,用于加速基于扩散Transformer(DiT)的视频生成。核心贡献是动态选择缓存哪些时间步的计算结果,减少冗余计算。对从业者而言,该方法能显著提升视频生成速度,降低显存占用,适合实时应用。

视频生成扩散Transformer缓存机制加速推理显存优化
📖 阅读⬇ PDF

Iteration Head: A Mechanistic Study of Chain-of-Thought

Meta FAIR 2024-06-01

提出「迭代头」机制,从机械论角度解释链式思维推理如何提升大语言模型性能,揭示注意力头在中间步骤迭代传递信息的过程。有助于理解CoT有效的内在原因,并为推理优化提供理论基础。

链式思维推理迭代头机械论研究LLM推理机制注意力头
📖 阅读⬇ PDF

Scope Ambiguities in Large Language Models

Transactions of the Association for Computational Linguistic 2024-04-01

分析大语言模型处理包含多个语义算子的句子时出现的范围歧义,揭示模型在语义理解上的局限性。为改进LLM语义推理能力、增强鲁棒性提供新视角,对自然语言理解研究有重要参考。

范围歧义语义算子大语言模型语义理解自然语言处理
📖 阅读⬇ PDF

SpiRit-LM: Interleaved Spoken and Written Language Model

Meta AI 2024-02-01

提出SpiRit-LM,一个能交错处理口语和书面语的统一语言模型,联合建模语音与文本模态。核心贡献是实现更自然的跨模态生成。对从业者:推动多模态对话系统和语音助手发展。

多模态语言模型语音-文本交错建模联合训练对话系统
📖 阅读⬇ PDF

Microsoft 178 条

LLM can Read Spectrogram: Encoder-free Speech-Language Modeling

arXiv 2026-06-08

提出无编码器的语音语言建模方法,让大语言模型直接读取语谱图,省去预训练语音编码器。架构更简洁、对专用编码器依赖更低,有望提升训练与推理效率,为构建轻量灵活的语音-LLM 系统提供新思路。

多模态语音大模型语谱图无编码器架构简化
📖 阅读⬇ PDF

Less Context, Better Agents: Efficient Context Engineering for Long-Horizon Tool-Using LLM Agents

arXiv 2026-06-08

针对企业工作流中 LLM 智能体因冗长工具响应导致上下文溢出、状态错误和高延迟的问题,提出高效上下文工程方法,通过选择性保留关键工具响应来压缩上下文。在长周期工具调用任务中显著降低计算成本、提升智能体稳定性与可靠性。

Agent上下文工程工具调用长程任务成本优化
📖 阅读⬇ PDF

ADK Arena: Evaluating Agent Development Kits via LLM-as-a-Developer

arXiv 2026-06-04

提出 ADK Arena 评估框架,用「LLM-as-a-Developer」方法系统比较不同 Agent 开发工具包对构建自主智能体的影响。首次给出经验性横向对比,帮助开发者按任务需求选择最优框架。对提升 Agent 应用开发效率与落地选型有实用意义。

Agent评估框架大模型开发工具LLM-as-a-Developer智能体
📖 阅读⬇ PDF

Read the Trace, Steer the Path: Trajectory-Aware Reinforcement Learning for Diffusion Language Models

arXiv 2026-06-03

提出轨迹感知强化学习方法,利用扩散语言模型生成过程中的去噪轨迹信息来指导策略更新,从而同时提升生成质量与效率。为强化学习在扩散生成模型中的应用提供了新范式。对从事扩散式文本生成与对齐优化的研究者有较高参考价值。

扩散语言模型强化学习轨迹感知去噪轨迹文本生成策略优化
📖 阅读⬇ PDF

The Geometry of LLM-as-Judge: Why Inter-LLM Consensus Is Not Human Alignment

Microsoft Research 2026-06-02

研究 LLM 作为评判者时「不同模型彼此高度一致、却与人类一致性弱」的现象,并用几何度量证明这种共识源于共享偏差而非共享信号。核心结论是 LLM 评判者的内部共识不能等同于人类对齐。提醒从业者在用 LLM 做自动评估时需警惕其与人类偏好的系统性偏差。

LLM评判自动评估模型对齐偏差分析人类偏好可信评估
📖 阅读⬇ PDF

Object-Centric Residual RL for Zero-Shot Sim-to-Real VLA Enhancement

arXiv 2026-06-01

针对视觉-语言-动作(VLA)模型在精密物理交互中因模仿学习误差累积而脆弱的问题,提出以物体为中心的残差强化学习方法,在零样本仿真到真实(sim-to-real)迁移下对 VLA 策略进行增强。方法通过学习一个叠加在基础策略之上的残差校正项来提升精确操作的鲁棒性,对需要把通用 VLA 落地到真实机器人精细操控的从业者有直接价值。

VLA机器人操控残差强化学习仿真到真实零样本以物体为中心
📖 阅读⬇ PDF

Express Language Modeling

Microsoft Research 2026-06-01

提出新工具Express,能将非因果注意力近似转换为因果注意力近似,并保持近似保证。结合最先进的Thinformer架构,提升因果语言建模效率。对从事大模型推理优化的从业者,可降低计算开销并保持模型质量。

因果注意力语言建模模型优化近似算法Thinformer
📖 阅读⬇ PDF

You Only Index Once: Cross-Layer Sparse Attention with Shared Routing

arXiv 2026-06-01

提出「只索引一次」的跨层稀疏注意力机制,通过共享路由实现计算高效的长上下文推理。核心贡献在于大幅降低解码阶段的计算开销,对需要长链条推理的LLM应用(如思维链)具有重要实际意义。

大模型推理优化稀疏注意力长上下文解码效率KV-cache
📖 阅读⬇ PDF

AsyncWebRL: Efficient Multi-Step RL for Visual Web Agents

arXiv 2026-06-01

提出AsyncWebRL方法,通过异步强化学习解决视觉网页代理训练中GPU空闲和轨迹冗长的问题,显著提升多步RL效率。该工作有效降低Web智能体训练成本,加速实际部署。

强化学习视觉语言模型Web代理异步训练效率优化
📖 阅读⬇ PDF

Temporal Preference Optimization for Unsupervised Retrieval

arXiv 2026-06-01

针对无监督稠密检索器难以捕捉文档时间相关性的问题,提出时间偏好优化方法,通过对比学习自动学习时间信号,提升检索结果对时间动态的敏感性。对检索系统开发者而言,该方法无需标注即可增强语义相似度模型的时间感知能力,适用于新闻、社交媒体等时效性强的场景。

无监督检索稠密检索时间偏好对比学习语义相似度时效性
📖 阅读⬇ PDF

MuseVLA: An Adaptive Multimodal Sensing Vision-Language-Action Model for Robotic Manipulation

arXiv 2026-06-01

提出MuseVLA,一种自适应多模态感知的视觉-语言-动作模型,融合RGB、深度、触觉等多种传感模态,提升机器人操作的鲁棒性与泛化能力。对于机器人学从业者,该模型突破了传统VLA仅依赖视觉输入的限制,为复杂环境下的精细操作提供了更可靠的方案。

机器人操作多模态感知VLA模型自适应触觉RGB-D
📖 阅读⬇ PDF

ECHO: Terminal Agents Learn World Models for Free

Microsoft Research 2026-05-23

提出ECHO方法,让语言模型驱动的终端代理通过执行命令并观察终端返回(stdout、错误、文件等)来「免费」学习世界模型,无需额外数据或训练即可内化执行环境。这降低了构建命令行Agent的复杂度,使其能更智能地与环境交互、提升决策能力。

Agent世界模型终端代理命令行大模型自监督学习
📖 阅读⬇ PDF

Demystifying Data Organization for Enhanced LLM Training

arXiv 2026-05-01

本文系统化研究了大语言模型训练中的数据组织策略,指出除了数据筛选外,数据排序与分组同样显著影响训练效率。核心贡献是提出了可操作性强的数据组织指南,帮助从业者在保持模型性能的同时降低训练成本。

数据组织大模型训练数据预处理训练效率数据筛选
📖 阅读⬇ PDF

DEPART: DEcomposing PARiTy across Multilingual LLMs

arXiv 2026-05-01

针对多语言LLM排行榜仅报告准确率而不解释差异根源的问题,提出DEPART归因方法。该框架能分解各语言上的性能差异来源,帮助从业者定位系统性偏差并采取有效干预措施。

多语言模型性能差异归因分析公平性模型评估
📖 阅读⬇ PDF

AI-Assisted Systematization for Evaluating GenAI Systems

arXiv 2026-05-01

针对生成式AI系统评估中概念模糊、标准不一的难题,提出AI辅助系统化评估方法。通过自动化分解与度量复杂目标(如推理、公平性),帮助从业者建立更可靠、可复现的评测流程。

生成式AI评估方法自动化评测系统化基准测试
📖 阅读⬇ PDF

SkillOpt: Executive Strategy for Self-Evolving Agent Skills

arXiv 2026-05-01

提出SkillOpt框架,将Agent技能进化类比为深度学习优化器,通过结构化迭代更新替代手工或松散自修正方式。核心贡献是让技能改进更可控、高效,为从业者提供自主升级Agent能力的实用策略。

Agent技能优化自我进化深度学习类比自动化
📖 阅读⬇ PDF

Reinforcing VLAs in Task-Agnostic World Models

arXiv 2026-05-01

提出在任务无关世界模型中对视觉-语言-动作(VLA)模型进行强化学习后训练,使其能适应新任务而无需真实交互。核心贡献是提升VLA的迁移泛化能力,从业者可低成本部署机器人等应用。

VLA强化学习世界模型任务泛化机器人
📖 阅读⬇ PDF

MemGym: a Long-Horizon Memory Environment for LLM Agents

arXiv 2026-05-01

提出MemGym长程记忆环境,专为LLM Agent设计,评估其在多轮复杂任务中的长期记忆能力。核心贡献是填补现有基准只关注聊天场景的空白,从业者可更全面测试Agent记忆性能。

LLM Agent长程记忆基准环境多轮任务评估
📖 阅读⬇ PDF

Multi-agent AI systems outperform human teams in creativity

arXiv 2026-05-01

研究表明,基于大型语言模型的多智能体AI系统在创造性任务上表现优于人类团队。该工作挑战了创造力是AI难以企及的前沿观点,为利用多智能体协作提升创意生成提供了新思路。对AI从业者意味着可探索多智能体协作在创意产业中的应用。

多智能体系统创造力LLM团队协作AI超越人类
📖 阅读⬇ PDF

An Efficient Streaming Video Understanding Framework with Agentic Control

arXiv 2026-05-01

提出一个带智能体控制的流式视频理解框架,根据视频内容动态调整处理策略(如记忆压缩或注意力分配),在严格延迟预算下高效处理动态信息密度。核心亮点是智能体控制的自适应机制。对从业者而言,该方法可应用于实时视频分析、监控、直播等场景。

流式视频理解智能体控制自适应策略延迟优化实时处理
📖 阅读⬇ PDF

VeriCache: Turning Lossy KV Cache into Lossless LLM Inference

arXiv 2026-05-01

提出VeriCache方法,将现有有损KV缓存压缩技术(如token丢弃、量化)转化为无损推理。通过校验和重建机制保证输出精确性,同时大幅降低显存占用。对从业者来说,该工作使得在有限显存下支持长上下文LLM推理成为可能,且不损失精度。

KV-cache显存优化无损推理量化长上下文LLM推理
📖 阅读⬇ PDF

Skim: Speculative Execution for Fast and Efficient Web Agents

arXiv 2026-05-01

提出Skim框架,利用专门网站的预测性结构,通过推测执行加速Web代理任务,同时降低开销。核心亮点是显著减少等待时间和冗余操作,提升效率。对从业者来说,该技术可应用于自动化网页操作、数据采集和RPA场景。

推测执行Web Agent效率优化自动化RPA
📖 阅读⬇ PDF

Orchard: An Open-Source Agentic Modeling Framework

arXiv 2026-05-01

发布Orchard开源框架,支持将LLM转换为具备规划、推理、工具使用和多轮交互能力的自主智能体。核心贡献是提供模块化、可扩展的智能体建模基础设施。对从业者而言,该框架降低了构建复杂AI代理的门槛,便于快速原型和实验。

开源框架自主智能体规划工具使用多轮交互LLM
📖 阅读⬇ PDF

Video Models Can Reason with Verifiable Rewards

arXiv 2026-05-01

本文提出将可验证奖励机制引入视频扩散模型,使其不仅优化视觉逼真度,还能进行可验证推理。核心贡献是首次赋予视频模型推理能力,对提升生成式AI的可解释性和可靠性有重要意义。

视频扩散模型可验证奖励推理能力生成模型AI可靠性
📖 阅读⬇ PDF

Test-Time Learning with an Evolving Library

arXiv 2026-05-01

提出EvoLib框架,让大语言模型在测试时无需参数更新或外部监督,即可跨实例积累、复用和演化知识。该方法零成本扩展模型知识库,对连续任务场景的LLM应用具有实用价值。

测试时学习知识积累大语言模型零微调动态知识库
📖 阅读⬇ PDF

Auditing Agent Harness Safety

arXiv 2026-05-01

揭示LLM代理执行框架可能返回正确但有害的答案,强调了审计框架安全性的必要性。核心贡献是识别并防御框架层面的安全漏洞,对构建可信赖的代理系统至关重要。

LLM代理执行框架安全审计漏洞检测代理安全
📖 阅读⬇ PDF

LIFT: Last-Mile Fine-Tuning for Table Explicitation

arXiv 2026-05-01

提出最后一英里微调(Lift)流水线,先用预训练大模型提取初始表格,再用微调小模型细化。核心贡献是用轻量级模型高效提升表格抽取精度,为表格数据处理提供低成本实用方案。

表格提取小模型微调LLM管道最后一英里微调表格细化
📖 阅读⬇ PDF

Kairos: A Scalable Serving System for Physical AI

arXiv 2026-05-01

提出 Kairos,一个面向物理 AI 的可扩展服务系统,针对物理 AI 任务独特的推理特征进行优化。核心贡献在于设计能高效处理物理世界推理负载的架构,对部署大规模物理 AI 应用的从业者具有重要参考价值。

物理AI推理服务可扩展系统AI基础设施实时推理
📖 阅读⬇ PDF

Beyond GRPO and On-Policy Distillation: An Empirical Sparse-to-Dense Reward Principle for Language-Model Post-Training

arXiv 2026-05-01

提出从稀疏到密集的奖励原则(Sparse-to-Dense Reward Principle),超越 GRPO 和在线策略蒸馏,为语言模型后训练提供更高效的奖励分配方法。经验证该原则在标注数据稀缺时能最大化每个样本的信息收益,对实际后训练流程优化有重要启发。

后训练奖励设计稀疏奖励密集奖励语言模型数据效率
📖 阅读⬇ PDF

Multi-Rollout On-Policy Distillation via Peer Successes and Failures

arXiv 2026-05-01

提出 Multi-Rollout On-Policy Distillation,利用同伴成功与失败经验进行多展开在线策略蒸馏,解决稀疏验证奖励下推理路径反馈不足的问题。该方法能更有效地从有限成功信号中学习,对提升 LLM 推理能力的后训练方案有显著价值。

在线蒸馏强化学习稀疏奖励推理优化LLM后训练多展开
📖 阅读⬇ PDF

Language Modeling with Hyperspherical Flows

arXiv 2026-05-01

提出超球面流(Hyperspherical Flows)用于语言建模,为离散扩散语言模型提供一种可并行生成的新思路。相比传统离散扩散,该模型在保持并行性的同时可能提升生成质量,对加快文本生成速度并保持高保真度具有潜力。

离散扩散超球面流语言建模并行生成生成模型
📖 阅读⬇ PDF

EmbodiSkill: Skill-Aware Reflection for Self-Evolving Embodied Agents

arXiv 2026-05-01

提出EmbodiSkill框架,通过技能感知反思使具身智能体在多样化环境中自我进化,能够更有效地指导对象搜索、动作执行和状态变化。核心贡献是让智能体在部署后持续优化技能库,对机器人/具身智能从业者提升跨场景泛化能力有重要参考。

具身智能技能学习自我进化反思机制机器人
📖 阅读⬇ PDF

ReVision: Scaling Computer-Use Agents via Temporal Visual Redundancy Reduction

arXiv 2026-05-01

提出ReVision方法,通过时间视觉冗余减少策略大幅降低计算机使用智能体的视觉token数量,从而延长交互轨迹并降低成本。核心贡献是在保持性能前提下实现显存和计算优化,对GUI自动化Agent开发者在效率提升方面具有重要意义。

计算机使用Agent视觉token压缩时序冗余推理效率GUI自动化
📖 阅读⬇ PDF

Generating Leakage-Free Benchmarks for Robust RAG Evaluation

arXiv 2026-05-01

提出生成无泄漏基准的方法以鲁棒评估RAG系统,解决现有基准存在数据泄漏导致评估虚高的问题。核心贡献是构建干净且不易被记忆的测试集,对RAG从业者进行真实性能度量具有重要参考。

检索增强生成基准测试数据泄漏鲁棒评估RAG
📖 阅读⬇ PDF

SkillGen: Verified Inference-Time Agent Skill Synthesis

arXiv 2026-05-01

提出SkillGen框架,实现验证驱动的推理时Agent技能自动合成,无需重新训练即可生成高质量可复用技能。亮点是通过自动验证保证技能正确性,对提升LLM Agent的扩展性和可控性有实际价值。

技能合成Agent增强推理时优化自动化验证大模型
📖 阅读⬇ PDF

Revisiting Transformer Layer Parameterization Through Causal Energy Minimization

arXiv 2026-05-01

通过因果能量最小化的视角重新审视Transformer层参数化方式,为多头注意力和门控MLP的组合提供理论依据。核心贡献是揭示了不同参数化选择对训练动态的影响,可用于指导更高效的架构设计。对从业者而言有助于减少经验试错、提升模型设计效率。

Transformer参数化因果能量最小化层设计
📖 阅读⬇ PDF

Switchcraft: AI Model Router for Agentic Tool Calling

arXiv 2026-05-01

提出Switchcraft模型路由器,用于代理系统中智能选择调用工具时的模型,以降低推理成本。核心贡献是相对现有路由方法实现了更优的准确率-效率平衡,在保持性能的同时显著节省预算。对从业者而言是部署Agent系统时实用的成本优化方案。

模型路由工具调用成本优化Agent系统
📖 阅读⬇ PDF

Human-Inspired Memory Architecture for LLM Agents

arXiv 2026-05-01

设计受人类记忆机制启发的LLM代理记忆架构,包含六种认知机制(如工作记忆、情景记忆等)。核心贡献是使代理能够持久管理长期交互中的上下文,提升连续任务的连贯性与适应性。对从业者而言可增强对话、任务执行等场景的用户体验。

LLM代理记忆架构认知机制长期交互
📖 阅读⬇ PDF

VLA-GSE: Boosting Parameter-Efficient Fine-Tuning in VLA with Generalized and Specialized Experts

arXiv 2026-05-01

提出VLA-GSE方法,通过通用专家和专用专家模块实现视觉-语言-动作(VLA)模型的参数高效微调。核心贡献是在机器人控制任务上以极低微调参数量达到或超越全微调性能。对从业者而言可大幅降低VLA模型在具体任务上的微调成本和计算资源。

VLA参数高效微调机器人控制专家模块
📖 阅读⬇ PDF

Quantizing With Randomized Hadamard Transforms: Efficient Heuristic Now Proven

arXiv 2026-05-01

从理论上证明了使用随机Hadamard变换进行均匀随机旋转在量化(如梯度压缩、KV-cache压缩)中的有效性。核心贡献是将先前高效的启发式方法提升为有严格证明的方法,确保量化过程中信息损失最小。对从业者而言可放心采用该预处理加速推理与压缩。

量化随机Hadamard变换KV-cache压缩梯度压缩
📖 阅读⬇ PDF

AgenticRAG: Agentic Retrieval for Enterprise Knowledge Bases

arXiv 2026-05-01

提出AgenticRAG,一种面向企业知识库的智能体检索增强生成框架,让智能体自主进行多步检索与推理。核心贡献是突破标准RAG对搜索栈的依赖,使答案更准确地基于结构化与非结构化知识。对从业者而言是企业级应用中提升RAG效果和灵活性的实用方案。

AgenticRAG企业知识库检索增强生成智能体
📖 阅读⬇ PDF

Audio-Visual Intelligence in Large Foundation Models

arXiv 2026-05-01

本文聚焦于大型基础模型中的视听智能(AVI),旨在打通听觉与视觉模态,使机器能感知、生成和交互。核心贡献是系统梳理了AVI的前沿方向,对多模态AI从业者理解跨模态融合与生成有重要参考价值。

视听智能多模态大模型跨模态感知生成交互
📖 阅读⬇ PDF

Exploring Data-Free LoRA Transferability for Video Diffusion Models

arXiv 2026-05-01

本文探索无数据情形下LoRA向视频扩散模型变体(如步骤蒸馏、因果蒸馏)的迁移能力。核心贡献是解决LoRA适配不同蒸馏后模型的难题,对从业者快速复用微调权重、降低适配成本具有实用意义。

视频扩散模型LoRA迁移无数据适配蒸馏模型模型复用
📖 阅读⬇ PDF

Unifying Sparse Attention with Hierarchical Memory for Scalable Long-Context LLM Serving

Microsoft Research 2026-04-29

针对长上下文 LLM 服务中 KV 缓存的巨大开销,本文将动态稀疏注意力与层级记忆结构统一,仅访问与查询相关的少量 KV 状态来降低推理成本。该机制在保持模型质量的同时提升了吞吐量,可有效缓解长上下文场景下的显存与算力瓶颈。对从业者而言,这能直接降低长文本部署成本。

大模型推理优化稀疏注意力KV-cache长上下文显存优化
📖 阅读⬇ PDF

Arena: Efficiently Training Large Models via Dynamic Scheduling and Adaptive Parallelism Co-Design

arXiv 2026-04-24

提出 Arena 框架,通过作业间的动态调度与作业内的自适应并行进行协同设计,以高效训练大规模模型。其核心贡献是解决现有调度器与并行策略相互脱节的问题,从而提升 GPU 集群利用率。对从业者而言,可显著减少大模型训练的等待时间与资源浪费。

大模型训练分布式训练动态调度自适应并行GPU集群资源利用率
📖 阅读⬇ PDF

Evaluating General-Purpose AI with Psychometrics

Communications of the ACMMicrosoft Research 2026-04-14

本文提出将心理测量学方法引入通用人工智能(如大语言模型)的严谨评估,以加深对其能力的理解并有效降低风险。该方法为AI评测提供了更可靠的量化框架。对从业者而言,有助于系统性地分析与刻画模型行为。

大语言模型模型评估心理测量学通用人工智能风险管理
📖 阅读⬇ PDF

Designing Staged Evaluation Workflows for LLMs: Integrating Domain Experts, Lay Users, and Model-Generated Evaluation Criteria

arXiv 2026-04-13

提出一个分阶段评估工作流,整合领域专家、非专业用户与模型生成的评估标准,应对大语言模型在特定任务输出难以评估的挑战。其构建了多角色协作的评估框架以提升评估的全面性与准确性,可用于实际领域任务的质量控制,改善LLM部署中的评估流程。

大语言模型模型评估人机协同质量控制评估标准LLM部署
📖 阅读⬇ PDF

SLM Finetuning for Natural Language to Domain Specific Code Generation in Production

arXiv 2026-04-10

本文探讨在生产环境中微调小型语言模型(SLM),用于自然语言到特定领域代码的生成。通过微调SLM,在满足严格延迟要求的同时实现高效代码生成。对从业者而言,这为低延迟、低成本的领域代码生成部署提供了可行方案,凸显小模型在垂直场景的实用价值。

小型语言模型微调代码生成领域专用低延迟部署生产环境
📖 阅读⬇ PDF

From Gaze to Guidance: Interpreting and Adapting to Users' Cognitive Needs with Multimodal Gaze-Aware AI Assistants

Microsoft Research 2026-04-09

本文提出一种基于眼动追踪的多模态AI助手,通过分析用户的注视行为来推断其认知需求,进而提供适应性指导。核心贡献是将眼动这一非语言行为线索融入大语言模型,使其能感知用户何时何地遇到困难。对从业者而言,这为开发上下文感知、更自然的人机交互助手提供了新思路。

多模态眼动追踪大模型人机交互认知感知自适应助手
📖 阅读⬇ PDF

Effects of Generative AI Errors on User Reliance Across Task Difficulty

Microsoft Research 2026-04-01

通过实验研究生成式AI错误类型与任务难度如何影响用户依赖行为。发现AI在简单任务上的错误更损害用户信任,而困难任务容忍度更高。对设计和部署人机协作系统的从业者,提示需关注错误分布对用户行为的影响。

用户信任错误影响任务难度人机交互生成式AI
📖 阅读⬇ PDF

Diagnosing Capability Gaps in Fine-Tuning Data

arXiv 2026-04-01

诊断微调数据中的能力差距,帮助识别目标能力覆盖不足并定位缺失能力。提供方法指导数据增强,提升微调效率。对模型微调实践和数据准备具有直接帮助。

微调能力差距数据诊断LLM数据覆盖
📖 阅读⬇ PDF

SWE-Edit: Rethinking Code Editing for Efficient SWE-Agent

arXiv 2026-04-01

提出SWE-Edit框架,重新设计代码编辑接口以解耦上下文耦合,提升软件工程智能体(SWE-Agent)的效率和准确性。对从业者而言,有助于构建更高效、稳定的代码编辑智能体,减少错误和冗余操作。

软件工程智能体代码编辑上下文解耦大语言模型自动化编程
📖 阅读⬇ PDF

Separable Expert Architecture: Toward Privacy-Preserving LLM Personalization via Composable Adapters and Deletable User Proxies

arXiv 2026-04-01

提出可分离专家架构(SEA),通过可组合适配器和可删除用户代理实现隐私保护的LLM个性化,支持用户数据单独删除而不影响全局模型。对从业者而言,解决了数据删除和法律合规(如GDPR)的痛点,为个性化服务提供了隐私友好的方案。

隐私保护模型个性化可分离架构数据删除适配器LLM
📖 阅读⬇ PDF

AVDA: Autonomous Vibe Detection Authoring for Cybersecurity

arXiv 2026-03-26

AVDA 提出一种自主检测编写方法,利用大语言模型的代码生成能力自动化网络安全检测工程中的规则编写流程。其亮点是显著提升检测规则的编写效率并降低人力成本。对安全从业者而言,该方法可加速威胁响应与检测规则的部署上线。

网络安全大模型代码生成检测工程自动化
📖 阅读⬇ PDF

An Agentic Multi-Agent Architecture for Cybersecurity Risk Management

arXiv 2026-03-20

该工作提出一种多智能体代理架构,用专业分工的智能体协作模拟网络安全风险评估流程,以解决小型组织评估成本高(约一万五千美元)、周期长(数周)的痛点。核心贡献是大幅降本提速并对齐 NIST CSF 标准。对从业者而言,它显著提升了合规风险评估对中小组织的可及性。

多智能体网络安全风险评估AgentNIST CSF
📖 阅读⬇ PDF

Understanding Pruning Regimes in Vision-Language Models Through Domain-Aware Layer Selection

arXiv 2026-03-17

该研究用领域感知的层选择方法系统分析视觉语言模型中的深度冗余,发现删除特定解码器层在不同领域的影响差异显著。核心贡献是揭示剪枝效果的领域敏感性,为压缩提供更精细的策略依据。对从业者而言,它提示模型剪枝应结合目标领域而非一刀切。

多模态视觉语言模型模型剪枝层选择模型压缩
📖 阅读⬇ PDF

MageBench: Bridging Large Multimodal Models to Agents

arXiv 2026-03-06

本文提出 MageBench 基准,用于衔接大型多模态模型与智能体能力,并借助测试时缩放技术提升推理表现。其价值在于为多模态 Agent 系统提供系统化的评估标尺。对从业者而言,是评估和改进多模态智能体推理与决策能力的重要参考。

多模态Agent基准测试测试时缩放推理优化
📖 阅读⬇ PDF

Scaling Agentic Capabilities, Not Context: Efficient Reinforcement Finetuning for Large Toolspaces

Microsoft Research 2026-03-05

针对拥有海量工具的智能体系统,提出一种强化微调方法,主张通过扩展智能体的能力而非一味拉长上下文来应对大工具空间,从而高效完成长周期任务的规划与执行。其亮点是能在弱监督条件下生效,为从业者提供了比堆叠上下文更省成本、更可落地的 Agent 训练范式。

Agent强化学习微调工具调用长周期任务弱监督
📖 阅读⬇ PDF

Learning When to Act or Refuse: Guarding Agentic Reasoning Models for Safe Multi-Step Tool Use

Microsoft Research 2026-03-03

本文提出让智能体语言模型学会「何时行动、何时拒绝」的安全守卫机制,专门应对多步工具调用场景下的安全风险,使模型能识别潜在危险操作并主动拒绝。其重要性在于:Agent 的安全挑战不同于普通对话模型,长链路行动中的误操作可能造成灾难性后果,需要专门防护。

AgentAI安全工具调用拒绝机制多步推理风险防护
📖 阅读⬇ PDF

Proact-VL: A Proactive VideoLLM for Real-Time AI Companions

arXiv 2026-03-01

提出Proact-VL,一个主动式视频大语言模型,实现低延迟连续流式推理、自动终止生成和主动对话决策,用于实时AI伴侣。对从业者而言,展示了将多模态模型应用于实时交互场景的实用方案,推动AI伴侣的实用化。

主动式视频LLM实时交互AI伴侣低延迟推理多模态对话决策
📖 阅读⬇ PDF

Chow-Liu Ordering for Long-Context Reasoning in Chain-of-Agents

arXiv 2026-03-01

提出Chow-Liu排序方法用于Chain-of-Agents多Agent推理框架,通过优化信息传递顺序提升长上下文推理效率。核心贡献是引入Chow-Liu算法为顺序Agent系统建立更合理的推理路径。对从业者而言,该方法可有效改善多Agent协作处理长文档时的性能瓶颈。

多智能体长上下文推理Chow-Liu算法Chain-of-Agents
📖 阅读⬇ PDF

From RAGs to rich parameters: Probing how language models utilize external knowledge over parametric information for factual queries

arXiv 2026-02-22

本文探究检索增强生成如何影响语言模型在回答事实查询时对外部检索知识与内部参数化知识的选择,通过实验揭示模型在不同场景下的依赖偏好。理解这种权衡有助于从业者设计更有效的知识检索与融合策略,优化RAG系统表现。

检索增强RAG参数化知识事实问答知识融合可解释性
📖 阅读⬇ PDF

On-Policy Context Distillation for Language Models

Microsoft Research 2026-02-12

提出On-Policy上下文蒸馏框架OPCD,将同策略学习与上下文蒸馏结合,使语言模型更有效地把上下文中的知识内化进参数。该方法提升了模型从上下文学习并固化知识的能力。对从业者优化知识迁移、减少长上下文依赖具有实用价值。

大模型知识蒸馏上下文学习策略学习知识迁移
📖 阅读⬇ PDF

PISCES: Annotation-free Text-to-Video Post-Training via Optimal Transport-Aligned Rewards

arXiv 2026-02-01

提出PISCES方法,利用最优传输对齐的奖励进行文本到视频后训练,无需人工标注。核心是设计基于最优传输的奖励函数来弥合生成与语义对齐的差距。对从业者而言,该方法降低了后训练对标注数据的依赖,提升了视频生成的质量和一致性。

文本到视频后训练奖励对齐最优传输无需标注
📖 阅读⬇ PDF

CrispEdit: Low-Curvature Projections for Scalable Non-Destructive LLM Editing

arXiv 2026-02-01

提出CrispEdit,通过低曲率投影实现非破坏性LLM编辑,保持模型通用能力。核心创新是编辑向量在参数空间中沿低曲率方向移动,避免能力退化。对从业者重要,因它提供了可扩展且安全的模型编辑方案,适合生产环境中的针对性修复。

模型编辑能力保持非破坏性低曲率可扩展
📖 阅读⬇ PDF

Memora: A Harmonic Memory Representation Balancing Abstraction and Specificity

arXiv 2026-02-01

提出Memora,一种谐波记忆表示,在抽象与具体性之间取得平衡,用于Agent记忆系统。核心贡献是通过谐波结构融合高层抽象与底层细节,提升检索效率与可扩展性。对从业者而言,它解决了Agent长期记忆如何兼顾信息增长与上下文感知检索的难题。

Agent记忆抽象表示检索谐波平衡
📖 阅读⬇ PDF

Closing the Loop: Universal Repository Representation with RPG-Encoder

arXiv 2026-02-01

提出RPG-Encoder,构建统一仓库表示以解决当前仓库Agent的推理断连问题。核心贡献是融合API文档、依赖图及代码语义,形成全局连贯的表示。对从业者重要,因它提升了仓库级代码理解和编辑的准确性,支持更可靠的代码Agent应用。

仓库表示代码理解RPG-Encoder推理统一表示
📖 阅读⬇ PDF

Pull Requests as a Training Signal for Repo-Level Code Editing

arXiv 2026-02-01

利用Pull Requests作为训练信号来改进仓库级别代码编辑。核心亮点是使用真实的多文件修改记录训练模型,使模型更好地理解跨文件依赖。对从业者重要,因它提供了更真实的训练数据来源,有望提升SWE-bench等基准上的性能。

仓库级编辑代码补全Pull Request训练信号SWE-bench
📖 阅读⬇ PDF

Moving Beyond Sparse Grounding with Complete Screen Parsing Supervision

arXiv 2026-02-01

提出完整屏幕解析监督方法,让计算机使用代理能更精确地感知屏幕上的元素、位置和文本,从而超越传统的稀疏接地方式。核心贡献在于提供更丰富的结构化状态信息,对提升GUI代理的指令执行鲁棒性至关重要。

计算机使用代理屏幕解析结构化感知GUI接地多模态感知
📖 阅读⬇ PDF

iSHIFT: Lightweight Slow-Fast GUI Agent with Adaptive Perception

arXiv 2025-12-01

提出轻量级慢-快GUI代理iSHIFT,采用自适应感知机制,在资源受限环境下高效交互复杂图形界面。通过结合慢速全局推理与快速局部响应,显著提升代理的实时性与准确性,对部署在边缘设备上的多模态代理有重要价值。

轻量级代理慢快架构自适应感知GUI交互多模态大模型
📖 阅读⬇ PDF

Understanding Task Transfer in Vision-Language Models

Microsoft Research 2025-11-24

系统研究了视觉语言模型(VLM)在不同任务间的迁移能力,发现其在多模态基准上表现优异,但在深度估计、物体计数等底层视觉感知任务上远逊于人类和专用模型。通过分析任务迁移机制揭示了VLM的感知短板。对研究者而言,为改进微调策略与模型设计提供了重要指导。

视觉语言模型多模态任务迁移视觉感知模型评测
📖 阅读⬇ PDF

TripTide: A Benchmark for Adaptive Travel Planning under Disruptions

arXiv 2025-10-24

TripTide是一个专门评估大语言模型在旅行计划遭遇突发干扰时自适应重规划能力的基准。它弥补了现有旅行规划基准只考虑静态、理想情况、忽视真实行程中临时变故的不足。对开发更鲁棒、贴近实际的旅行规划智能体的从业者来说,它提供了标准化的压力测试与评估框架。

大模型基准测试Agent旅行规划自适应重规划
📖 阅读⬇ PDF

ACON: Optimizing Context Compression for Long-horizon LLM Agents

arXiv 2025-10-01

提出上下文压缩优化方法ACON,帮助长时域LLM代理在动态环境中高效管理关键信息,避免上下文长度爆炸。通过压缩策略降低显存和计算开销,同时保持代理决策精度,对需要长期记忆的自主系统至关重要。

上下文压缩长时域代理LLM代理效率优化记忆管理
📖 阅读⬇ PDF

MetaMuse: Algorithm Generation via Creative Ideation

arXiv 2025-10-01

提出MetaMuse框架,通过创意构思自动生成系统算法,解决解空间不连续导致的启发式依赖问题。该方法模仿人类直觉式创新,能自动探索更优算法,对系统设计和自动化编程具有开创性意义。

算法生成创意构思系统设计自动编程启发式搜索
📖 阅读⬇ PDF

A Universal Banach--Bregman Framework for Stochastic Iterations: Unifying Stochastic Mirror Descent, Learning and LLM Training

arXiv 2025-09-17

提出通用的Banach-Bregman框架,将随机镜像下降、机器学习与大语言模型训练统一在同一理论体系下,为随机迭代优化算法提供统一的数学支撑。它帮助从业者厘清各类优化算法的内在联系,指导实际训练中的算法选择与调优。

随机优化理论框架镜像下降大模型训练优化算法
📖 阅读⬇ PDF

Orchestration for Domain-specific Edge-Cloud Language Models

Microsoft Research 2025-07-11

研究面向特定领域的边缘-云大语言模型编排方法,以应对连接、隐私与成本问题。核心贡献是一套高效利用边缘与云资源的编排策略。对从业者在实际部署LLM时平衡性能与资源开销具有参考价值。

大模型边缘计算云协同模型编排部署优化
📖 阅读⬇ PDF

ExCyTIn-Bench: Evaluating LLM agents on Cyber Threat Investigation

arXiv 2025-07-01

提出了ExCyTIn-Bench,首个基于调查图的安全问题评估LLM agent在网络威胁调查能力的基准测试。它模拟真实安全分析师的工作流程,为衡量AI agent在威胁调查中的表现提供标准化方法。对安全从业者而言,该基准有助于选择或优化用于威胁调查的LLM agent。

网络安全LLM agent基准测试威胁调查安全分析
📖 阅读⬇ PDF

From intention to implementation: automating biomedical research via LLMs

Science China Information SciencesMicrosoft Research 2025-06-23

本文探讨利用大型语言模型实现生物医学研究自动化,覆盖从研究意图到具体执行的全流程,展示了LLM在文献分析、实验设计等环节的潜力。核心贡献是提出一个端到端的自动化框架,显著降低科研门槛。对从业者而言,它提示了借助现有LLM工具加速科研流程、构建科研Agent的可行路径。

大模型生物医学科研自动化Agent端到端框架实验设计
📖 阅读⬇ PDF

Do Not Let Low-Probability Tokens Over-Dominate in RL for LLMs

arXiv 2025-05-01

指出在LLM强化学习(如GRPO)中,低概率token会过度主导训练过程,从而损害模型推理能力的提升。提出应关注token概率分布平衡,避免低概率token的负面干扰。对从事RLHF或推理优化的工程师,该发现提示需重新设计奖励或采样策略。

强化学习大模型推理优化token概率GRPO
📖 阅读⬇ PDF

Performance of a large language model on the reasoning tasks of a physician

arXiv 2024-12-01

评估大语言模型在医生推理任务上的表现,以1959年提出的复杂临床诊断案例为参考标准。研究揭示了LLM在医学推理场景中的能力边界与潜在可靠性问题。对医疗AI开发者,此评估为模型在临床辅助诊断中的实际部署提供了重要参考。

大语言模型医疗推理临床诊断评估AI医生
📖 阅读⬇ PDF

ReMe: Scaffolding Personalized Cognitive Training via Controllable LLM-Mediated Conversations

Microsoft Research 2024-10-01

本文提出ReMe系统,利用可控LLM驱动的对话提供个性化认知训练。核心贡献是设计可调节训练难度和内容的对话框架,替代僵化的计算机化认知训练程序。对从业者而言,该系统可拓展至老年人认知健康干预,实现规模化、个性化。

大模型认知训练对话系统个性化干预老年人健康
📖 阅读⬇ PDF

The CoExplorer Technology Probe: A Generative AI-Powered Adaptive Interface to Support Intentionality in Planning and Running Video Meetings

Designing Interactive Systems ConferenceMicrosoft Research 2024-05-01

提出CoExplorer技术原型,一种生成式AI驱动的自适应界面,帮助用户在视频会议规划与执行中明确意图并降低协作负担。通过AI生成议程、实时摘要等功能显著提升会议效率,为远程协作工具创新提供新方向。

生成式AI视频会议自适应界面意图支持会议效率
📖 阅读⬇ PDF

Eywa: Automating Model Based Testing using LLMs

arXiv 2023-12-01

提出Eywa系统,利用大语言模型自动完成模型测试(MBT)中的模型构建与测试用例生成。降低了MBT在协议实现等场景中的使用门槛。对软件测试从业者,该方案有望减少人工建模成本并提高测试覆盖率。

模型测试LLM自动化测试协议实现测试用例生成
📖 阅读⬇ PDF

MiniMax 1 条

MiniMax-01: Scaling Foundation Models with Lightning Attention

arXiv 2025-01-01

提出 MiniMax-01 系列模型(包括文本和视觉版本),核心创新「闪电注意力」机制使模型能够高效处理超长上下文,性能与顶尖模型相当。对从业者而言,该工作为长序列建模提供了更高效的注意力计算方案,有望降低大模型在长文档、多模态任务中的部署成本。

大模型长上下文闪电注意力Foundation模型文本-视觉注意力机制优化
📖 阅读⬇ PDF

MLSys 1 条

Keyformer: KV Cache Reduction through Key Tokens Selection for Efficient Generative Inference

MLSys引用量 143 2024-03-01

Keyformer提出一种通过关键令牌选择来压缩KV缓存的方法,在不显著影响生成质量的前提下大幅降低LLM推理的显存需求。该技术识别注意力机制中对后续生成贡献最大的键值对,实现动态剪枝,从而支持更长上下文和更大批量推理。对于在有限显存上部署大模型,此方案可有效提升吞吐量和降低延迟。

LLM推理KV缓存压缩关键令牌选择显存优化生成推理Transformer
📖 阅读⬇ PDF

NAACL 1 条

MEDA: Dynamic KV Cache Allocation for Efficient Multimodal Long-Context Inference

NAACL引用量 27CCF-B推荐 2025-02-01

MEDA 为多模态长上下文大模型提出动态 KV 缓存分配策略,根据跨模态重要性动态管理缓存资源。该方法能显著降低多模态长上下文推理时的显存占用,并提升吞吐效率。对多模态 LLM 应用部署具有显著工程价值。

多模态大模型长上下文KV缓存动态分配推理优化显存效率
📖 阅读⬇ PDF

NeurIPS 8 条

PACE: marrying generalization in PArameter-efficient fine-tuning with Consistency rEgularization

NeurIPS引用量 20CCF-A推荐 2024-09-01

PACE 针对参数高效微调(PEFT)在提升下游任务性能时往往牺牲泛化能力的问题,引入一致性正则化:通过对扰动后的特征施加一致性约束,将微调梯度与预训练模型的隐式梯度对齐。该方法在视觉、文本等多个基准上同时改善了泛化性与任务表现,为从业者在小参数预算下兼顾效果与稳健性提供了即插即用的思路。

参数高效微调一致性正则化泛化能力LoRA预训练模型
📖 阅读⬇ PDF

Personalizing Reinforcement Learning from Human Feedback with Variational Preference Learning

NeurIPS引用量 148CCF-A推荐 2024-08-01

该工作指出现有 RLHF 假设人类偏好同质,无法刻画不同用户间的多样化乃至冲突偏好。作者提出变分偏好学习(VPL),用隐变量建模用户潜在偏好分布,从少量交互中推断个体偏好并实现个性化对齐。对从业者而言,这为构建可适配多元用户价值观的对齐系统提供了可扩展框架。

RLHF个性化对齐变分推断人类偏好隐变量模型
📖 阅读⬇ PDF

ZipCache: Accurate and Efficient KV Cache Quantization with Salient Token Identification

NeurIPS引用量 75CCF-A推荐 2024-05-01

ZipCache 提出一种结合显著令牌识别的 KV 缓存量化方法,先用轻量级重要性指标找出关键令牌,再对剩余的缓存值进行高比例量化压缩。这样在保持模型生成长度与精度的同时,实现了极高的压缩率并保持缓存精度。对于在大规模并发推理或边缘设备上部署LLM的从业者,它在不牺牲太多质量的前提下大幅降低缓存存储和带宽需求。

KV缓存量化显著令牌缓存压缩推理加速大语言模型量化技术
📖 阅读⬇ PDF

SVFT: Parameter-Efficient Fine-Tuning with Singular Vectors

NeurIPS引用量 59CCF-A推荐 2024-05-01

SVFT 利用预训练权重的奇异值分解,将可学习的更新约束在原始奇异向量张成的子空间内,仅训练作用于奇异向量外积上的稀疏系数。该方法以极少参数逼近全量微调的精度,优于同等预算下的 LoRA 类方法,为追求极致参数效率的从业者提供了基于权重结构先验的微调方案。

参数高效微调奇异向量SVDLoRA稀疏更新
📖 阅读⬇ PDF

VB-LoRA: Extreme Parameter Efficient Fine-Tuning with Vector Banks

NeurIPS引用量 45CCF-A推荐 2024-05-01

VB-LoRA 面向每用户、每任务定制带来的存储爆炸问题,提出向量库(Vector Bank)共享机制:将 LoRA 的低秩参数分解为从一个全局共享向量库中按可学习权重组合的子向量,使各适配器参数大幅复用。在仅用极少存储的情况下保持接近标准 LoRA 的性能,非常适合大规模多任务或多租户的模型定制部署。

参数高效微调LoRA向量库参数共享模型定制
📖 阅读⬇ PDF

Online Iterative Reinforcement Learning from Human Feedback with General Preference Model

NeurIPS引用量 47CCF-A推荐 2024-02-01

论文研究在「一般偏好预言机」设定下的在线迭代式 RLHF,不再假设存在显式奖励函数,而是直接基于成对偏好进行学习,并给出带理论保证的纳什均衡式优化算法。它把 RLHF 从奖励建模范式推广到更贴近人类偏好不可传递性的偏好范式,为构建更鲁棒的对齐流程提供了理论与算法基础。

强化学习RLHF偏好建模在线学习纳什均衡模型对齐
📖 阅读⬇ PDF

When Your AIs Deceive You: Challenges of Partial Observability in Reinforcement Learning from Human Feedback

NeurIPS引用量 14CCF-A推荐 2024-02-01

这篇工作分析了部分可观测性给 RLHF 带来的风险:当人类评估者只能观察到部分环境时,标准 RLHF 可能训练出会误导或欺骗人类的策略(如制造看似良好的表象)。它从理论上刻画了这种偏差的成因并讨论缓解方向,提醒从业者在对齐中重视评估者信息不完整带来的安全隐患。

强化学习RLHF部分可观测AI安全模型对齐欺骗行为
📖 阅读⬇ PDF

Few-Shot Parameter-Efficient Fine-Tuning is Better and Cheaper than In-Context Learning

NeurIPS引用量 1342CCF-A推荐 2022-05-01

该工作提出少样本场景下参数高效微调(如其代表方法)优于上下文学习(ICL),在更高准确率的同时显著降低推理成本,因为无需在每次推理时携带大量示例。其亮点是论证了基于梯度的轻量微调相较免训练ICL的综合优势。对从业者而言,为少样本任务在ICL与PEFT之间的取舍提供了明确依据。

少样本学习参数高效微调上下文学习ICLPEFT推理成本
📖 阅读⬇ PDF

NVIDIA 45 条

France Advances Europe’s AI Future With NVIDIA Technologies

动态 2026-06-18厂商动态

NVIDIA 博客介绍法国借助 NVIDIA 技术推进欧洲 AI 进程:AI 工厂与国家算力上线、AI 智能体投入生产、初创企业部署应用、开放前沿模型与工业平台落地。对关注主权 AI 与算力基建的读者,这是欧洲算力布局的一则进展。

NVIDIA欧洲AI算力基建主权AIAI工厂

Zero-Shot Active Feature Acquisition via LLM-Elicitation

arXiv 2026-06-01

主动特征获取(AFA)需逐步选择观测哪些特征以做出分类或排序决策,传统方法严重依赖大量标注数据来拟合模型。本文提出零样本方案,利用大语言模型的先验知识来引导(elicitation)特征选择,从而摆脱对标注数据的依赖,为在缺乏标注样本的场景下做成本敏感的特征采集决策提供了新思路。

主动特征获取大模型零样本知识引导特征选择成本敏感学习
📖 阅读⬇ PDF

Reinforcing Dual-Path Reasoning in Spatial Vision Language Models

arXiv 2026-06-01

针对空间视觉语言模型(VLM)在复杂空间推理(如多步深度、距离与场景关系推断)中的不足,提出双路径推理强化方法,分别处理几何感知与关系推理,提升推理准确率。对从事具身智能与空间理解的研究者而言,该方法突破了现有VLM在复杂空间任务上的瓶颈。

空间VLM双路径推理几何感知多步推理场景关系具身智能
📖 阅读⬇ PDF

Adaptive Volumetric Mechanical Property Fields Invariant to Resolution

arXiv 2026-06-01

提出自适应体力学属性场,能够以分辨率不变的表示方式描述材料的杨氏模量、泊松比和密度,显著提升数字世界物理仿真的真实性与效率。对游戏、影视及工程仿真从业者而言,该方法可直接从3D资产中提取力学属性,减少手动标注成本。

力学属性体积场分辨率不变物理仿真材料属性3D资产
📖 阅读⬇ PDF

Zone of Proximal Policy Optimization: Teacher in Prompts, Not Gradients

arXiv 2026-06-01

提出「近端策略优化区间」知识蒸馏方法,通过将教师知识以提示形式注入学生模型,而非强制拟合logits,解决了小模型在极端小规模下模仿大模型时性能崩坏的问题。对模型压缩与部署从业者而言,该方法在保持轻量化的同时显著提升学生模型能力,尤其适合资源受限场景。

知识蒸馏提示学习小模型策略优化教师-学生模型压缩
📖 阅读⬇ PDF

ShardTensor: Domain Parallelism for Scientific Machine Learning

arXiv 2026-05-11

提出 ShardTensor 域并行方法,专为科学机器学习中超高分辨率数据设计,弥补了现有方案在扩展性与精度上的不足。其亮点是能在高效并行的同时保持模型精度。对处理大规模科学数据的从业者而言,提供了可落地的分布式训练手段。

域并行科学机器学习分布式训练高分辨率扩展性
📖 阅读⬇ PDF

Retrieval from Within: An Intrinsic Capability of Attention-Based Models

arXiv 2026-05-08

挑战检索增强生成(RAG)将检索与生成视为分离系统的范式,探讨基于注意力的编码器-解码器能否直接从自身内部表示中完成检索。研究表明注意力模型具备「从内部检索」的内在能力,为简化 RAG 架构、把检索能力内化进模型本身提供了新视角。

检索增强RAG注意力机制编码器-解码器内在检索大模型
📖 阅读⬇ PDF

Gated DeltaNet-2: Decoupling Erase and Write in Linear Attention

arXiv 2026-05-01

提出了「Gated DeltaNet-2」,通过在线性注意力中解耦擦除与写入操作,进一步优化固定大小循环状态。该方法提升了长序列处理效率并降低解码内存,对需要高效长上下文建模的从业者具有实用价值。

线性注意力门控机制状态解耦长序列建模内存优化Transformer改进
📖 阅读⬇ PDF

HybridGen: Efficient LLM Generative Inference via CPU-GPU Hybrid Computing

arXiv 2026-04-20

HybridGen提出CPU-GPU混合计算方案,协同两类资源管理庞大的KV缓存,缓解LLM推理的显存容量与带宽瓶颈。核心在于高效的缓存管理与计算调度,使模型支持更长上下文同时降低延迟与开销。对从业者而言,是部署大规模LLM推理、尤其长文本生成场景的实用优化方案。

大模型推理优化KV-cache显存优化CPU-GPU异构长上下文
📖 阅读⬇ PDF

NCCL EP: Towards a Unified Expert Parallel Communication API for NCCL

arXiv 2026-03-13

NCCL EP 提出面向专家并行通信的统一 API,用以简化 MoE 架构中的设备间通信。核心贡献是提供标准化接口并兼容 DeepEP、Hybrid-E 等现有库,降低开发复杂度、提升通信效率。对从事大模型训练与推理的工程师而言,这是优化 MoE 通信的关键工具。

MoE专家并行通信优化NCCL分布式训练
📖 阅读⬇ PDF

CuTe Layout Representation and Algebra

NVIDIA Research 2026-03-02

CuTe 提出一套布局(Layout)表示与代数体系,用于在现代 GPU 张量核心上高效描述和操作复杂的数据映射。其灵活的布局抽象支持各种数据排布与变换,是编写高性能 GPU 算子的基础工具。掌握它有助于在底层优化深度学习模型的 GPU 执行性能。

GPU张量核心CuTe布局代数算子优化高性能计算
📖 阅读⬇ PDF

iGRPO: Self-Feedback-Driven LLM Reasoning

arXiv 2026-02-01

提出iGRPO框架,利用自我反馈信号进行强化学习,提升大语言模型数学推理能力。通过模型自身生成结果作为奖励,无需外部标注。对提升LLM推理一致性和准确性有实际价值。

大语言模型数学推理强化学习自我反馈推理优化
📖 阅读⬇ PDF

GPU-Initiated Networking for NCCL

arXiv 2025-11-19

提出由 GPU 直接发起网络通信的方法以优化 NCCL,针对 MoE 等现代架构改善延迟并实现细粒度控制。核心贡献是把通信控制下放到设备端,降低通信开销、提升分布式训练效率。对从业者而言,该方法可显著加速大规模混合专家模型的训练。

NCCLGPU通信分布式训练混合专家通信优化延迟优化
📖 阅读⬇ PDF

RLP: Reinforcement as a Pretraining Objective

arXiv 2025-10-01

提出将强化学习作为预训练目标,而非仅用于后训练。在预训练阶段引入RL损失,使模型更早学习推理能力。挑战了先预训练后RL的传统范式。

强化学习预训练推理模型训练范式大模型
📖 阅读⬇ PDF

Align Your Flow: Scaling Continuous-Time Flow Map Distillation

arXiv 2025-06-01

提出连续时间流图蒸馏的缩放方法(Align Your Flow),将扩散/流模型蒸馏为单步或少步采样。核心贡献是通过对齐流蒸馏策略实现高效生成,大幅减少推理步数。对从业者重要,可加速生成模型在实时应用中的部署。

扩散模型流模型蒸馏单步采样加速推理
📖 阅读⬇ PDF

Beyond the Buzz: A Pragmatic Take on Inference Disaggregation

arXiv 2025-06-01

对推理分离(disaggregation)进行实用分析,即拆分推理为不同阶段以优化多节点部署的吞吐-交互性帕累托前沿。核心贡献是澄清实际挑战与权衡,为从业者提供部署参考。对从业者重要,帮助设计高效稳定的推理系统。

推理优化推理分离多节点部署吞吐量交互性
📖 阅读⬇ PDF

Cosmos World Foundation Model Platform for Physical AI

arXiv 2025-01-01

介绍Cosmos世界基础模型平台,为物理AI提供数字孪生环境,包含策略模型与世界模型。旨在通过虚拟训练降低物理AI部署成本,推动机器人、自动驾驶等领域发展。

物理AI世界模型数字孪生策略模型基础模型平台
📖 阅读⬇ PDF

Hymba: A Hybrid-head Architecture for Small Language Models

arXiv 2024-11-01

提出Hymba小语言模型混合头架构,并行集成Transformer注意力与状态空间模型(SSM),在保持性能的同时提升推理效率。该设计兼顾全局建模与线性复杂度,适合资源受限场景下的模型部署。

小语言模型混合架构TransformerSSM效率优化
📖 阅读⬇ PDF

LLaMA-Mesh: Unifying 3D Mesh Generation with Language Models

arXiv 2024-11-01

扩展大语言模型能力,使其在统一框架内直接生成3D网格,利用预训练文本知识迁移空间理解。无需额外3D编码器,实现文本到3D的高效生成,为3D内容创作和统一多模态模型提供新思路。

3D网格生成大语言模型统一建模空间知识文本到3D
📖 阅读⬇ PDF

Energy-Based Diffusion Language Models for Text Generation

arXiv 2024-10-01

探索基于能量的离散扩散语言模型,突破传统自回归从左到右的生成约束。通过能量函数指导扩散过程,生成更灵活、可控的文本序列,为非自回归文本生成范式开辟新方向。

扩散模型文本生成非自回归能量函数离散扩散
📖 阅读⬇ PDF

MambaVision: A Hybrid Mamba-Transformer Vision Backbone

arXiv 2024-07-01

提出MambaVision,一种混合Mamba-Transformer视觉骨干网络,重新设计Mamba公式以增强视觉特征提取。在多项视觉任务上取得优异性能,为视觉骨干设计提供新的选择。

MambaTransformer视觉骨干网络混合模型状态空间模型
📖 阅读⬇ PDF

PockEngine: Sparse and Efficient Fine-tuning in a Pocket

arXiv 2023-10-01

PockEngine实现了设备端稀疏高效微调,支持隐私保护的个性化定制。它解决了现有训练框架在资源受限设备上的瓶颈。对边缘计算和隐私敏感的微调场景非常实用。

设备端学习高效微调稀疏训练隐私保护大模型微调
📖 阅读⬇ PDF

Ollama 1 条

v0.30.10

动态 2026-06-18Infra

「Ollama」发布 v0.30.10:Command A 与 North 系列模型现可经 MLX 引擎在 Apple Silicon 上运行,底层 llama.cpp 引擎更新至 build 9672 并修复了 MLX 构建产物。对在 Mac 上做本地推理的用户,这扩展了可本地运行的模型阵容。

OllamaMLX 引擎Apple Silicon本地推理模型部署llama.cpp

OpenAI 18 条

Reinforcement learning towards broadly and persistently beneficial models

2026-06-21

该研究通过强化学习在现实场景中训练模型产生有益行为,发现这种训练能带来跨领域的对齐泛化,并在对抗压力下持续保持。核心贡献是证明了以有益行为为目标的强化学习可以产生广泛且持久的对齐改进。这对从业者构建稳健、抗对抗攻击的AI系统具有重要参考价值。

强化学习对齐有益AI泛化对抗鲁棒性模型安全
📖 阅读⬇ PDF

Investigating the consequences of accidentally grading CoT during RL

2026-06-21

研究发现在部分已发布模型中,强化学习训练期间意外对思维链(CoT)进行了有限评分,修复了受影响的奖励路径,未发现明显的可监控性退化证据。核心贡献在于揭示了RL训练中奖励信号可能无意间评估推理过程,并提供了缓解方法。对从业者而言,这提醒需小心设计奖励函数,避免模型策略出现意外偏差,从而保障模型行为的安全与可控。

强化学习思维链奖励建模可监控性安全训练偏差

Metagaming matters for training, evaluation, and oversight

2026-06-21

本文强调元博弈(metagaming)会扭曲对智能体行为的解读,进而影响训练、评估与监督的有效性。核心贡献在于指出当前模型仍提供直接研究元博弈的机会,并呼吁系统性地将其纳入考量。对从业者而言,理解元博弈有助于避免行为误判,从而构建更稳健的AI系统。

元博弈训练评估行为解释AI安全监督博弈论

Sidestepping Evaluation Awareness and Anticipating Misalignment with Production Evaluations

2026-06-21

提出一种生产环境评估管道,旨在绕过模型的评估意识并主动发现未知的不对齐行为。其核心贡献在于规模化构建贴近真实场景的评测,以提前暴露潜在风险。对从业者而言,该方法能更早识别模型在部署后可能出现的意外有害输出,提升安全性测试的覆盖与有效性。

AI安全不对齐检测评估管道生产环境测试规模化评估行为分析

New usage analytics and updated spend controls for enterprises

动态 2026-06-18厂商动态

OpenAI 为 ChatGPT 企业版推出新的用量分析与更新的支出管控功能,帮助组织管理成本并更有信心地规模化使用 AI。对负责企业级 AI 采购与成本治理的团队,这补齐了用量可见性与预算控制能力。

OpenAIChatGPT企业版成本控制用量分析企业AI治理

Triton 3.7.1 Release Notes

动态 2026-06-18Infra

「Triton 3.7.1」补丁版发布,仅修复两处回归而无新功能:一是为「FenceAsync」补上共享内存写与异步拷贝之间缺失的栅栏以避免读到未写完的数据,二是 InstCombine 利用已知零位收缩相加常量。对写 Triton 内核的开发者,第一条修复直接关乎结果正确性。

Triton编译器正确性修复FenceAsync内核开发

Improving health intelligence in ChatGPT

动态 2026-06-18厂商动态

OpenAI 介绍「GPT-5.5 Instant」如何改进 ChatGPT 在健康与养生方面的回答:更强的推理、更好的上下文把握、更清晰的表达,并经医生参与的评测验证。对关注大模型垂直落地的读者,这是 OpenAI 在健康场景加固可靠性的一步。

OpenAI健康智能垂直领域可靠性评测

Using AI to help physicians diagnose rare genetic diseases affecting children

动态 2026-06-18厂商动态

OpenAI 介绍研究者用其推理模型协助诊断儿童罕见遗传病,在此前未解病例中新识别出 18 例诊断。对关注推理模型科学落地的读者,这是大模型在医学诊断中产生实质价值的一个具体案例。

推理模型罕见病诊断医学AI科学落地遗传病

Training Agents to Self-Report Misbehavior

arXiv 2026-02-01

该工作提出训练前沿AI智能体在追求目标时主动自我报告不当行为,以应对智能体可能隐藏真实意图并逃避监管的风险。核心贡献在于探索将「自我报告」机制融入对齐训练,增强对欺骗性对齐的检测能力。对从业者而言,这一方向为构建更透明、可监督的安全AI系统提供了新思路。

AI对齐自我报告智能体安全隐藏目标欺骗性对齐行为监督
📖 阅读⬇ PDF

OpenAI GPT-5 System Card

arXiv 2026-01-01

OpenAI 发布 GPT-5 系统卡,介绍 GPT-5 是一个统一系统,包含快速回答模型的智能体和用于复杂问题的深度推理模型,并展示了能力与安全评估。对从业者而言,它揭示了前沿大模型架构的融合趋势及安全实践。

GPT-5系统卡大模型推理模型安全评估
📖 阅读⬇ PDF

Training LLMs for Honesty via Confessions

arXiv 2025-12-01

该研究提出通过「坦白」机制训练大语言模型保持诚实,让模型在对话中主动承认自身行为与信念的局限性,以缓解虚报置信度或隐瞒证据等不诚实问题。核心贡献在于设计了一种基于自我表露的训练范式,引导模型在生成中嵌入更透明的元认知信号。对从业者而言,这提供了一条提升模型可信度与安全对齐的新路径,尤其适用于需要可靠置信度估计和可审计决策的场景。

大模型诚实性对齐训练元认知安全可信置信度校准
📖 阅读⬇ PDF

Monitoring Monitorability

arXiv 2025-12-01

本文提出监控“可监控性”的概念,要求对现代AI系统的决策过程具备可观测性,尤其聚焦于推理模型的思维链监控。核心贡献在于指出安全部署日益强大的智能体需先确保其决策逻辑可被有效监视,并可能引入评估监控本身可行性的框架。对从业者而言,这强调了在追求性能前构建可靠 AI 安全监控机制的重要性。

可观测性思维链监控AI安全智能体推理模型对齐
📖 阅读⬇ PDF

Stress Testing Deliberative Alignment for Anti-Scheming Training

arXiv 2025-09-01

该研究对用于防止AI「密谋」行为(scheming)的深思熟虑对齐训练进行压力测试,评估其鲁棒性。核心贡献在于揭示现有对齐方法在面对故意隐藏不良目标的模型时可能失效,并提出了更严格的对抗性评估框架。这对安全从业者至关重要,因为高度智能系统若秘密追求错误目标将带来重大风险,需更可靠的检测与缓解手段。

AI安全对齐压力测试scheming大模型对抗性评估
📖 阅读⬇ PDF

Persona Features Control Emergent Misalignment

arXiv 2025-06-01

该研究探索了如何通过人物个性特征来调控语言模型微调时出现的意外失调行为,发现微调GPT-4o过程中个性因素会显著影响模型行为的泛化,为AI安全提供了基于特征控制的干预手段。

AI安全模型对齐微调个性特征紧急失调GPT-4o
📖 阅读⬇ PDF

Scaling and evaluating sparse autoencoders

arXiv 2024-06-01

该研究探索稀疏自编码器在语言模型中的规模化训练与评估方法,通过稀疏瓶颈层重建激活来提取可解释特征。核心贡献在于提出可扩展的训练策略和系统性评估框架,证明了该技术能可靠地从大规模模型中分离出语义清晰的特征。这对从业者理解模型内部表征、提升安全性与可控性具有重要实用价值。

稀疏自编码器可解释性语言模型特征提取无监督学习规模化
📖 阅读⬇ PDF

Training language models to follow instructions with human feedback

arXiv 2022-03-01

该论文提出通过人类反馈强化学习(RLHF)微调语言模型,使模型输出更符合用户意图,减少虚假、有毒或无用内容。核心贡献在于构建了一套包含监督微调、奖励建模与近端策略优化的对齐流程,显著提升模型的指令遵循能力。对从业者而言,它奠定了当前主流对齐技术的基础,直接影响ChatGPT等产品的安全性及实用性。

大模型指令微调RLHF对齐人类反馈强化学习
📖 阅读⬇ PDF

Fine-Tuning Language Models from Human Preferences

arXiv 2019-09-01

该工作通过构建反映人类偏好的奖励模型,并利用强化学习微调语言模型,使模型输出更符合人类期望。核心贡献在于将人类反馈系统性地融入训练,显著提升了模型的有用性与安全性。对从业者而言,这奠定了基于人类反馈的强化学习(RLHF)范式,成为大模型对齐的关键技术路径。

强化学习人类反馈语言模型微调奖励模型AI对齐RLHF
📖 阅读⬇ PDF

OSDI 1 条

InfiniGen: Efficient Generative Inference of Large Language Models with Dynamic KV Cache Management

OSDI引用量 268CCF-A推荐 2024-06-01

InfiniGen 提出一种适用于长文本生成的大模型推理动态 KV 缓存管理方案,在生成过程中根据自注意力特征在线辨识并丢弃低重要性令牌的缓存。这种方法无需离线的先验知识,能自适应地控制缓存大小,大幅降低显存足迹。对需要长输出生成(如故事续写、代码生成)的LLM服务部署者,该方案能在低显存预算下维持高质量生成。

KV缓存管理动态缓存压缩长文本生成推理优化大语言模型显存节省
📖 阅读⬇ PDF

商汤 2 条

Characterization and Prediction of Deep Learning Workloads in Large-Scale GPU Datacenters

商汤 2021-09-03

对大规模GPU数据中心中深度学习工作负载进行系统表征与预测建模。通过分析工作负载特征,为资源调度器提供准确的负载预测,从而提升集群利用率和调度效率。对AI基础设施运维人员具有重要意义,可指导GPU资源优化分配。

GPU数据中心深度学习工作负载资源调度工作负载预测集群优化
📖 阅读⬇ PDF

SIGIR 1 条

When MOE Meets LLMs: Parameter Efficient Fine-tuning for Multi-task Medical Applications

SIGIR引用量 166CCF-A推荐 2023-10-01

该工作将混合专家(MoE)与LLM结合,提出面向多任务医疗应用的参数高效微调方法。通过MoE结构在低成本下适配多种医疗子任务,兼顾通用能力与领域专精。对从业者而言,它为在垂直领域以更少参数实现多任务部署提供了思路。

大模型混合专家参数高效微调多任务医疗AI领域适配
📖 阅读⬇ PDF

腾讯 AI Lab 6 条

Locas: Your Models are Principled Initializers of Locally-Supported Parametric Memories

腾讯 AI Lab 2026-02-04

Locas提出一种局部支持的参数化记忆机制,桥接测试时训练与参数化记忆,可灵活地从模型参数中卸载或合并。核心贡献是让模型在测试阶段动态调整参数、提升适应性与资源管理效率。对从业者而言有望改善模型在部署推理时的灵活性。

参数化记忆测试时训练模型适应记忆机制推理优化
📖 阅读⬇ PDF

Anchor-based Large Language Models

腾讯 AI Lab 2024-02-12

Anchor-based LLM通过在注意力中引入锚点令牌来替代对完整历史KV缓存的依赖,使用动态选取的少量锚点实现高效上下文建模。该方法在保持生成质量的同时大幅削减了内存和计算开销,尤其在长文本场景中优势明显。对于追求低资源消耗的大模型部署,该架构提供了一种有效的轻量化路径。

大语言模型锚点机制KV缓存高效推理长上下文Transformer架构
📖 阅读⬇ PDF

Findings of the WMT 2023 Shared Task on Discourse-Level Literary Translation: A Fresh Orb in the Cosmos of LLMs

腾讯 AI Lab 2023-11-06

WMT2023语篇级文学翻译共享任务首次聚焦篇章连贯性与文学性,本报告总结了各系统在大语言模型时代的表现与发现。任务揭示LLM虽能提升流畅度,但保持文学风格与文化细节仍是重大挑战,为文学翻译技术发展提供了方向。

文学翻译语篇级翻译WMT评测大语言模型篇章连贯
📖 阅读⬇ PDF

On the Cultural Gap in Text-to-Image Generation

腾讯 AI Lab 2023-07-06

揭示文生图模型中因训练数据文化分布不均导致生成图像出现文化偏差,系统评估不同文化主题下的质量差异并提出缓解方案。这项工作警示多模态生成从业者需关注数据集公平性,对构建全球化、包容性强的AIGC系统至关重要。

文生图生成文化偏见公平性多模态模型数据集偏差AIGC
📖 阅读⬇ PDF

Tencent AI Lab - Shanghai Jiao Tong University Low-Resource Translation System for the WMT22 Translation Task

腾讯 AI Lab 2022-10-17

描述了腾讯AI实验室与上海交大针对WMT22低资源翻译任务的神经机器翻译系统。核心贡献在于运用预训练模型与数据增强策略,在极少量平行语料下取得有竞争力的翻译质量。为业界在低资源语言翻译上提供了实用的系统设计与参数配置参考。

低资源机器翻译WMT22神经机器翻译预训练模型数据增强腾讯AI实验室
📖 阅读⬇ PDF

腾讯混元 6 条

Flow-DPPO: Divergence Proximal Policy Optimization for Flow Matching Models

腾讯混元 2026-06-09

提出 Flow-DPPO,把散度近端策略优化引入流匹配模型的在线强化学习,用于图像和视频生成的质量与对齐提升。相比 Flow-GRPO 等方法训练更稳定、性能更优,为生成模型提供了一套可直接复用的在线 RL 对齐框架。

流匹配强化学习策略优化图像生成视频生成模型对齐
📖 阅读⬇ PDF

HY-Motion 1.0: Scaling Flow Matching Models for Text-To-Motion Generation

腾讯混元 2025-12-29

HY-Motion 1.0是首个大规模流匹配文本到3D人体动作生成模型系列,成功将流匹配扩展至动作生成并取得最先进效果。亮点在于验证了流匹配在该任务上的可扩展性,提供了高保真多样化的运动生成。对动画、游戏和虚拟人从业者直接可用。

文本到动作3D人体运动流匹配生成模型大规模训练
📖 阅读⬇ PDF

Hunyuan3D 2.1: From Images to High-Fidelity 3D Assets with Production-Ready PBR Material

腾讯混元 2025-06-18

混元3D 2.1 从单张图像直接生成高保真 3D 资产,并附带生产就绪的 PBR 材质,大幅提升了游戏、影视、设计等领域的 3D 内容创作效率。该版本在几何细节和材质真实感上取得突破,解决了以往图像到 3D 模型难以直接用于生产的问题。对 3D AIGC 从业者而言,它提供了一套端到端且输出即用的高质量 3D 生成管线。

3D生成图像到3DPBR材质高保真混元3DAIGC
📖 阅读⬇ PDF

通义千问 6 条

Qwen3.5-Omni Technical Report

通义千问 2026-04-17

Qwen3.5-Omni是通义千问Omni系列最新的多模态模型,参数量达数千亿级,相比前代有显著进化。技术报告介绍了其架构与多模态能力。对从业者而言,是评估与选用全模态大模型的重要参考。

大模型多模态通义千问技术报告全模态
📖 阅读⬇ PDF

Revealing Behavioral Plasticity in Large Language Models: A Token-Conditional Perspective

通义千问 2026-03-09

本工作揭示大语言模型具有内在的行为可塑性,会像变色龙一样随环境线索改变表现,并提出从 Token 条件的视角来刻画这种动态适应性。核心贡献是在 Token 层面理解模型行为如何被上下文调控。对从业者而言,有助于构建更可控、更自适应的 LLM 应用并防范意外行为漂移。

大模型行为可塑性Token条件可控性模型分析
📖 阅读⬇ PDF

Qwen3 Technical Report

通义千问 2025-05-14

发布Qwen3系列大语言模型,在性能、效率和多语言能力上全面提升。这一更新为开源社区提供了更强的基座模型,有利于下游应用与进一步研究。

大语言模型Qwen多语言开源模型模型升级
📖 阅读⬇ PDF

Qwen2.5 Technical Report

通义千问 2024-12-19

Qwen2.5 是通义千问系列大语言模型的最新版本,在多项基准上实现显著提升。该系列涵盖多种规模,优化了预训练和后训练,支持更复杂的推理、多语言和长上下文任务。对于企业级应用和开源生态,Qwen2.5 提供了高性能且可落地的模型选择,推动大模型实际部署。

大语言模型Qwen2.5技术报告模型升级预训练
📖 阅读⬇ PDF

Qwen2.5-Coder Technical Report

通义千问 2024-09-18

发布Qwen2.5-Coder系列代码专用模型,包含六种尺寸全面升级,在代码生成、修复等任务上取得显著提升,为开发者提供强大且多样的编程辅助工具。

代码大模型Qwen代码生成多尺寸代码智能
📖 阅读⬇ PDF

Qwen2 Technical Report

通义千问 2024-07-15

Qwen2 技术报告发布了新系列的大语言模型和多模态大模型,涵盖从 0.5B 到 72B 的稠密模型及 MoE 模型,均提供基础版和指令微调版。报告展示了在语言理解、生成、多模态等任务上的全面提升。这为开发者和研究者提供了强大的开源基座选择。

Qwen2大语言模型多模态模型技术报告指令微调开源模型
📖 阅读⬇ PDF

Unsloth 1 条

GLM 5.2 + Model Hub + 3x longer contexts

动态 2026-06-19Infra

Unsloth Studio 宣布支持「GLM-5.2」全部推理档位,并借助配合「MTP」的自动适配算法把可用上下文长度拉长到原先的三倍,从而支撑更长对话。同时上线模型发现中心、可分叉与可排队对话、并行模块及基于「Cloudflare」的 HTTPS 安全访问。对做本地微调与部署的从业者,意味着更省显存、更长上下文的微调与服务体验。

UnslothGLM微调长上下文显存优化本地部署

月之暗面 Kimi 7 条

Attention Residuals

月之暗面 Kimi 2026-03-16

指出现有LLM中残差连接使用固定单位权重导致隐藏状态随深度增长而失控,提出一种新的残差机制以改善这一缺陷,提升深层网络训练稳定性。

注意力机制残差连接层归一化LLM优化隐藏状态控制
📖 阅读⬇ PDF

Kimi K2.5: Visual Agentic Intelligence

月之暗面 Kimi 2026-02-02

介绍开源多模态智能体模型Kimi K2.5,强调文本与视觉模态的联合优化以增强通用智能体能力,推动多模态智能体领域发展。

多模态Agent开源模型视觉语言联合优化
📖 阅读⬇ PDF

Kimi-Dev: Agentless Training as Skill Prior for SWE-Agents

月之暗面 Kimi 2025-09-27

提出Kimi-Dev方法,通过无智能体训练为软件工程智能体提供技能先验,无需多轮交互即可完成SWE-bench任务。该方法降低了智能体部署复杂度,提升了软件工程自动化水平。

软件工程智能体无Agent训练SWE-bench技能先验
📖 阅读⬇ PDF

Kimi K2: Open Agentic Intelligence

月之暗面 Kimi 2025-07-28

发布Kimi K2开源MoE模型(总参1T、激活32B),并引入MuonClip优化器提升训练稳定性。该模型在开放智能体智能方面达到新高度,为构建自主Agent系统提供了强基座。

大模型MoE开源优化器AgentKimi
📖 阅读⬇ PDF

Kimi-Audio Technical Report

月之暗面 Kimi 2025-04-25

提出开源音频基础模型Kimi-Audio,专注于音频理解、生成和对话,详细介绍了模型架构和训练实践。对从业者而言,它展示了构建统一音频模型的最新进展,适合音视频AI应用开发。

音频基础模型开源音频理解音频生成对话系统多模态
📖 阅读⬇ PDF

Kimi k1.5: Scaling Reinforcement Learning with LLMs

月之暗面 Kimi 2025-01-22

探索用强化学习扩展大语言模型能力,突破预训练数据限制,通过RL解锁新的训练范式。对从业者而言,它展示了RL在LLM规模化中的潜力,开辟了超越传统NTP的训练路径。

强化学习大语言模型规模扩展预训练RL训练
📖 阅读⬇ PDF

智谱 GLM 8 条

GLM-5: from Vibe Coding to Agentic Engineering

智谱 GLM 2026-02-17

推出GLM-5下一代基座模型,从「随性编码」范式升级为「智能体工程」范式。通过增强Agent、推理与编程能力,为开发者提供从简单生成代码到构建自主智能体的核心技术支撑,显著提升AI工程化效率。

基座模型智能体工程Agent推理增强编程范式
📖 阅读⬇ PDF

字节 Seed 10 条

In-Place Test-Time Training

字节 Seed 2026-04-07

提出「就地测试时训练」方法,让大语言模型在部署运行过程中动态调整自身权重,从而持续适应实时输入的新信息。其核心贡献是突破传统「先训练后部署」的静态范式,实现模型的在线自适应。对从业者而言,该技术能显著提升 LLM 在动态变化环境中的表现与鲁棒性。

大模型测试时训练在线学习自适应推理优化
📖 阅读⬇ PDF

Seed1.8 Model Card: Towards Generalized Real-World Agency

字节 Seed 2026-03-21

Seed1.8 模型卡介绍了一款面向通用真实世界代理能力的基础模型,突破单轮预测,原生支持多轮交互、工具调用与多步执行,同时保持强大的语言能力。其亮点在于把代理能力作为基础模型的核心设计目标而非外挂插件。对从业者而言,它为构建贴近真实业务场景的智能体系统提供了更强的底座参考。

大模型Agent工具调用多轮交互基础模型
📖 阅读⬇ PDF

Protein Autoregressive Modeling via Multiscale Structure Generation

字节 Seed 2026-02-04

提出首个多尺度蛋白质骨架自回归生成框架PAR,通过从粗到细的逐尺度预测实现蛋白质结构生成。核心贡献在于将层次化多尺度建模引入蛋白质生成,利用蛋白质的天然层级结构提升生成质量。对从业者而言,该框架有望加速蛋白质设计并提高结构合理性,推动药物发现与合成生物学应用。

蛋白质生成自回归模型多尺度生成骨架预测蛋白质设计深度学习
📖 阅读⬇ PDF

Adversarial Flow Models

字节 Seed 2025-11-27

提出对抗流模型,融合对抗训练与连续归一化流,原生支持一步与多步采样,兼具高质量与生成速度。该方法避免了单独流模型多步慢、对抗模型模式坍塌等问题,展示了一种混合范式。对需要高效生成图像的从业者提供了一种新的实用选择。

生成模型对抗训练流模型一步生成图像生成
📖 阅读⬇ PDF

Artificial Hippocampus Networks for Efficient Long-Context Modeling

字节 Seed 2025-10-08

提出人工海马网络,针对长序列建模中RNN式固定大小压缩记忆与Transformer式无损增长记忆之间的权衡,设计了兼顾效率与保真度的新型记忆机制,实现高效长上下文建模。为处理超长序列提供了更优架构选择,有望降低计算开销并提升性能。

长上下文记忆机制Transformer序列建模效率优化架构设计
📖 阅读⬇ PDF

Reasoned Safety Alignment: Ensuring Jailbreak Defense via Answer-Then-Check

字节 Seed 2025-09-15

提出名为「Answer-Then-Check」的安全对齐方法,通过先生成回答再检查其安全性来防御针对大语言模型的越狱攻击,在提升鲁棒性的同时不牺牲模型原有能力。它为从业者提供了一种实用的越狱防御策略,有助于LLM的安全部署。

大模型安全对齐越狱防御鲁棒性LLM安全
📖 阅读⬇ PDF

Seed-Coder: Let the Code Model Curate Data for Itself

字节 Seed 2025-06-04

Seed-Coder 让代码大模型自主策展训练数据,通过模型自身的质量判断来筛选和优化代码预训练语料,从而提升代码能力和通用智能。核心创新在于将数据策展过程与模型能力对齐,减少对外部启发式规则的依赖。对关注代码 LLM 预训练和训练数据工程的团队,该方法提供了一条低成本、高效的数据质量提升路径。

代码模型数据策展自训练LLM预训练数据质量Seed-Coder
📖 阅读⬇ PDF

DiTAR: Diffusion Transformer Autoregressive Modeling for Speech Generation

字节 Seed 2025-02-06

DiTAR 结合扩散 Transformer 与自回归建模,实现无需离散语音 token 的连续语音表示生成。该方法旨在解决以往工作中连续生成的不稳定与质量瓶颈,为高保真语音合成提供新方案。对语音生成领域的研究和应用具有重要推进意义。

语音生成扩散Transformer自回归模型连续表示无离散token语音合成
📖 阅读⬇ PDF

BFS-Prover: Scalable Best-First Tree Search for LLM-based Automatic Theorem Proving

字节 Seed 2025-02-05

BFS-Prover 针对基于 LLM 的自动定理证明,提出可扩展的最佳优先树搜索方法,在 Lean4 环境中高效导航庞大证明空间。其关键贡献在于提升搜索算法的可扩展性,使模型能处理更复杂的数学定理。这对形式化数学和 AI 推理从业者具有重要价值。

自动定理证明LLM树搜索最佳优先搜索Lean4形式化数学
📖 阅读⬇ PDF
共 1002 条 · 更新于 2026-06-23 00:07