🗂 历史归档
每日 AI 速览

2026-06-21

生成于 2026-06-22 08:06

今日导语

今日主线集中在具身智能与 Agent 工程。具身方向多篇论文不约而同地「去机器人数据化」:「HumanScale」用第一人称人类视频超越遥操作轨迹做预训练,「ImageWAM」用图像编辑替代视频生成做世界模型,「ENPIRE」与「Playful」则推动策略自主进化,共同指向更低成本的真实世界学习。Agent 工程同样热闹:思科开源由「Claude Code」驱动的「FAPO」自动提示优化并胜过「GEPA」,AWS 推出「Continuum」与「Context」补齐企业级 Agent 的安全与上下文短板,多篇论文则在评测、状态管理与临床落地上各有推进。基座与 Infra 侧,「UFP4」探索 FP4 预训练消除收缩偏差,「llama.cpp」连发多版强化投机解码与结构化输出。人事上,「AlphaFold」核心 John Jumper 自 DeepMind 转投 Anthropic,凸显顶级人才争夺。

🗞 行业动态 11 条

b9745

llama.cpp · 06-21 19:40 UTC+8

「llama.cpp」b9745 版本为「Step3.5/3.7」的「flash MTP3」多头投机解码补齐支持,新增层偏移与多 MTP 块的草稿生成接口。对本地部署、追求投机解码加速的用户是实打实的吞吐改进。

llama.cpp投机解码推理优化

Cisco AI Introduces FAPO: Pipeline-Aware Prompt Optimization With Step-Level Failure Attribution and Claude Code Orchestration

MarkTechPost · 06-21 07:04 UTC+8

思科基础 AI 团队开源「FAPO」全自动提示优化系统,由「Claude Code」驱动,能逐步定位流水线失败、跨提示与链结构提出变体并经独立评审验证,在 18 项对比中 15 项胜过「GEPA」。为多步 LLM 应用的自动调优提供了可用工具。

Agent提示优化开源厂商动态自动化

Nobel laureate John Jumper is leaving DeepMind for rival Anthropic

TechCrunch · AI · 06-21 00:39 UTC+8

诺贝尔奖得主、「AlphaFold」核心人物 John Jumper 将从 Google DeepMind 离职加盟竞争对手 Anthropic,且并非近期出走的唯一重量级人物。反映顶级 AI 人才流动加剧与厂商间的人才争夺战。

厂商动态人才流动Anthropic

b9747

llama.cpp · 06-21 21:52 UTC+8

「llama.cpp」b9747 版本为服务端新增经由「/models/sse」的实时模型加载进度跟踪,并覆盖多平台多后端构建。对运维本地推理服务、需要可视化加载状态的用户是体验改进。

推理优化llama.cpp推理服务本地部署

AWS says AI agents lack business context and security, launches two services to patch the gaps

The Decoder · 06-21 16:25 UTC+8

AWS 在纽约峰会推出两项服务:「Continuum」自动检测并修复代码漏洞,「Context」从企业数据构建知识图谱为 AI Agent 补充业务上下文,二者都针对「Agent 写代码快但常出错」这一痛点。显示云厂商正补齐企业级 Agent 的安全与上下文短板。

厂商动态Agent企业级AWS

b9744

llama.cpp · 06-21 10:47 UTC+8

「llama.cpp」b9744 版本重构了 GBNF 语法生成中的 until 规则,改用 AC 自动机实现并补充多字符串测试,同时修复了服务端工具的回归问题。对依赖受约束解码与结构化输出的本地用户有质量改进。

推理优化llama.cpp受约束解码结构化输出

b9743

llama.cpp · 06-21 07:10 UTC+8

「llama.cpp」b9743 版本让「JSON Schema」到语法的转换与解析器对齐空格规则,覆盖多平台多后端构建。对依赖 JSON 结构化输出的本地推理用户是细节修正。

推理优化llama.cpp结构化输出JSON Schema

📄 论文 20 篇

📭 今日暂无当天新论文——周末 / 节假日 arxiv 不公告、HuggingFace 每日精选也不更新。以下为近期精选 20 篇

Rethinking Shrinkage Bias in LLM FP4 Pretraining: Geometric Origin, Systemic Impact, and UFP4 Recipe

蚂蚁HF 精选 · 06-19 08:00 UTC+8

提出 UFP4 配方,用基于随机哈达玛变换的均匀 4 比特量化替代「E2M1」格式做大模型 FP4 预训练,从几何层面剖析并消除了量化导致的「收缩偏差」。在多种架构上提升了训练稳定性,对追求低精度、低成本预训练的团队有直接参考价值。

InfraFP4 预训练量化低精度训练
📖 阅读⬇ PDF

S-Agent: Spatial Tool-Use Elicits Reasoning for Spatial Intelligence

HF 精选 · 06-19 08:00 UTC+8

「S-Agent」是一个空间推理框架,为视觉语言模型引入时序记忆与分层空间工具,使其能从多视角图像持续理解三维世界。它把工具调用范式带入空间智能,对做具身与多模态感知 Agent 的开发者有借鉴意义。

空间智能Agent多模态工具调用
📖 阅读⬇ PDF

Context-Aware RL for Agentic and Multimodal LLMs

HF 精选 · 06-19 08:00 UTC+8

「ContextRL」用强化学习奖励为问答对挑选支撑上下文的能力,从而增强长程推理与多模态表现,在多个基准上优于标准方法。它把上下文选择本身作为可优化目标,对长上下文 Agent 与多模态系统有参考价值。

后训练强化学习上下文多模态长程推理
📖 阅读⬇ PDF

Thinking with Visual Grounding

HF 精选 · 06-19 08:00 UTC+8

提出「视觉接地的思考」,把自然语言推理与视觉证据的显式接地结合进视觉语言模型,并借助可扩展数据合成与强化学习提升推理准确率。为多模态模型「边看边想」提供了一条可落地路径。

后训练多模态视觉推理强化学习
📖 阅读⬇ PDF

Duration Aware Scheduling for ASR Serving Under Workload Drift

HF 精选 · 06-19 08:00 UTC+8

提出时长感知的「ASR」服务调度,把音频长度作为处理时间的预测信号,用「SJF」与「HRRN」算法在保持吞吐的同时显著降低中位延迟。对语音识别 serving 与推理优化工程是实用的调度技巧。

推理优化服务调度语音识别
📖 阅读⬇ PDF

Playful Agentic Robot Learning

HF 精选 · 06-19 08:00 UTC+8

研究让具身机器人通过自主玩耍与探索学习可复用技能,再无需额外训练即可迁移到下游任务并提升表现。为机器人无监督技能获取与样本高效学习提供了新范式。

Agent具身智能机器人技能学习
📖 阅读⬇ PDF