Hugging Face梳理AI Agent术语:从「模型」到「Scaffold」「Harness」的实用全景图
Hugging Face 发布博客系统梳理 AI Agent 相关术语,对「模型」「Scaffold(脚手架)」「Harness(执行框架)」等容易混用的概念给出清晰定义,并区分工具、技能、子代理与训练流程中的关键概念。
NTT发布新型推理技术:打破LLM之间的“词汇壁垒”,实现不同AI模型间的知识整合与迁移
NTT提出一种在不降低精度的前提下压缩并统一大规模语言模型(LLM)词汇表的新型推理技术,使得不同LLM之间可以通过共享词汇集合进行协同推理与知识迁移。
国立信息学研究所发布国产全新训练大模型「LLM-jp-4」:开源提供 8B 与 32B MoE 版本
国立信息学研究所(NII)发布面向日语场景强化优化的国产大规模语言模型「LLM-jp-4」系列,并以开源方式提供 8B 与 32B-A3B 两种模型。在约 12 万亿标记数据上从零开始训练,一些基准测试中性能超过 GPT-4o 与 Qwen3-8B。
约80亿参数模型仅用约1.15GB内存运行:PrismML 发布 1 比特 LLM「Bonsai-8B」,专为边缘 AI 打造
加州理工学院孵化的初创公司 PrismML 发布 1 比特大语言模型「1-bit Bonsai」。在保持约 80 亿参数规模的前提下,将内存占用压缩到约 1.15GB,可在智能手机等边缘设备上本地运行,并提出以「智能密度」衡量模型效率的新指标。
