NTT发布新型推理技术:打破LLM之间的“词汇壁垒”,实现不同AI模型间的知识整合与迁移
NTT提出一种在不降低精度的前提下压缩并统一大规模语言模型(LLM)词汇表的新型推理技术,使得不同LLM之间可以通过共享词汇集合进行协同推理与知识迁移。
软银将于6月启动基于国产LLM「Sarashina」的生成式AI服务:依托 Oracle Alloy 打造具备数据主权的企业级云平台
软银宣布,自2026年6月起陆续面向企业和自治体提供基于国产大模型「Sarashina」的生成式AI服务,运行于采用 Oracle Alloy 技术构建的自有云平台「Cloud PF Type A」之上,重点支持业务效率提升与安全合规的数据主权需求。
英语版 Wikipedia 明确禁止使用 LLM 生成条目正文,社区投票通过新指南
英语版 Wikipedia 通过社区投票,正式制定新指南:原则上禁止使用 ChatGPT 等大规模语言模型直接生成或改写条目正文,但在翻译、语法修正等编辑辅助场景下仍允许有限使用。
东京科学大学与产综研发布推理型日语LLM「GPT-OSS Swallow」「Qwen3 Swallow」,以开放许可提供
东京科学大学与产总研联合推出两款兼具日语能力与推理能力的大规模语言模型「GPT-OSS Swallow」「Qwen3 Swallow」,基于GPT-OSS与Qwen3改良,采用Apache 2.0开源并允许商用。
