大规模语言模型

AI 2026-05-03

NTT提出一种在不降低精度的前提下压缩并统一大规模语言模型（LLM）词汇表的新型推理技术，使得不同LLM之间可以通过共享词汇集合进行协同推理与知识迁移。

AI 2026-04-24

软银宣布，自2026年6月起陆续面向企业和自治体提供基于国产大模型「Sarashina」的生成式AI服务，运行于采用 Oracle Alloy 技术构建的自有云平台「Cloud PF Type A」之上，重点支持业务效率提升与安全合规的数据主权需求。

AI 2026-04-01

英语版 Wikipedia 通过社区投票，正式制定新指南：原则上禁止使用 ChatGPT 等大规模语言模型直接生成或改写条目正文，但在翻译、语法修正等编辑辅助场景下仍允许有限使用。

AI 2026-02-27

东京科学大学与产总研联合推出两款兼具日语能力与推理能力的大规模语言模型「GPT-OSS Swallow」「Qwen3 Swallow」，基于GPT-OSS与Qwen3改良，采用Apache 2.0开源并允许商用。