理光发布多模态推理大模型「Reasoning LMM」，可精准理解含图表的复杂企业文档

AI 2026-04-07 理光, 多模态大模型, 企业文档理解, 生成式AI, GENIAC 62 次浏览

理光于 2026 年 3 月 30 日宣布，已完成多模态大规模语言模型（LMM）「Qwen3-VL-Ricoh-32B-20260227」的开发。该模型具备高精度的文档解析与推理能力，能够读取并理解包含图表、图像和复杂版式结构的各类企业文档。理光将其定位为具备强推理能力的多模态模型「Reasoning LMM」，强调其通过多阶段推理来把握复杂文档内容的特征。

这一模型基于阿里云的多模态模型「Qwen3.0-VL」进行定制开发，是日本经济产业省与 NEDO 推进的国内生成式 AI 开发能力强化项目「GENIAC」第三期中的一项成果。

与此同时，理光还推出了轻量版模型「Qwen3-VL-Ricoh-8B-20260227」，并于同日开始免费公开提供。公司还计划在后续发布一款专门用于评估推理性能的自研基准测试工具，以便更系统地验证和展示模型在复杂文档理解方面的能力。

专注图表与版式理解的「Reasoning LMM」

理光此次开发的 Reasoning LMM，是一款面向企业内部文档场景的多模态 AI 模型，能够综合理解文档中的图表、图形、图像以及页面布局等视觉信息，而不仅限于纯文本内容。

传统的大语言模型（LLM）主要处理文本数据，而多模态大模型（LMM）则可以同时处理图像、图表等视觉信息。理光的这款模型在此基础上进一步强化了推理能力，通过多步推理（multi-step reasoning）来分析文档结构与内容，从而更准确地理解复杂文档中隐含的关系与结论。

借助这一能力，模型有望在企业日常业务文档、经营报告、技术资料、分析报告等场景中发挥作用，用于自动阅读、信息抽取、内容总结以及辅助决策等任务。

通过自研基准验证的高文档理解性能

为客观评估模型的文档理解与推理能力，理光构建了自有评测基准「JDocQA-Reasoning」，专门用于测试模型在复杂文档问答与推理场景下的表现。评测结果显示，在 32B 参数规模的前提下，该模型在文档理解任务中的表现已可与更大规模的大模型相媲美。

此外，理光还将公开基准「JDocQA」与自研基准「JDocQA-Reasoning」结合进行对比测试。结果表明，在多项指标上，Qwen3-VL-Ricoh-32B-20260227 与同类竞品模型相比表现接近甚至具备一定优势。

■ 公开基准（JDocQA）与自研基准（JDocQA-Reasoning）的对比结果。理光的 32B 规模模型在文档理解任务中展现出较高性能

理光的 LLM／LMM 开发布局

理光近年来持续推进自研大模型体系的构建，陆续发布了多款面向不同场景的 LLM 与 LMM。本次推出的 Reasoning LMM，被定位为其多模态 AI 开发路线中的核心模型之一，将与既有模型形成系列化产品矩阵。

在这一布局下，理光在文本大模型（LLM）和多模态大模型（LMM）两个方向上均开发了多种规模与用途的模型，以适配从终端设备到云端服务的多样化应用需求。

■ 理光的 LLM／LMM 模型产品线概览。公司在文本与多模态两个系列上均构建了多款模型

理光表示，未来将围绕企业文档处理与业务流程效率提升，持续推进基于这些 AI 模型的解决方案与服务落地，例如自动化文档录入、智能检索、报告生成以及知识管理等应用场景。

发表评论

登录后才可评论。去登录