研究称人工智能代理在数学上被证明无法完成真实工作
人工智能代理(AI agents)近来被不少厂商描绘为可替代部分人力的“数字员工”,应用场景涵盖客户支持、软件项目管理乃至企业运营。不过,最新一波研究与讨论将焦点从“是否被过度营销”转向更基础的问题:基于当今大型语言模型(LLM)构建的代理系统,是否在数学层面存在难以跨越的可靠性上限,导致其难以稳定完成端到端的真实工作流程。 形式化证明引发争议 争议的起点是一项形式化证明,研究对象直指以大型语言模
电力与物理现实为人工智能扩张设限
业内观点认为,人工智能正从“算法与数据”问题,转变为受制于电力、地理、监管与模型能力边界的基础设施问题。数据中心选址受阻、电网承压以及基于语言的大模型局限,正在重塑企业的人工智能布局逻辑。
Anthropic 发布经济指数:揭示大型语言模型真实使用图景
Anthropic 公布经济指数报告,基于 2025 年 11 月 Claude.ai 上的一百万次消费者互动和一百万次企业 API 调用,展示大型语言模型在实际场景中的主要用途、局限及对生产率的影响。
OpenCog Hyperon:在大型语言模型之外探索通用人工智能路径
SingularityNET 推出的开源框架 OpenCog Hyperon 以神经符号混合架构为核心,被定位为通用人工智能(AGI)研究平台,试图在当前大型语言模型与未来具备推理与认知能力的系统之间搭建桥梁。
高阶数学迎来新工具:大型语言模型开始攻克埃尔德什难题
自GPT 5.2发布以来,大型语言模型在高阶数学推理上的表现引发学界关注,多道埃尔德什问题在人工智能参与下被标记为“已解决”。
Anthropic发布Claude for Healthcare 对标OpenAI ChatGPT Health
在OpenAI宣布推出ChatGPT Health约一周后,Anthropic发布面向医疗领域的Claude for Healthcare,主打通过“连接器”接入多类医疗与支付数据库,以支持医疗服务提供者和支付方的行政与研究流程。