反诽谤联盟发布AI安全指数:Grok在识别与抵制反犹内容方面排名垫底
反诽谤联盟(ADL)在一项针对大型语言模型的新基准评估中表示,埃隆·马斯克旗下聊天机器人Grok在识别并反击反犹主义内容方面表现最弱,并称其相关失误并非边缘性的技术瑕疵,而可能对犹太用户及接触其输出内容的公众构成直接风险。与之相比,ADL将由竞争对手开发的Claude评为同类系统中表现最强。 ADL推出AI指数:Grok位列末位、Claude居首 ADL在最新评估中建立“AI指数”,用于衡量聊天机
新方法让人工智能像人类般推理,无需额外训练数据
加州大学河滨分校团队提出“测试时匹配”(TTM)方法,在不引入新训练数据的前提下,大幅提升多模态模型的组合推理能力,并在部分基准上超越更大规模模型。
Palladyne AI获美国空军群体作战任务 股价大涨;国防承包商财报显示传统业务现金流韧性
国防行业对人工智能(AI)的投入正更直接地体现在资本市场表现上。近期,一家专注国防与机器人软件的小型公司在披露获得美国空军新任务后股价大幅上扬;与此同时,行业内成熟承包商在财报季披露的业绩数据也显示,传统硬件、服务与支持合同仍是现金流的重要来源。 Palladyne AI披露空军任务后股价大涨 Palladyne AI表示,公司获得美国空军合同,将推进“跨域集成群体作战能力”。消息披露后,Pall
DeepSeek冲击一周年:投资者关注中国AI开源与低成本模式带来的新变量
全球投资者仍在消化一年前“DeepSeek冲击”对市场情绪与估值体系的影响。当时,一款中国AI模型的快速走红引发拥挤交易松动,全球AI相关资产出现大幅波动,部分标的市值在短时间内蒸发数千亿美元。时隔一年,中国开发者在开源模型与低成本服务上的进展再度引发关注,市场开始评估来自中国的下一轮竞争压力是否会对AI产业链的定价逻辑带来新的扰动。 从意外突破到估值重估 回顾当时的市场反应,DeepSeek模型
黄仁勋:AI浪潮将为电工和水管工带来高薪岗位
黄仁勋在达沃斯表示,人工智能基础设施建设将大幅推高技术工人需求,水管工、电工等有望拿到六位数薪资。
美国人工智能竞争叙事偏向“模型军备竞赛”,部署与基础设施短板引发担忧
美国围绕人工智能的公共讨论,常被塑造成一场争夺“最大、最强模型”的零和竞赛,政策关注点也随之集中在出口管制与基准测试等指标上。但有观点指出,真正决定胜负的并非模型规模本身,而是谁能把人工智能更系统地嵌入电力、产业与社会运行体系,将算法转化为可持续的生产力。 研究与投资领先,但落地进展被指不足 相关观察认为,美国在人工智能研究与资本投入方面仍占据头条优势,拥有前沿实验室、云计算能力以及活跃的初创与风
Humans&获4.8亿美元种子融资 拟打造以协作为核心的新型基础模型
由Anthropic、Meta、OpenAI、xAI和Google DeepMind前员工创立的初创公司Humans&完成4.8亿美元种子轮融资,计划开发专注“社会智能”和协作能力的基础模型,定位为“人机经济的中枢神经系统”,瞄准团队协调与长期决策等复杂协作场景。
科罗拉多州立大学携手微软试点校园级AI系统RamGPT
科罗拉多州立大学与微软合作,在安全封闭环境中部署类似ChatGPT的校园级生成式人工智能系统CSU-GPT与RamGPT,在高等教育领域率先大规模试用AI,同时在校园内引发支持与质疑并存的讨论。
自我审核提示走红:用户称可让ChatGPT输出更严谨的推理结果
有用户分享称,通过一条“自我审核”式提示语,可以在不更改设置或额外付费的情况下,让ChatGPT在回答时呈现更谨慎、更严密的推理风格。该做法的关键在于把模型设定为需要对自身输出负责的“研究员”或“审阅者”,在同一轮对话中完成初稿、复核与修订,从而提升答案的清晰度与一致性。 “自我审核”提示的基本流程 据相关描述,这类提示通常要求ChatGPT先给出一个完整回答,随后以独立审阅者的身份对前述内容进行
人工智能方法TreeStructor实现基于遥感点云的三维森林树木分离与重建
普渡大学与德国基尔大学等机构研究团队提出TreeStructor,通过构建“树木字典”在复杂森林点云中识别重复结构,实现树木分离与三维重建,并在多类激光雷达数据上验证其鲁棒性。
调查:数百万人在Telegram制作并传播AI深度伪造裸照,相关频道遍布多国
《卫报》分析称,Telegram上至少有150个频道分发AI生成的露骨图像与视频。Telegram表示深度伪造色情及其制作工具被平台条款禁止,并称2025年已删除逾95.2万条违规内容。
AI写代码加速降本:代码趋于商品化,价值转向数据与工作流程
AI 编码工具正显著降低软件开发的成本与摩擦。一些过去需要团队数周完成的任务,如今可在提示驱动下于短时间内生成结果,带动部分数字产品与服务价格下行。不过,多方观点认为,变化并不等同于“软件整体走向廉价商品化”:更便宜的是代码与基础功能,而关键系统与能力的战略价值并未因此削弱。 软件的通缩属性被进一步放大 在生成式模型能够按需编写函数之前,软件就具备天然的“通缩”特征:产品一旦完成开发,复制与分发的
