TELUS数字研究提示:角色提示或致大模型道德判断波动,企业需加强测试与监控
TELUS数字发布研究称,要求大型语言模型“扮演角色”的提示方式可能改变其道德判断并带来不一致回应;研究还发现,道德一致性主要受模型家族影响,而同一模型家族内模型规模越大,跨角色切换时判断波动可能越明显。
OpenAI携手BCG与麦肯锡等四大咨询公司启动「Frontier Alliances」,直面企业AI导入的实施瓶颈
OpenAI宣布与BCG、麦肯锡、埃森哲和凯捷建立长期合作框架「Frontier Alliances」,聚焦解决企业在引入“AI同事”时面临的系统集成、流程重构与组织变革等实施层面难题。
Anthropic 发布「AI 流畅性指数」:从单纯导入率转向“会不会用 AI”的新衡量标准
Anthropic 公布《Anthropic Education Report: The AI Fluency Index》,提出用“AI 流畅性指数”来衡量人们是否能安全、有效地与 AI 协作,而不仅仅是是否在使用 AI。研究基于 Claude.ai 上近万条多轮对话,提炼出 24 项行为指标,并以其中 11 项可观测行为建立基线。结果显示:反复迭代与改进是高流畅性对话的核心特征,而在生成代码、文档等成果物时,用户更重视指示与委托,却往往忽视事实核查与推理验证。
Google 发布全新图像生成模型「Nano Banana 2(Gemini 3.1 Flash Image)」:兼具 Pro 级质量与 Flash 级速度
Google 推出最新原生图像生成模型「Nano Banana 2(Gemini 3.1 Flash Image)」,在保持 Pro 级推理与世界知识能力的同时,实现接近 Flash 系列的高速生成表现,并面向 Gemini 应用、Search、Vertex AI 等多产品线开放预览。
X 将自动回复改为“召唤制”API:应对激增的 AI 垃圾回复
X 宣布修改 X API v2 的回复机制,API 端自动回复必须在被原发帖者“点名”后才被允许,以遏制利用大模型批量生成的自动回复垃圾信息。
Meta测试独立应用“Vibes” 支持AI生成短视频内容
Meta确认正在测试独立版“Vibes”应用,将原本嵌入Meta AI中的AI生成短视频功能拆分出来,提供专属信息流与创作空间,并计划在未来几个月内测试付费订阅模式。
Perplexity逐步取消AI搜索广告:从2024年实验转向“信任优先”策略
AI 搜索引擎 Perplexity 正在分阶段取消此前试验性导入的广告。公司认为,广告可能削弱用户对 AI 回答的信任,因此决定回归以订阅为主的收费模式,将“可靠性”和“中立性”置于商业化之上。
Basware在发票生命周期管理平台推出Agentic AI代理,瞄准自主应付账款
Basware在其发票生命周期管理平台引入新的AI代理功能,称将推动近乎无接触的发票处理,并以可解释、可审计与受控执行路径为核心设计,支持财务团队在合规与风险控制下扩大自动化应用。
三井住友银行上线语音生成式AI客服「SMBC AI Operator」,支持 Olive 相关咨询 24 小时服务
三井住友银行携手日本综合研究所与日本 IBM 推出语音生成式 AI 客服「SMBC AI Operator」,率先用于个人综合金融服务「Olive」的一般性咨询,实现全年无休 24 小时应答,并通过通话数据持续优化服务质量。
日本防卫省试点引入生成式AI,启动“国会答辩制作AI助手”
日本防卫省宣布在国会答辩资料的制作流程中试验引入生成式AI,通过“国会答辩制作AI助手”减轻职员负担,并在大臣直辖AI团队的主导下推动行政与防卫力的数字化升级。
Tavus推出Phoenix-4实时行为生成引擎
Tavus发布Phoenix-4,称其可在实时对话中生成具备情感响应与上下文感知的“人类存在感”,并以1080p、40帧每秒运行,已通过其平台与API等渠道提供。
GitHub 提交中已有 4% 由 AI 生成:SemiAnalysis 预测 Claude Code 在 2026 年底或将突破 20%
半导体与 AI 产业研究机构 SemiAnalysis 指出,Anthropic 推出的 CLI 型 AI 代理工具 Claude Code 已贡献约 4% 的 GitHub 公共提交量,并预测在当前增长趋势下,这一比例有望在 2026 年底超过 20%,标志着开发从“AI 辅助”走向“AI 代理”的关键拐点。
