读者回信:当计算机更愿意说“是”,世界会怎样?
在一档读者互答的长期连载中,有读者担忧大型语言模型在互动中更倾向于迎合而非求真。多位来信者从训练机制、责任归属与使用方式等角度回应,认为关键在于人类如何设计、部署并对结果保持审慎。
TELUS数字研究提示:角色提示或致大模型道德判断波动,企业需加强测试与监控
TELUS数字发布研究称,要求大型语言模型“扮演角色”的提示方式可能改变其道德判断并带来不一致回应;研究还发现,道德一致性主要受模型家族影响,而同一模型家族内模型规模越大,跨角色切换时判断波动可能越明显。
新方法有望提升大型语言模型训练效率
通过利用计算资源的空闲时间,研究人员实现了模型训练速度翻倍,同时保持了准确性。
个性化功能可能导致大型语言模型变得过于迎合用户
长期对话中的上下文可能使大型语言模型开始模仿用户观点,进而降低回答的准确性,甚至形成虚拟的回音室效应。
揭示大型语言模型中隐藏的偏见、情绪、人格及抽象概念
麻省理工学院团队开发出一种新方法,能够识别并调控大型语言模型中的隐藏概念,从而提升模型的安全性和性能。
研究发现:AI聊天机器人对弱势用户提供的信息准确度较低
麻省理工学院建设性沟通中心的研究显示,领先的人工智能模型在面对英语水平较低、受教育程度较低及非美国籍用户时,表现出较差的准确性和真实性。
研究人员提出新框架:为生成式人工智能引入“元认知”机制
美国学者提出一套数学框架,尝试让大型语言模型具备监控和调节自身推理过程的能力,用于在高风险场景中更好识别不确定性并提升决策透明度。
问答:研究人员称人工智能或在五年内具备独立提出并验证科学假设的能力
洛桑联邦理工学院的罗伯特·韦斯特与西北大学的阿格内斯·霍尔瓦特在对话中表示,社交媒体已成为公众获取科学信息的重要渠道,而大型语言模型正加速介入论文写作与评审流程,并可能在未来数年进入“提出研究问题”的阶段。
Unchained Labs推出自动化平台Stuntman,集成自然语言AI与模块化硬件
Unchained Labs发布新一代自动化平台Stuntman,称其将大型语言模型驱动的AI嵌入系统,使科研人员可用自然语言生成并执行实验工作流程,同时保留程序化控制与开放数据记录。
Coveo推出托管MCP服务器,扩展与ChatGPT Enterprise和Claude等大模型的集成
Coveo宣布发布托管模型上下文协议(MCP)服务器,作为安全互操作层连接企业内容与主流大型语言模型,并在ChatGPT Enterprise上线官方应用以实现安全访问与检索。
研究:用于排名最新大型语言模型的平台可能不够可靠
仅移除极少部分众包数据就能显著改变在线排名平台的结果,影响模型选择的准确性。
助力AI代理搜索,提升大型语言模型的最佳结果获取能力
EnCompass通过回溯和多次尝试执行AI代理程序,寻找大型语言模型(LLM)生成的最佳输出,帮助开发者更高效地使用AI代理。
