“我不确定”:新训练方法让人工智能学会承认不知道,显著降低致命错误风险
韩国科学技术院团队提出一种受大脑发育启发的“预热”训练方法,让AI在学习真实数据前先学会“我还一无所知”,从源头缓解过度自信问题,提升在自动驾驶、医疗诊断等关键领域的安全性与可靠性。
研究人员提出新框架:为生成式人工智能引入“元认知”机制
美国学者提出一套数学框架,尝试让大型语言模型具备监控和调节自身推理过程的能力,用于在高风险场景中更好识别不确定性并提升决策透明度。
韩国科学技术院团队提出一种受大脑发育启发的“预热”训练方法,让AI在学习真实数据前先学会“我还一无所知”,从源头缓解过度自信问题,提升在自动驾驶、医疗诊断等关键领域的安全性与可靠性。
美国学者提出一套数学框架,尝试让大型语言模型具备监控和调节自身推理过程的能力,用于在高风险场景中更好识别不确定性并提升决策透明度。