乔治亚理工大学、加拿大研究机构 Mila 以及密歇根大学的研究人员于 2026 年 6 月 10 日在 arXiv 上发布论文《Learning by Chatting? Investigating the Impact of Generative AI on Information Seeking and Learning》,系统考察生成式 AI 对信息搜索与学习过程的影响。
这项研究聚焦一个具体问题:在学习情境中,AI 聊天机器人与传统搜索引擎相比,哪一种工具更有利于学习?研究团队让参与者在 8 天内,分别使用 ChatGPT 或 Google 搜索,围绕“nutrition and meal planning(营养与饮食规划)”这一主题进行自学,并比较两种工具在信息探索路径和学习结果上的差异。
实验设计:8 天内只用一种工具学习“营养与饮食规划”
研究人员将参与者随机分为两组:一组只使用 ChatGPT,另一组只使用 Google 搜索,围绕营养与饮食规划进行连续 8 天的学习。
为了尽量排除生成式 AI 对搜索结果的直接干扰,Google 搜索组被要求在检索时采取一定操作,降低搜索结果中出现 AI Overview(AI 概览回答)的概率,以便更接近传统搜索体验。
在每一天的学习结束后,参与者都需要以“学习日记”的形式记录:自己是如何查找信息的、学到了什么内容、遇到了哪些困难或疑问。实验结束后,研究团队对参与者进行知识测试,从多个维度评估学习成效。
测试不仅考察记忆与理解,还包括:
- 能否将学到的概念应用到新情境中的“批判性学习”(如比较、评估、判断);
- 能否据此设计饮食计划等“创造性学习”。
最初每组各有 40 名参与者,但最终完成全部 8 天学习与测试的只有 ChatGPT 组 14 人、Google 搜索组 21 人。论文也指出,由于采用日记式长期跟踪,这类研究本身就容易出现参与者中途退出的情况。
整体成绩差异不显著,但批判性学习题目上搜索组更占优
从整体测试成绩来看,ChatGPT 组的平均学习成果略低于 Google 搜索组,但这一差异未达到统计学上的显著水平,也就是说,不能简单断言“用 ChatGPT 学得更差”。
不过,在按题目进行的探索性分析中,研究者发现:在部分用于衡量“批判性学习”的题目上,两组之间出现了更明显的差异。例如:
- 解读营养成分标示的题目;
- 比较并评估植物性与动物性蛋白质优劣的题目。
在这些题目上,使用 Google 搜索的参与者更容易答对。
研究团队认为,这与两组在“如何选择信息”上的行为差异有关:ChatGPT 组更倾向于把信息筛选的过程交给 AI,而搜索组则需要自己在多个结果之间做判断。
ChatGPT 组更依赖 AI 代为筛选信息
使用搜索引擎时,用户通常会:
- 浏览多个搜索结果;
- 比较不同来源的说法;
- 判断信息源的可靠性与内容差异。
这一过程本身就是一种“主动的信息评估与选择”,会迫使学习者去思考:哪条信息更可信?不同观点为何不一致?背后依据是什么?
而在 ChatGPT 的交互中,信息的收集、筛选与总结往往被整合进一条回答中呈现。用户更像是在阅读一份已经“整理好”的说明书,而不是自己在信息海里“捞”和“选”。

研究者指出,这种高度整合的回答虽然提高了效率,却可能减少学习者比较、核查不同信息源的机会,从而影响批判性思维与信息素养相关能力的锻炼。
“现成答案”可能遮蔽对原理和基础知识的理解
论文还特别提到,ChatGPT 的回答往往更偏向直接产出“可用成果”,而不是系统讲解背后的原理与知识框架。
例如,当有参与者询问“均衡饮食中三大营养素各需要多少”时,ChatGPT 更倾向于直接给出:
- 具体的饮食计划;
- 购物清单;
- 营养摄入追踪表等。
相比之下,使用 Google 搜索的参与者更容易接触到诸如“碳水化合物、蛋白质、脂肪的大致比例”“如何根据个人情况调整”等基础性信息,也就是构成理解与推理“底层逻辑”的内容。
研究团队据此推测:当前的 ChatGPT 在设计与训练上,更偏向于生成“解决方案”和“成果物”,而不是从原理出发构建系统知识。这与其在编程辅助、写作辅助等知识工作场景中的应用导向有关——用户往往希望它直接给出可用的结果。
这种偏向在实际学习中可能带来一个风险:学习者很快拿到“能用的答案”,却未必真正理解背后的原理与判断依据。
把方便交给 AI,是否会削弱学习者的主体性?
研究者进一步指出,当像 ChatGPT 这样的 AI 聊天机器人承担了大量信息收集与筛选工作后,学习者:
- 比较不同信息源的动机可能降低;
- 主动查证依据、追问“为什么”的机会减少;
- 在信息不确定或相互矛盾时,练习批判性评估的空间被压缩。
从效率角度看,生成式 AI 的确能显著简化信息搜索流程,让人更快得到“看上去合理”的答案。但从学习科学的角度,主动探索、反复比较与质疑本身,就是深度学习和批判性思维形成的重要环节。
因此,这项研究更多是揭示了一种“张力”:一方面,AI 带来的便捷与自动化;另一方面,学习者保持主体性、批判性与探究精神的需要。
研究并未判定“AI 不适合学习”,但提醒使用方式很关键
需要强调的是,研究团队并没有根据这次实验就下结论说“AI 聊天机器人不适合用来学习”。他们在论文中明确指出了研究的局限:
- 主题仅限于“营养与饮食规划”,不代表所有学科与任务类型;
- 最终样本数量较少,统计结论的外推性有限;
- 本研究主要是观察信息搜索行为与学习结果之间的关联,并未直接证明因果关系。
换言之,这项工作更像是一则“早期预警”:如果在学习中完全依赖 AI 代为筛选与整合信息,而自己不再主动比较、查证和思考,可能会在批判性学习和原理理解方面留下隐患。
对普通学习者而言,更现实的启示是:与其把 ChatGPT 当作“答案机器”,不如把它当作:
- 用来澄清概念、整理思路的对话伙伴;
- 帮助生成问题、引导进一步查证的工具;
- 与其他信息源(如搜索引擎、教材、论文)配合使用的辅助渠道。
在这种使用方式下,生成式 AI 的优势(高效整合、表达清晰)与人类学习者的优势(判断、质疑、选择)更有可能形成互补,而不是彼此抵消。
