ChatGPT 与搜索引擎，哪一个更适合学习？——乔治亚理工等比较 ChatGPT 与 Google 搜索的学习效果

AI 2026-06-22 生成式AI, ChatGPT, Google搜索, 学习方法, 信息检索 3 次浏览

乔治亚理工大学、加拿大研究机构 Mila 以及密歇根大学的研究人员于 2026 年 6 月 10 日在 arXiv 上发布论文《Learning by Chatting? Investigating the Impact of Generative AI on Information Seeking and Learning》，系统考察生成式 AI 对信息搜索与学习过程的影响。

这项研究聚焦一个具体问题：在学习情境中，AI 聊天机器人与传统搜索引擎相比，哪一种工具更有利于学习？研究团队让参与者在 8 天内，分别使用 ChatGPT 或 Google 搜索，围绕“nutrition and meal planning（营养与饮食规划）”这一主题进行自学，并比较两种工具在信息探索路径和学习结果上的差异。

实验设计：8 天内只用一种工具学习“营养与饮食规划”

研究人员将参与者随机分为两组：一组只使用 ChatGPT，另一组只使用 Google 搜索，围绕营养与饮食规划进行连续 8 天的学习。

为了尽量排除生成式 AI 对搜索结果的直接干扰，Google 搜索组被要求在检索时采取一定操作，降低搜索结果中出现 AI Overview（AI 概览回答）的概率，以便更接近传统搜索体验。

在每一天的学习结束后，参与者都需要以“学习日记”的形式记录：自己是如何查找信息的、学到了什么内容、遇到了哪些困难或疑问。实验结束后，研究团队对参与者进行知识测试，从多个维度评估学习成效。

测试不仅考察记忆与理解，还包括：

能否将学到的概念应用到新情境中的“批判性学习”（如比较、评估、判断）；
能否据此设计饮食计划等“创造性学习”。

最初每组各有 40 名参与者，但最终完成全部 8 天学习与测试的只有 ChatGPT 组 14 人、Google 搜索组 21 人。论文也指出，由于采用日记式长期跟踪，这类研究本身就容易出现参与者中途退出的情况。

整体成绩差异不显著，但批判性学习题目上搜索组更占优

从整体测试成绩来看，ChatGPT 组的平均学习成果略低于 Google 搜索组，但这一差异未达到统计学上的显著水平，也就是说，不能简单断言“用 ChatGPT 学得更差”。

不过，在按题目进行的探索性分析中，研究者发现：在部分用于衡量“批判性学习”的题目上，两组之间出现了更明显的差异。例如：

解读营养成分标示的题目；
比较并评估植物性与动物性蛋白质优劣的题目。

在这些题目上，使用 Google 搜索的参与者更容易答对。

研究团队认为，这与两组在“如何选择信息”上的行为差异有关：ChatGPT 组更倾向于把信息筛选的过程交给 AI，而搜索组则需要自己在多个结果之间做判断。

ChatGPT 组更依赖 AI 代为筛选信息

使用搜索引擎时，用户通常会：

浏览多个搜索结果；
比较不同来源的说法；
判断信息源的可靠性与内容差异。

这一过程本身就是一种“主动的信息评估与选择”，会迫使学习者去思考：哪条信息更可信？不同观点为何不一致？背后依据是什么？

而在 ChatGPT 的交互中，信息的收集、筛选与总结往往被整合进一条回答中呈现。用户更像是在阅读一份已经“整理好”的说明书，而不是自己在信息海里“捞”和“选”。

研究者指出，这种高度整合的回答虽然提高了效率，却可能减少学习者比较、核查不同信息源的机会，从而影响批判性思维与信息素养相关能力的锻炼。

“现成答案”可能遮蔽对原理和基础知识的理解

论文还特别提到，ChatGPT 的回答往往更偏向直接产出“可用成果”，而不是系统讲解背后的原理与知识框架。

例如，当有参与者询问“均衡饮食中三大营养素各需要多少”时，ChatGPT 更倾向于直接给出：

具体的饮食计划；
购物清单；
营养摄入追踪表等。

相比之下，使用 Google 搜索的参与者更容易接触到诸如“碳水化合物、蛋白质、脂肪的大致比例”“如何根据个人情况调整”等基础性信息，也就是构成理解与推理“底层逻辑”的内容。

研究团队据此推测：当前的 ChatGPT 在设计与训练上，更偏向于生成“解决方案”和“成果物”，而不是从原理出发构建系统知识。这与其在编程辅助、写作辅助等知识工作场景中的应用导向有关——用户往往希望它直接给出可用的结果。

这种偏向在实际学习中可能带来一个风险：学习者很快拿到“能用的答案”，却未必真正理解背后的原理与判断依据。

把方便交给 AI，是否会削弱学习者的主体性？

研究者进一步指出，当像 ChatGPT 这样的 AI 聊天机器人承担了大量信息收集与筛选工作后，学习者：

比较不同信息源的动机可能降低；
主动查证依据、追问“为什么”的机会减少；
在信息不确定或相互矛盾时，练习批判性评估的空间被压缩。

从效率角度看，生成式 AI 的确能显著简化信息搜索流程，让人更快得到“看上去合理”的答案。但从学习科学的角度，主动探索、反复比较与质疑本身，就是深度学习和批判性思维形成的重要环节。

因此，这项研究更多是揭示了一种“张力”：一方面，AI 带来的便捷与自动化；另一方面，学习者保持主体性、批判性与探究精神的需要。

研究并未判定“AI 不适合学习”，但提醒使用方式很关键

需要强调的是，研究团队并没有根据这次实验就下结论说“AI 聊天机器人不适合用来学习”。他们在论文中明确指出了研究的局限：

主题仅限于“营养与饮食规划”，不代表所有学科与任务类型；
最终样本数量较少，统计结论的外推性有限；
本研究主要是观察信息搜索行为与学习结果之间的关联，并未直接证明因果关系。

换言之，这项工作更像是一则“早期预警”：如果在学习中完全依赖 AI 代为筛选与整合信息，而自己不再主动比较、查证和思考，可能会在批判性学习和原理理解方面留下隐患。

对普通学习者而言，更现实的启示是：与其把 ChatGPT 当作“答案机器”，不如把它当作：

用来澄清概念、整理思路的对话伙伴；
帮助生成问题、引导进一步查证的工具；
与其他信息源（如搜索引擎、教材、论文）配合使用的辅助渠道。

在这种使用方式下，生成式 AI 的优势（高效整合、表达清晰）与人类学习者的优势（判断、质疑、选择）更有可能形成互补，而不是彼此抵消。

发表评论

登录后才可评论。去登录