怀疑与喜爱、忧虑与兴奋交织在一起。围绕人工智能生成文本的观感,不少读者在阅读时会觉得其表达“不自然”或“像假的”,而在人类写作中则更容易识别出独特的声音与个人风格。
一名研究英语制度化过程的学者表示,社会长期以来对不同类型英语的偏好与贬抑并存:某些阶层的口语或书写方式更容易获得奖励,而其他用法则可能被低估。该学者称,生成式人工智能语言工具的出现放大了这类问题。
该学者指出,基于英语的大型语言模型主要在公共互联网文本上训练,而用户指令往往要求模型输出“更正式”的英语,使模型在训练与使用过程中更倾向于标准化文本及其所携带的观念与偏见。其研究中还观察到,一些人对互联网信息的真伪持怀疑态度,却会信任生成式人工智能给出的写作方式。

“人类英语”与“人工智能英语”的差异
该学者认为,要更有意识地使用人工智能生成英语,首先需要理解人们所说“像人类写的”具体指什么。其研究将两类关键特征概括为:多样性与可读性。
研究者称,人类英语在词汇选择与语法结构上存在持续的、细微但可辨识的多样性与可读性模式;相比之下,人工智能更常产出一种更正式、更密集的表达方式,类似学术测试与论文中常见的写法。该学者将其称为“考试英语”,并表示这种文本通常多样性较低、可读性较弱,读者可能会觉得其更机械化,但同时也可能将其视为“更聪明”。
为说明差异,该学者给出两条短信作为对比:第一条使用默认小写、包含“ur”“u”等短信拼写,并带有更个人化、较不确定的语气;第二条则使用更规范的大小写、标点与拼写,句式结构更为重复。该学者称,多数读者会判断第一条更像人类写作,而第二条更像人工智能生成;在该示例中,第二条确由ChatGPT生成。

研究者据此表示,人类英语的多样性能够打破信息传递的单调感,并承载更多个人意义;而人工智能文本往往名词短语更密集、变化更少。其研究称,这类模式在不同体裁与语域中会反复出现。
模式可能随模型迭代而变化,但倾向或仍存在
研究者指出,人工智能写作工具持续演进,不同大型语言模型之间也存在差异。例如,GPT 5相较于GPT 4,曾因“冷漠”的语气而受到关注。
不过,该学者同时表示,一些总体倾向可能仍会延续:人工智能生成英语偏好“考试英语”所奖励的特质,即同质性与信息密度。其称,当前的指令调优(训练模型遵循人类指令)在一定程度上会让人工智能文本更偏离人类日常语言的多样性;此外,人工智能生成文本本身也成为训练数据的一部分,未必有助于改变这一状况。

研究者还表示,人工智能训练所依赖的英语范围,可能比现实世界中集体的人类英语更为狭窄;人类不仅使用“概率更高”的表达,也会使用“可能的表达”,包括基于观察到的多样用法创造新说法,以及将个人与非个人语言模式融合。
如何在两种语言形态之间做选择
在如何更有效地使用人工智能英语与人类英语方面,该学者提出若干做法。
其一是使用更中性的“语言标签”描述文本,例如“密集”“平实”“人际”或“信息性”,而不是用“听起来聪明”“听起来不自然”等社会化评价,并尝试识别与描述具体语言模式。

其二是有选择地使用人工智能工具。研究者称,人类英语不仅更易接近且更具多样性,也比依赖人工智能语言工具更能激发大脑活动;为避免人工智能英语掩盖人类语言的多样性,应当审慎选择使用场景。
其三是使用经过筛选的工具。研究者提到,小型语言模型以及可在浏览器中用于排查偏见的程序(如Bias Shield)等,可能帮助用户在使用人工智能英语时作出更有原则的选择;跨语言聊天机器人等工具也可能为人工智能英语引入更多全球英语的多样性。
此外,研究者强调应理解“什么听起来聪明以及原因”。其称,一个半世纪的“考试英语”传统使人们更容易把密集、非个人化的写作模式等同于“聪明”,但这类模式并不一定更亲切或更易读,尤其面对多样化受众时亦然,也不代表当今全球英语的广泛使用。
研究者表示,“考试英语”在特定场景下有其合理性,但不应仅因为人工智能更容易生成这种文本,或因为人们习惯将其视为更聪明而默认采用。其将人工智能英语概括为“由统计驱动的语言数据库”,规模庞大但相对固定;而历史经验显示,全球人类英语的多样性为表达与连接提供了更丰富的可能性。
本文内容据The Conversation文章改写,原文链接:https://theconversation.com/how-ai-english-and-human-english-differ-and-how-to-decide-when-to-use-artificial-language-277455
