Internet Archive在瑞士成立新基金会,启动“Gen AI Archive”保存生成式AI模型

richlovec 1500_400 (1)
 

Internet Archive这家专注于保存网页和各类数字资料的非营利机构,于2026年5月6日宣布成立新基金会“Internet Archive Switzerland”。该基金会是一家依据瑞士法律设立、总部位于圣加仑(St. Gallen)的独立非营利组织,将在延续既有数字保存工作的基础上,重点推进两个方向:一是建设用于记录生成式AI模型的“Gen AI Archive”,二是保护处于危机中的档案与文化遗产。

Internet Archive长期致力于保存网页、图书、音频、视频以及软件等数字内容。其代表性服务“Wayback Machine”在2025年10月时,已累计保存并可供访问的网页数量达到1万亿条,为互联网历史留存下庞大的“时间切片”。

新成立的Internet Archive Switzerland,将与Internet Archive Canada、Internet Archive Europe一道,构成支撑Internet Archive整体使命的区域性组织网络。作为一家具备独立法人地位的瑞士基金会,它将依托瑞士相对稳定的法律制度、政治环境和基础设施,面向超长期的数字保存目标进行规划和运营。

与圣加仑大学合作,建设“Gen AI Archive”

Internet Archive Switzerland将与圣加仑大学计算机科学系合作,推进面向生成式AI模型的保存项目“Gen AI Archive”。

该项目由圣加仑大学计算机科学系的Damian Borth教授领衔。根据Internet Archive的介绍,“Gen AI Archive”旨在系统记录当下生成式AI浪潮:不仅要保存模型本身,还要以可供未来检验的方式,记录模型在特定时间点的行为与输出特征。

生成式AI模型通常由提供服务的企业持续更新迭代。每一次版本升级,都可能改变模型对同一问题的回答方式、推理路径、安全策略的表现,以及偏见的呈现方式。如果旧版本模型被删除或不再对公众开放,后人就很难再准确还原“某一时刻的AI”拥有哪些知识、如何作答、体现出怎样的价值取向与技术局限。

“Gen AI Archive”正是为了解决这一问题:通过长期、系统地记录模型版本及其行为变化,为未来的技术研究、伦理审查、政策制定以及社会讨论提供可追溯的证据基础。这也意味着,曾经主要以网页归档闻名的Internet Archive,正将其保存对象扩展到生成式AI时代的核心基础设施——AI模型本身及其运行轨迹。

重点保护处于危机中的档案与文化遗产

除了“Gen AI Archive”项目,Internet Archive Switzerland的另一项初期重点工作,是保存那些面临高风险的档案资源。

这类资源包括因战争冲突、政治动荡、自然灾害等因素而有可能遭到破坏或彻底消失的文化遗产与历史记录。Internet Archive Switzerland希望借助瑞士的中立地位、政治与社会稳定性,以及其技术与基础设施优势,为这些脆弱的档案提供一个安全、可靠的长期保存基地。

新基金会的成立发布会在圣加仑修道院文书馆的展厅举行。该文书馆自中世纪以来一直承担着保存文献与记录的职责,是欧洲重要的历史档案机构之一。选择在此发布Internet Archive Switzerland的成立,被视为一种象征:将中世纪以来的“纸本记忆”传统,与当代的数字记忆与AI时代记录保存工作连接起来,强调“跨世纪的记忆守护”这一主题。

从网页归档走向AI时代的“记忆工程”

自1996年以来,Internet Archive持续对互联网内容进行归档,通过Wayback Machine为公众提供“回到过去的网页”的能力,帮助社会在信息瞬息万变的环境中保留历史脉络。

随着生成式AI技术迅速发展,AI模型正深刻影响信息传播、知识获取乃至社会决策。然而,这些模型往往以“服务”的形式存在,随着版本更新或服务终止,过去的模型状态和行为极易被抹去。缺乏系统的保存与记录,将使未来难以理解当下AI系统是如何影响社会的,也难以对其历史责任与影响进行审视。

Internet Archive Switzerland的设立,标志着Internet Archive从“保存网页与数字文献”,进一步迈向“保存AI时代的基础记录”。通过“Gen AI Archive”以及对高风险档案的保护,该基金会试图为未来留下一个更完整的数字时代“记忆库”,让后人不仅能看到我们曾经浏览过的网页,也能理解我们曾经使用过的AI系统是如何思考、如何回答、如何塑造这个时代的。


分享:


发表评论

登录后才可评论。 去登录