下一代人工智能正从单纯生成内容,转向能够直接执行操作的“代理”系统。这类系统可以查询数据库、浏览和操作各类在线门户、检索记录,并与公共数字基础设施进行自动化交互。随着这一趋势发展,政府网站和在线服务接收到的访问量中,机器流量所占比重正在上升。
其中一部分机器访问用于搜索和信息发现,相对无害;另一部分则涉及抓取和自动化浏览,性质较为模糊;还有一部分在未来可能带来风险,例如由人工智能代理自动预约稀缺公共服务、提交欺诈性申请,或产生足以压垮公共系统的高强度流量。
波士顿市政府认为,现有政府数字接口并非为人工智能代理设计,当前的交互多依赖“即兴适配”:代理通过抓取网页、基于既有训练数据和推断结果“自我摸索”如何与政府系统互动。在此背景下,波士顿选择不简单地全面阻断或完全放开,而是尝试构建一条“中间道路”——在政府资源与人工智能代理之间增加一层受治理、安全且可靠的技术中介。
MCP作为中介层的角色
波士顿首席信息官 Santi Garces 在近期一次采访中介绍,该市正在投资部署“模型上下文协议”(Model Context Protocol,MCP),将其视为这一中介层的技术基础。MCP由 Claude 背后的公司 Anthropic 在大约一年前推出,是一项相对较新的技术。
据介绍,MCP的作用在于为大型语言模型提供与政府资源交互的标准化接口。通过MCP,人工智能助手可以被授权访问API和其他程序化系统,例如从官方城市系统获取交通更新,或代表用户提交服务请求。波士顿方面希望,这一协议将成为政府数字基础设施与大型语言模型之间的关键中介层。
Garces表示,随着越来越多网站和服务被人工智能代理“激活”或使用,MCP服务器可以成为政府增加治理和控制的一道“安全阀”。从机制上看,MCP服务器会定义一组“工具”:开发者用自然语言描述每个工具的使用场景,再规定如何从用户的自然语言请求中提取必要输入,并将其转换为对底层资源的确定性程序访问。鉴于大型语言模型本身具有随机性,MCP被视为提升部分交互可靠性和安全性的一种路径。
在理想状态下,城市可以统一投资建设这类基础设施,并允许不同模型通过城市的MCP层与政府系统交互,从而在保障安全和可靠性的前提下,为依赖代理系统与政府打交道的用户提供更好的体验。Garces称,实现这一愿景仍有多项前提条件,但波士顿方面对其前景“非常期待”。
从开放数据入手的首个试点
波士顿的首个MCP服务器应用场景选在开放数据领域。Garces指出,如果直接向通用人工智能工具提问“波士顿有多少家餐厅”,模型往往会基于训练数据(可能已过时)作答,或在缺乏权威数据源时“凭空编造”,存在较高的不准确和“幻觉”风险。
即便模型具备网页浏览能力,仍需依赖其自行找到正确来源,而互联网上关于同一问题的公开信息往往存在时间滞后或不准确,可能引用的是多年前的报告或文章。
为此,波士顿通过名为“Open Context”的首个MCP实例,将市开放数据门户与多种人工智能工具直接打通。由于MCP服务器具有互操作性,无论用户使用哪一家大型语言模型产品,只要接入该MCP服务器,就可以在提问时指定“根据开放数据门户”的前提。
在这种设置下,当人工智能工具接到“根据开放数据门户,波士顿有多少家餐厅”之类的请求时,会自动在波士顿开放数据门户中搜索相关数据集,并针对该数据集生成SQL查询,实时访问城市数据基础设施并返回结果。
Garces表示,市政府在数据基础设施上投入巨大,但许多潜在使用者因操作不便而难以利用这些资源。大量用户不会编写SQL,也难以判断应选择哪个数据集。通过MCP与开放数据门户的结合,波士顿希望在保持数据权威性的同时,降低使用门槛,减少当前人工智能工具常见的错误来源。
开发过程与技术调整
波士顿在2025年秋季启动了相关开发工作,并与东北大学 Burnes 中心的“AI for Impact”项目学生合作。此前,市政府已向员工推出名为“AI Launchpad”的工具,提供大型语言模型访问能力,但希望进一步提升其实用性。
在观察市政府员工的实际使用情况并结合问卷反馈后,团队发现数据分析是常见应用场景之一,但现有流程需要先下载数据,再复制粘贴到模型上下文中,步骤繁琐。由此,项目团队提出问题:如何让这些工作流程更简单、便捷且更可靠?
Garces回忆,在一次于波士顿举行的人工智能主题静修活动中,他与麻省理工学院的 Romesh Raskar 讨论了代理网络的未来以及构建开放版本的必要性。相关讨论很快转化为行动:周末在MIT进行演讲,呼吁为波士顿打造更好的代理体验;随后在工作周初决定尝试构建MCP服务器并将其接入AI Launchpad。
在学生团队参与下,项目在当年10月便完成了与开放数据门户连接的原型。随后在11月和12月,团队持续迭代以提升可靠性。早期版本在定位数据集方面表现良好,但在处理大规模数据集时能力有限,更适合小样本分析。
为改善这一问题,团队将更多计算任务“推回”开放数据门户本身。由于多数数据门户具备运行查询的能力,波士顿选择利用门户执行更多分析工作,从而提升整体交互的可靠性和效率,并降低成本。
向可复制的数字公共基础设施延展
Garces表示,波士顿之所以对MCP模式感到兴奋,是因为其具备成为数字公共基础设施(DPI)组成部分的潜力。尽管技术名词可能在数月后发生变化,但当前MCP被视为一个“真正的解决方案”候选。

在波士顿的设想中,代理网络只有在为真实用户提供可靠、安全的中介服务时才有意义。人工智能工具有望帮助时间紧张的用户、非英语使用者以及残障人士更顺畅地使用政府服务,但如果缺乏合适的基础设施,这种体验可能会恶化。
MCP模式的吸引力在于,它可以利用现有DPI组件——包括身份认证系统、API暴露机制、支付API等——在人工智能系统“看到”的内容与政府既有基础设施之间增加一层中介,使交互更加可控和可靠。
波士顿选择从开放数据入手,原因在于相关数据本身已公开,风险相对较低。未来,这一模式有可能扩展到服务请求等其他类型的交互。Garces认为,政府应具备构建和管理此类能力的能力,同时也不排除供应商将类似接口纳入其面向政府的产品中。
安全与风险:在阻断与放开之间寻找平衡
在安全层面,Garces指出,政府现有API的安全性并非总是完备,而代理浏览器和自动化工具正在降低大规模自动化交互的门槛。波士顿已经观察到,访问 boston.gov 的流量中,来自人工智能系统的抓取和“深度搜索”正在增加。
在此基础上,市政府担忧人工智能工具未来可能直接发起服务请求。潜在风险包括:代理系统提交与真实需求无关的请求,形成欺诈性申请;或通过大量占用有限的政府服务名额制造稀缺,再转售访问权,类似演唱会“黄牛”行为。另一个风险是,在缺乏受控中介层的情况下,难以对人工智能系统与政府系统之间的流量进行有效监控和保障。
在波士顿的设计中,MCP服务器作为中间件,可以与现有网络安全工具配合,更容易阻止未经授权的代理请求,同时允许合法使用。其理念是:真正需要服务的用户通过政府控制的授权渠道访问系统,相关请求可以与身份关联,并在端到端链路上实现监控和安全保障。
Garces表示,如果没有这类中间件,政府在面对人工智能代理时往往只能在“完全阻断”与“完全开放”之间二选一,而MCP提供了一条“中间路径”,即对代理交互进行有条件的治理。
使用范围与政策边界
目前,波士顿有意限制MCP的应用范围。该市几个月前发布的人工智能政策明确规定,出于可靠性和复杂偏见等方面的考虑,不使用人工智能处理可能影响个人生命、安全、财产或公民自由的信息。因此,当前MCP的应用刻意避开这些类别。
Garces强调,这不仅仅是“人工干预”的问题。市政府意识到,人工智能作为中介可能产生难以察觉和纠正的不良影响,因此在敏感领域保持谨慎。
与此同时,波士顿正与残障群体以及面临语言障碍的居民保持密切合作。市政府认为,公共服务往往对最需要帮助的人来说最难接触,而这些人通常也是最不可能拥有私人大型语言模型访问权限、付费订阅、稳定网络和个人设备的群体。
技术门槛与可发现性挑战
在谈到当前面临的最大障碍时,Garces指出,一方面是技术成熟度问题。由于MCP仍属新兴技术,早期版本的MCP服务器并不原生支持某些认证机制,波士顿团队不得不额外搭建框架以确保安全。整个生态系统也在快速演变。
另一方面,更突出的挑战在于可发现性和易用性。Garces认为,理想状态是使用MCP基础设施应当像访问一个URL一样简单:用户只需输入名称或通过搜索即可找到并使用相关服务。当前,MCP的使用门槛仍然偏高,尽管已经有所改善。
对于希望走上类似道路的其他城市,Garces建议,良好的元数据管理至关重要。大型语言模型虽然可以消耗大量数据,但如果缺乏清晰的描述和上下文,就难以理解数据的含义。因此,完善的数据治理被视为前提条件。
开源与推广计划
波士顿计划将这项工作向外部开放。Garces表示,市政府对Open Context项目感到自豪,并感谢 GovLab 和 Burnes 中心的合作使项目得以快速推进。波士顿计划将 Open Context 开源,以便其他城市复制类似做法。
据介绍,MCP服务器本身的运行成本并不高。波士顿的目标是,让在任何公共云上部署MCP的难度接近“安装一个软件包”。至于如何将这一能力与更广泛的政府服务结合,则需要各城市根据自身情况探索,波士顿也在进行相关实践。
Garces强调,数据只有被使用才真正产生价值。自从波士顿开始发布开放数据以来,数据质量已有所提升。市政府认为,随着更多人使用开放数据,治理和质量有望进一步改善。波士顿希望,生成式人工智能能够让更多人更容易地利用开放数据,从而在公共问题上形成更广泛的社会参与。
(本次采访版本亦发表于 Reboot Democracy。)