波士顿试点模型上下文协议探索人工智能代理与政府系统“安全对接”

商业 2026-04-15 商业现场波士顿, 人工智能代理, 模型上下文协议MCP, 开放数据, 数字公共基础设施 28 次浏览

人工智能代理开始“接入”政府系统

随着能够执行具体操作的人工智能代理系统快速发展，其与政府数字基础设施的交互正在增加。这类系统不仅能生成文本，还可以查询数据库、浏览和操作在线门户、检索记录，并在更大规模上与公共服务网站互动。

波士顿市政府观察到，市政网站和在线服务的访问流量中，机器请求所占比例正在上升。这些请求有的用于搜索和信息发现，相对无害；有的涉及数据抓取和自动化浏览，性质较为模糊；还有一部分在未来可能带来风险，例如利用代理自动预约稀缺公共服务、提交欺诈性请求，或向系统发起大量访问，影响公共服务可用性。

波士顿首席信息官 Santi Garces 在近期一次采访中表示，现有政府数字接口并非为人工智能代理设计，当前的现实是“即兴适配”：代理通过抓取网页、基于既有训练数据“猜测”操作路径来完成任务。波士顿市并未选择简单阻断或完全放开代理访问，而是尝试构建一层受管控、安全且可靠的中介层，专门调节人工智能代理系统与政府资源之间的交互。

MCP：作为中介层的新技术

波士顿选择的技术路径是模型上下文协议（Model Context Protocol，MCP）。据介绍，开发 Claude 的 Anthropic 公司大约在一年前推出了 MCP 服务器。该协议为大型语言模型提供了一种与外部资源（包括政府系统）对接的方式。

在具体应用中，MCP 将大型语言模型与 API 及其他程序化系统连接起来，使人工智能助手能够通过官方城市系统检索交通更新、提交服务请求等。Garces 表示，市政府将 MCP 视为政府数字基础设施与大型语言模型之间的中介层，有助于在快速变化的技术环境中，为代理访问增加治理和控制。

从技术实现看，MCP 服务器会定义一组“工具”。开发者用自然语言描述每个工具的适用场景，再规定需要从用户自然语言请求中提取哪些输入，以及如何将这些输入转换为对底层资源的确定性程序访问。由于大型语言模型本身具有随机性，MCP 通过这种方式，使部分关键交互更加可预期、更安全。

Garces 表示，理想状态是城市统一投资建设这类基础设施，让不同模型都通过城市的 MCP 层与政府系统交互，从而在可靠性、安全性和用户体验之间取得平衡。

首个试点：开放数据门户“直连”AI 工具

波士顿的首个 MCP 实例部署在开放数据领域。Garces 以“波士顿有多少家餐厅”为例说明现有问题：如果直接向 Claude、ChatGPT 或 Gemini 提问，这些模型通常会基于训练数据作答，数据可能已过时，或者在缺乏权威来源时“编造”答案，存在较高不准确和“幻觉”风险。

即便模型具备网页浏览能力，也需要依赖其自行找到正确来源，而互联网上关于城市数据的公开信息往往存在时效性和准确性问题，可能引用的是多年前的报告或文章。

为此，波士顿通过名为 Open Context 的 MCP 实例，将市开放数据门户与多种人工智能工具直接打通。由于 MCP 服务器具有互操作性，用户使用哪一种人工智能工具并不重要。

当用户向接入该 MCP 服务器的人工智能工具提出“根据开放数据门户，波士顿有多少家餐厅”这类问题时，系统会自动在波士顿开放数据门户中搜索相关数据集，并针对该数据集生成 SQL 查询，实时访问城市数据基础设施并返回结果。

Garces 指出，市政府在数据基础设施上投入了大量资源，但由于使用门槛较高，许多潜在用户难以直接利用这些数据。大多数人不会写 SQL，也不容易判断应使用哪个数据集。通过 MCP，将自然语言查询与数据门户连接起来，有助于降低门槛，同时规避当前通用人工智能工具在数据时效性和准确性方面的部分问题。

开发过程：从内部需求到技术原型

波士顿在 2025 年秋季启动了这一项目。市政府与东北大学 Burnes 中心的“AI for Impact”项目学生合作，希望在既有工具基础上提升实用性。

此前，波士顿已向市政府员工推出名为 AI Launchpad 的工具，提供大型语言模型访问能力。通过观察员工使用情况和问卷调查，团队发现数据分析是常见场景之一，但员工往往需要先下载数据、再粘贴到对话中，流程繁琐。项目团队据此提出目标：简化数据分析工作流，提高便捷性和可靠性。

Garces 回忆称，他在一次波士顿的人工智能主题活动中，与麻省理工学院的 Romesh Raskar 讨论了代理网络的未来以及构建开放版本的必要性。随后，团队在一个周末内迅速将讨论转化为行动：在 MIT 演讲中发出为波士顿打造更好代理体验的倡议，并在接下来一周决定尝试构建 MCP 服务器并将其接入 AI Launchpad。

在学生团队参与下，项目在当年 10 月就完成了与开放数据门户连接的原型。随后两个月，团队持续迭代以提升可靠性。早期版本在定位数据集方面表现良好，但在处理大型数据集时能力有限，更适合小规模样本。

为改善这一问题，团队将更多计算任务“推送”到开放数据门户本身。由于大多数数据门户具备运行查询的能力，项目利用门户执行更多分析工作，从而提高整体交互的可靠性，并在效率和成本方面取得改进。

向可复制的数字公共基础设施迈进

Garces 表示，波士顿将 MCP 视为数字公共基础设施（Digital Public Infrastructure，DPI）的一部分。团队认为，代理网络只有在为真实用户提供可靠、安全的中介服务时才有意义，而这与现有的身份认证、API 暴露、支付接口等 DPI 组件密切相关。

在波士顿的设想中，MCP 通过在人工智能系统“看到”的内容与政府既有基础设施之间增加一层中介，使交互更加可控和可监测。当前试点选择开放数据，是因为相关数据已公开、风险相对较低。未来，这一模式有可能扩展到服务请求等更复杂的交互场景。

Garces 认为，政府应具备建设和管理这类基础设施的能力，同时也不排除供应商将类似接口集成到面向政府的产品中。

安全与治理：在“全面阻断”和“完全放开”之间

随着代理浏览器和自动化工具的普及，波士顿市政府注意到 boston.gov 网站上来自人工智能系统的抓取和“深度搜索”流量在增加。Garces 指出，一项现实担忧是现有 API 并非总是为此类访问做好安全准备。

他提到的主要风险包括：

人工智能工具发起的请求与真实人类需求无关，可能被用于提交欺诈性请求；
行为者通过代理大量占用有限的政府资源，制造服务稀缺，再转售访问机会，类似演唱会“黄牛”；
在缺乏受控中介层的情况下，难以对人工智能系统与政府系统之间的流量进行有效监控和防护。

在 Garces 看来，MCP 服务器作为中间件，可以帮助政府更容易地利用网络安全工具阻断未经授权的代理请求，同时保留对合法使用的支持。其基本思路是：需要服务的用户通过政府控制的授权渠道访问系统，访问可与身份关联，并实现端到端监控和安全保障。

如果没有这类中介层，政府在应对代理访问时可能面临“要么全部阻断，要么完全放开”的两难。MCP 则提供了一种“中间道路”，为代理交互引入治理机制。

应用边界：暂不触及高风险领域

波士顿在部署 MCP 时设定了明确边界。几个月前，该市发布人工智能政策声明，明确在可靠性尚未充分验证、且存在复杂偏见风险的情况下，不使用人工智能处理可能影响个人生活、财产或公民自由的信息。

因此，目前 MCP 的应用范围刻意避开上述高风险类别。Garces 表示，这不仅仅是“有人类介入”的问题，市政府也意识到人工智能作为中介可能产生难以察觉和纠正的不良影响。

与此同时，波士顿正与残障群体以及面临语言障碍的居民保持密切合作。市政府注意到，公共服务往往对最需要帮助的人来说最难获得，而这些群体通常也最缺乏访问大型语言模型、付费订阅、稳定网络和个人设备的条件。

推广难点：发现性与易用性

在谈及推广 MCP 面临的最大障碍时，Garces 指出，一方面 MCP 作为新技术，在认证等方面仍存在技术差距，早期版本并不原生支持某些安全机制，团队需要额外开发框架来保障安全；另一方面，更关键的问题在于“可发现性”和“易用性”。

他表示，理想状态是使用 MCP 基础设施应像访问一个 URL 一样简单：用户可以像输入网站地址或通过搜索引擎查找网站那样，轻松找到并使用 MCP 服务，几乎没有门槛。目前，尽管已经取得一定进展，但仍需要大量技术准备工作。

对其他城市的启示与后续计划

对于希望在这一方向上探索的其他城市，Garces 认为，良好的元数据管理是关键起点。大型语言模型可以消耗大量数据，但如果缺乏清晰的描述和上下文，就难以正确理解数据内容。因此，完善的数据治理被视为基础工作。

波士顿计划将相关成果对外开放。Garces 表示，市政府打算将 Open Context 项目开源，方便其他城市复制。MCP 服务器本身的运行成本并不高，目标是让部署 MCP 像在公共云上安装一个软件包一样简单，适配不同城市使用的云环境。

他同时指出，如何将 MCP 与更广泛的公共服务结合，是每个城市都需要独立解决的问题，波士顿也仍在探索之中。

在 Garces 看来，数据只有被使用才真正产生价值。自波士顿开始发布开放数据以来，数据质量已有所提升。市政府预计，随着更多人使用开放数据，数据治理和质量将进一步改善，并希望生成式人工智能能够让更多公众更容易地使用开放数据，共同参与解决城市问题。

据介绍，本次采访内容的一个版本亦发表于 Reboot Democracy。

发表评论

登录后才可评论。去登录