云基础设施迎接“机器主导”时代:AWS 推出新一代 OpenSearch Serverless

richlovec 1500_400 (1)
 

随着人工智能代理(AI agents)从试验项目逐步进入生产环境,互联网底层正在围绕“机器流量”而非人类用户被重新设计。

过去,云基础设施主要服务于人类行为:搜索、点击、滚动和观看流媒体等模式相对稳定、可预测。而人工智能代理的访问方式明显不同,它们可以在极短时间内并行启动多个子代理,查询数百个数据库、检索文档、调用大量 API,随后迅速进入空闲状态。这种突发性和瞬时性,对传统为人类交互优化的系统提出了新的要求。

在此背景下,亚马逊云科技(AWS)开始调整其核心云基础设施。周四,AWS 发布了新一代 OpenSearch Serverless,这是一款完全托管的搜索与向量数据库服务,被定位为面向代理工作负载的大规模信息存储与检索系统。AWS 称,该系统可以在代理触发任务时在数秒内自动扩展算力,并在空闲时缩减至零。

这一产品更新被视为科技行业共识的体现:最初为人类驱动的互联网设计的基础设施,在一个日益由代理主导的环境中适配性不足。

尽管目前人工智能代理在整体互联网活动中仍占较小比例,但机器生成流量已相当可观,并呈持续上升趋势。Cloudflare 的数据显示,在过去六个月中,机器人占整体 HTTP 流量的 31%,其中人工智能爬虫、搜索引擎和助手约占所有机器人请求的四分之一。

Cloudflare 高级产品经理赖怡·奥尔森(Lai Yi Ohlsen)在接受 TechCrunch 采访时表示,非人类流量预计将在 2027 年上半年某个时间点超过人类流量。

在上周举行的谷歌 I/O 开发者大会上,谷歌介绍称,用户将能够把部分任务交由人工智能系统处理,包括购物调研、预订旅行、浏览网页以及与应用互动等。但相关应用并不限于面向消费者的代理。越来越多企业在内部部署代理,并将其用于面向客户的服务,在后台生成新的机器间流量类型。

在这种趋势下,云服务提供商和基础设施公司正调整原本围绕人类用户设计的系统,以适应代理持续自主检索信息、调用工具并在机器之间产生高频交互的场景。

AWS 新版 OpenSearch Serverless 正是这一调整的具体体现之一。

亚马逊 OpenSearch 服务总经理蒂娅·怀特(Tia White)在接受 TechCrunch 采访时表示,当前时点“非常明确”:代理正在从实验阶段走向生产环境,而它们产生的流量模式并非现有基础设施最初设计要处理的对象。她指出,这类流量会在没有预警的情况下突然激增,又可能迅速转为空闲,企业需要搜索服务既能跟上这种变化,又不必为闲置计算资源持续付费。

据介绍,新一代系统的关键技术变化在于将计算与存储解耦。这样一来,计算资源可以在几秒内扩展以应对代理流量高峰,并在空闲时缩减至零,使客户在代理不活动时无需承担计算费用。

怀特表示,在此前的 Serverless 版本中,存储与计算仍是耦合的,至少需要保持一个实例常驻运行,无法按需自动启动计算资源,导致无论是否有实际负载,都会为预留的计算能力付费。她将旧模式比作“即使车位空着也要一直付停车费”,而升级后的 Serverless 更接近按使用时长计费的停车方式。

在发布阶段,OpenSearch Serverless 将与 Vercel 和 Kiro 等人工智能开发平台实现原生集成,开发者可以在无需自建和运维基础设施的情况下,为代理部署可用于生产环境的搜索和向量后端。

类似的基础设施重构正在云行业多点展开。Databricks 和 Snowflake 正将自身定位为企业数据的“人工智能记忆与检索”系统。微软则为 Azure 推出更新,以处理人工智能代理的突发流量,并支持代理之间共享记忆。Cloudflare 上月也发布了面向代理的基础设施产品,目标是为代理提供持久运行环境和即时扩展能力。

随着更多企业部署人工智能代理,围绕机器生成工作负载重构云基础设施的压力预计将持续上升。相关参与方认为,这类调整有望在成本和规模上进一步推动代理的部署。


分享:


发表评论

登录后才可评论。 去登录