xAI 发布低延迟语音 AI 代理「Grok Voice Think Fast 1.0」，可处理复杂电话业务

AI 2026-05-03 xAI, Grok Voice, 语音AI, 企业应用, 客服与呼叫中心 17 次浏览

xAI 于 2026 年 4 月 23 日正式发布旗舰级语音模型 「Grok Voice Think Fast 1.0」。这一模型被定位为面向企业级应用的语音 AI，能够处理客户支持、电话销售以及各类复杂且含有不确定性的多步骤业务流程。

xAI 在其官方 X 账号上，将该模型描述为「专为复杂多步骤任务打造的最前沿语音模型」。

面向真实电话环境设计，原生支持 25+ 种语言

Grok Voice Think Fast 1.0 是在与 Starlink 等合作伙伴协作下开发完成的。根据 xAI 的介绍，该模型的目标是将高智能、低响应延迟与自然对话能力结合在一起，用于真实业务场景。

xAI 表示，Grok Voice Think Fast 1.0 已在接近真实使用环境的条件下进行测试，包括：

电话语音质量波动
背景噪音
强烈口音
频繁打断与插话

模型原生支持 25 种以上语言，适合在全球范围内部署和运营。

在信息采集方面，Grok Voice Think Fast 1.0 能够从自然口语中提取并结构化整理各类客户信息，例如：

邮箱地址
住址
电话号码
姓名
账号编号等

在需要时，模型还可以将这些信息以语音形式复述给用户进行确认，满足金融、电信等对信息准确性要求较高的场景。

后台持续推理，在不增加延迟的情况下处理复杂问题

xAI 将「实时推理（real-time inference）」列为 Grok Voice Think Fast 1.0 的核心特性之一。模型在处理复杂咨询或多步骤业务流程时，可以在不显著增加响应延迟的前提下，在后台持续进行推理和计算。

这意味着用户在通话中几乎感受不到等待时间的增加，同时又能获得更准确的回答和更复杂的业务处理能力。

xAI 举了一个例子：当被问到「一年 12 个月中，哪些月份的英文名包含字母 X？」时，一些其他模型会给出错误答案，而 Grok Voice Think Fast 1.0 则能够正确回答「没有任何一个月份符合条件」。

在面向企业语音模型的评测指标 「τ-voice Leaderboard」 上，xAI 称 Grok Voice Think Fast 1.0 的得分为 67.3%，高于：

Gemini 3.1 Flash Live：43.8%
Grok Voice Fast 1.0：38.3%
GPT Realtime 1.5：35.3%

在零售、航空、通信等细分行业场景的评测中，Grok Voice Think Fast 1.0 也都取得了最高分。

已在 Starlink 电话销售与客服中大规模应用

据 xAI 介绍，Grok Voice 已经在 Starlink 的电话销售和客户支持业务中投入使用。通过电话号码 +1 (888) GO STARLINK 接入的来电，将由该语音 AI 代理参与处理，覆盖：

销售咨询与下单
客户支持
多语言服务
新客户的开户与服务开通（Onboarding）

xAI 披露的运营数据包括：

在 Starlink 的销售咨询电话中，约 20% 的来电客户会在通话过程中直接完成 Starlink 服务的购买；
在客户支持场景中，约 70% 的咨询由 Grok Voice 代理在无人介入的情况下自主解决。

同一个语音代理可以跨越销售与客服两大领域，执行数百种不同的业务流程，并调用 28 种工具。xAI 表示，Grok Voice 还负责处理对准确性要求极高的任务，例如：

硬件故障排查
设备更换流程
服务补偿与信用额度发放

从对话模型走向「可执行业务」的语音 AI 代理

xAI 将 Grok Voice Think Fast 1.0 设计为一个可执行具体业务的语音 AI 代理，而不仅仅是一个能聊天的语音模型。

在电话场景中，它不仅能与用户进行自然对话，还可以：

主动询问并记录关键信息
与用户进行信息核对
调用外部工具或系统
按照预设业务流程推进处理进度

随着生成式 AI 的应用从文本聊天扩展到实时语音对话，再进一步延伸到客户服务、销售等「直接执行业务」的场景，xAI 此次发布的 Grok Voice Think Fast 1.0，体现出其希望将 Grok 系列从单纯的对话型 AI，升级为可深度嵌入企业电话业务的智能语音代理的战略方向。

发表评论

登录后才可评论。去登录