xAI 于 2026 年 4 月 23 日正式发布旗舰级语音模型 「Grok Voice Think Fast 1.0」。这一模型被定位为面向企业级应用的语音 AI,能够处理客户支持、电话销售以及各类复杂且含有不确定性的多步骤业务流程。
xAI 在其官方 X 账号上,将该模型描述为「专为复杂多步骤任务打造的最前沿语音模型」。
面向真实电话环境设计,原生支持 25+ 种语言
Grok Voice Think Fast 1.0 是在与 Starlink 等合作伙伴协作下开发完成的。根据 xAI 的介绍,该模型的目标是将高智能、低响应延迟与自然对话能力结合在一起,用于真实业务场景。
xAI 表示,Grok Voice Think Fast 1.0 已在接近真实使用环境的条件下进行测试,包括:
- 电话语音质量波动
- 背景噪音
- 强烈口音
- 频繁打断与插话
模型原生支持 25 种以上语言,适合在全球范围内部署和运营。
在信息采集方面,Grok Voice Think Fast 1.0 能够从自然口语中提取并结构化整理各类客户信息,例如:
- 邮箱地址
- 住址
- 电话号码
- 姓名
- 账号编号等
在需要时,模型还可以将这些信息以语音形式复述给用户进行确认,满足金融、电信等对信息准确性要求较高的场景。
后台持续推理,在不增加延迟的情况下处理复杂问题
xAI 将「实时推理(real-time inference)」列为 Grok Voice Think Fast 1.0 的核心特性之一。模型在处理复杂咨询或多步骤业务流程时,可以在不显著增加响应延迟的前提下,在后台持续进行推理和计算。
这意味着用户在通话中几乎感受不到等待时间的增加,同时又能获得更准确的回答和更复杂的业务处理能力。

xAI 举了一个例子:当被问到「一年 12 个月中,哪些月份的英文名包含字母 X?」时,一些其他模型会给出错误答案,而 Grok Voice Think Fast 1.0 则能够正确回答「没有任何一个月份符合条件」。
在面向企业语音模型的评测指标 「τ-voice Leaderboard」 上,xAI 称 Grok Voice Think Fast 1.0 的得分为 67.3%,高于:
- Gemini 3.1 Flash Live:43.8%
- Grok Voice Fast 1.0:38.3%
- GPT Realtime 1.5:35.3%
在零售、航空、通信等细分行业场景的评测中,Grok Voice Think Fast 1.0 也都取得了最高分。
已在 Starlink 电话销售与客服中大规模应用
据 xAI 介绍,Grok Voice 已经在 Starlink 的电话销售和客户支持业务中投入使用。通过电话号码 +1 (888) GO STARLINK 接入的来电,将由该语音 AI 代理参与处理,覆盖:
- 销售咨询与下单
- 客户支持
- 多语言服务
- 新客户的开户与服务开通(Onboarding)
xAI 披露的运营数据包括:
- 在 Starlink 的销售咨询电话中,约 20% 的来电客户会在通话过程中直接完成 Starlink 服务的购买;
- 在客户支持场景中,约 70% 的咨询由 Grok Voice 代理在无人介入的情况下自主解决。
同一个语音代理可以跨越销售与客服两大领域,执行数百种不同的业务流程,并调用 28 种工具。xAI 表示,Grok Voice 还负责处理对准确性要求极高的任务,例如:
- 硬件故障排查
- 设备更换流程
- 服务补偿与信用额度发放
从对话模型走向「可执行业务」的语音 AI 代理
xAI 将 Grok Voice Think Fast 1.0 设计为一个可执行具体业务的语音 AI 代理,而不仅仅是一个能聊天的语音模型。
在电话场景中,它不仅能与用户进行自然对话,还可以:
- 主动询问并记录关键信息
- 与用户进行信息核对
- 调用外部工具或系统
- 按照预设业务流程推进处理进度
随着生成式 AI 的应用从文本聊天扩展到实时语音对话,再进一步延伸到客户服务、销售等「直接执行业务」的场景,xAI 此次发布的 Grok Voice Think Fast 1.0,体现出其希望将 Grok 系列从单纯的对话型 AI,升级为可深度嵌入企业电话业务的智能语音代理的战略方向。