从语音助手到诈骗工具:AI语音克隆在噪声环境下已胜过人声
研究显示,在嘈杂环境中,AI语音克隆的可懂度比真实人声高出约20%,这一结果令研究人员大感意外。
Cohere发布开源语音转录模型Transcribe 支持14种语言自托管
企业人工智能公司Cohere推出首个语音模型Transcribe,主打开源、自托管和多语言支持,参数量为20亿,在多项公开基准中表现领先。
Microsoft 发布三款自研 MAI 基础模型:MAI-Transcribe-1、MAI-Voice-1、MAI-Image-2 通过 Azure AI Foundry 面向开发者开放
微软推出三款自研 AI 基础模型,覆盖语音识别、语音生成与图像生成三大场景,并通过 Azure AI Foundry 向开发者提供,强化自家 MAI 模型家族布局。
Todoist 推出语音驱动 AI 功能 Ramble 支持多平台添加待办任务
Todoist 新增 AI 语音功能 Ramble,用户可通过自然语言创建和编辑待办事项,目前已面向全平台公开测试,支持 38 种语言。