英国约克郡开发者 Nick Payne 推出一款名为 Talat 的 Mac 应用,主打在本地完成会议录音与AI转录,不将音频或文本上传至云端,并采用一次性付费模式,试图在 Granola 等流行AI笔记工具之外提供一条“本地优先”的替代路径。
Payne 表示,开发 Talat 的想法源于他对现有工具的技术研究和隐私考量。他称自己是“计算机极客”,最初是在使用 AI 驱动的笔记应用 Granola 时,注意到该应用能够在 Mac 上录制系统音频而无需录制视频,这与当时常见的“录屏取音”变通方案不同。这一发现促使他深入研究苹果相关接口,并找到一个相对较新且文档不完善的苹果 API。
为更方便调用这一名为 Core Audio Taps 的接口(允许开发者接入 Mac 的音频流),Payne 随后创建了开源音频库 AudioTee。但在相当一段时间内,他认为自己手中的技术更像是一套工具包或技术演示,而不是可以单独成型的产品。
与此同时,Payne 也在关注托管式转录服务的发展。他提到,目前最先进的一些托管转录模型(Granola 等服务所依赖的同类技术)在实时转录方面表现出色,用户可以几乎实时看到自己的语音转成文字。不过,他始终对将语音数据上传至第三方服务器持保留态度,尤其是涉及“真实声音”这类敏感信息。
转折点出现在他接触到名为 FluidAudio 的软件工具包之后。FluidAudio 是一个 Swift 框架,支持在苹果设备上以低延迟方式本地运行音频 AI 模型,并可直接利用 Mac 上的神经引擎这一专用 AI 处理硬件。Payne 意识到,借助这一框架,他可以将此前的研究整合为一款真正的产品:音频始终留在本机,转录和总结过程也不依赖外部服务器。
Talat 由 Payne 与其长期好友及前同事 Mike Franklin 共同开发。应用安装包约 20MB,采用一次性购买模式,无需注册账户,也不要求用户向开发者共享分析数据,且不收取持续订阅费用。
在功能设计上,Talat 相比部分功能更复杂的 AI 笔记工具更为简洁。用户在使用 Zoom、Teams、Google Meet 等会议软件时,Talat 会从电脑麦克风捕获音频并进行实时转录。应用会尝试自动区分并标注不同发言者,用户也可以在会后手动调整。用户可在会议过程中添加笔记,并对转录片段进行编辑、删除或拆分。会议结束后,本地运行的大型语言模型(LLM)会生成一份总结,涵盖会议要点、决策和行动项。

Talat 中的笔记、转录内容及总结均支持搜索。Payne 表示,除了强调隐私保护,他还希望为用户提供更多配置空间和数据控制权。
在数据流向方面,Talat 允许用户自行选择大型语言模型,并支持将内容自动导出到笔记应用 Obsidian,或在会议结束时通过 Webhook 推送数据。应用还支持通过 MCP 服务器按需访问外部数据源。Payne 称,这些设计旨在让用户更清楚地掌控数据的去向和使用方式。
从技术实现看,Talat 的 AI 系统由多种技术组合而成,其中大部分核心工作由 FluidAudio 负责整合和抽象。默认情况下,Talat 的总结功能使用名为 Qwen3-4B-4bit 的模型,该模型可在配置相对普通的硬件上运行。
用户也可以选择改用任意云端大型语言模型服务,或在两种由英伟达(Nvidia)开发的 Parakeet 语音识别模型之间切换。Talat 还支持通过 Ollama 运行本地模型,以获得更灵活的使用体验。Payne 表示,未来计划在应用中加入更多内置选项,并与 Google 日历、Notion 等服务进行集成。
在发布阶段,Talat 面向搭载苹果自研 M 系列芯片(自 M1 起)的 Mac 用户提供免费下载试用,试用额度为 10 小时录音时间,之后用户可决定是否购买。Talat 预发布版本售价 49 美元,仍在持续开发中。按照计划,正式 1.0 版本发布时,价格将上调至 99 美元。
Payne 和 Franklin 目前以自筹资金方式推进 Talat 的开发,并计划在未来继续保持核心产品的一次性购买模式。