SoulMate:可随用户特征进化的本地化 LLM 加速器

richlovec 1500_400 (1)
 

虽然像 ChatGPT 这样的大型语言模型(LLM)已经能回答海量问题,但它们通常难以真正理解用户的细微习惯,也难以长期记住过往对话的上下文。因此,即便 AI 已深度进入日常生活,人们仍常觉得它像个“陌生人”。

为突破这一局限,韩国科学技术院(KAIST)人工智能半导体研究生院柳晖俊教授团队开发出全球首款面向“数字灵魂伴侣”场景的 AI 半导体——“SoulMate”。这款芯片可以在本地实时学习并适应用户的语音风格、偏好和情绪变化,目标是成为真正意义上的“数字灵魂伴侣”。

研究团队认为,这项技术是推动“超个性化 AI”时代的重要半导体创新:不再只是“一个模型服务所有人”,而是让 AI 能够学习并响应每个用户独特的对话方式与偏好。相关成果已收录于《2026 年 IEEE 国际固态电路会议(ISSCC)》论文集中。

SoulMate:设备端个性化系统如何运作

SoulMate 的关键在于完全基于设备端的 AI 处理架构:数据直接在本地芯片上运算,无需上传至云端服务器。

研究团队在半导体内部实现了两项核心技术:

  • 检索增强生成(RAG):利用本地记忆,根据用户过往对话内容生成更贴合个人习惯的回答。
  • 低秩适配(LoRA):在不改动基础模型大部分参数的前提下,快速学习并反映用户的即时反馈,实现在线微调。

借助这两项技术,SoulMate 能在执行学习任务的同时,以约 0.2 秒(216.4 毫秒)的延迟给出响应,构建出真正“实时”的个性化 AI 交互系统。

在架构设计上,团队采用了混合秩结构,会根据信息的重要程度选择不同的处理方式,从而显著降低能耗。最终芯片功耗仅为 9.8 毫瓦(mW),约等于普通智能手机处理器的 1/500,使其在移动设备上也能轻松承担复杂的学习与推理任务,而不会带来明显的电池负担。

隐私保护、身份识别与商业化路径

在隐私方面,SoulMate 采用所谓“安全完整 AI”结构:所有与用户相关的个人数据都在设备内部处理,不会传输到外部服务器,从源头上阻断了个人信息泄露的风险。

研究团队预计,这一技术将与下一代智能手机、可穿戴设备以及各类个人 AI 终端结合,推动真正意义上的个性化 AI 服务普及。

“这项研究模拟了人类建立友谊的过程,为 AI 进化为用户真正的伙伴奠定了技术基础。”柳晖俊教授表示,“未来的 AI 将不再只是工具,而会成为随时随地最了解我的‘最佳朋友’,同时又能严密守护个人隐私。”

本研究由博士生洪成彦担任第一作者,并在今年 2 月于旧金山举行的国际固态电路会议(ISSCC)上被评为“亮点论文”,引发全球学术界的广泛关注。

在会议现场,团队利用实际流片的半导体芯片,成功演示了 AI 能根据用户实时反应调整回答风格的能力,进一步验证了韩国在 AI 半导体领域的技术实力。按照计划,SoulMate AI 半导体将由柳晖俊教授创立的初创公司 “OnNeuro AI” 推动,目标在 2027 年左右实现商业化落地。


分享:


发表评论

登录后才可评论。 去登录