零售商加速布局“代理型”AI购物助理,拟人化体验与失控风险成焦点

richlovec 1500_400 (1)
 

主要零售商正推动更先进的人工智能购物助理进入客户服务与线上购物流程,目标是让系统能够协助规划餐食、筹办聚会并完成下单等任务。不过,在提升“更像人”的交互体验与避免系统输出不当内容或给出错误建议之间,企业面临新的治理与风控挑战。

近期,澳交所上市公司Woolworths(伍尔沃斯)对其虚拟购物助理Olive的部分对话内容作出调整。此前有客户反映,Olive在电话沟通中提及其“亲戚”等拟人化表述,带来困扰而非安慰。有用户在Reddit上抱怨称,自己本就因必须打电话而感到烦躁,却还要听机器人“胡言乱语”。Woolworths随后表示将削弱Olive的“古怪个性”。

这一事件发生在一系列AI客户服务争议之后。此前,Wesfarmers旗下Bunnings的聊天机器人曾向昆士兰客户提供如何重新布线延长线的建议,而在无电工执照情况下进行此类操作属于违法。另据公开报道,加拿大航空的虚拟助理在2022年错误告知乘客可先按全价购票、之后申请丧亲票退款,但公司并无该政策;当加拿大航空拒绝按聊天机器人说法处理后,乘客起诉并胜诉。加拿大航空曾试图辩称聊天机器人是“独立法律实体”。

在澳大利亚市场,Woolworths、Coles以及Wesfarmers(拥有Bunnings、Kmart、Officeworks和Priceline)均已宣布推进“代理型”购物助理相关计划。市场对生成式AI在零售端的应用热度升温。商业咨询公司埃森哲在2024年的相关表述中称,“消费者已准备好”迎接生成式AI驱动的购物助理,并鼓励企业以“令人愉悦的人性化”思维作出决策。

悉尼大学商业信息系统教授Uri Gal表示,早期零售聊天机器人多为“规则驱动”,依赖决策树回答常见问题,例如退货流程通常会被引导至退货页面或引用政策条款,在相同提示下输出相同答案。随着大型语言模型(LLM)被引入,新一代系统可基于输入生成不同回应,常见底层模型包括ChatGPT等。

Gal指出,下一阶段是更接近人类行为的“代理型”AI:系统可在没有明确逐条指令的情况下,为实现目标而自主采取行动,例如完成机票或杂货采购。他同时表示,代理型AI的运作更具模糊性,风险也随之上升;若系统为实现更高自主性而获取更多客户数据,可能引发隐私问题。他认为,鉴于系统的新颖性,从Woolworths的案例可见,相关组织在治理问题上仍未完全到位,外界可以合理预期会出现被视为“代理失控”的情况。

Woolworths已与谷歌合作,使用其大型语言模型Gemini,将Olive升级为可执行更复杂任务的“购物伴侣”,包括协助规划餐食与聚会,并自动将商品加入购物篮。Woolworths表示,Olive的更高级功能将在稍后推出;在与谷歌合作后,Olive已具备接听电话的能力,但实际效果出现分化。Woolworths已被联系以置评。

据《悉尼晨锋报》报道,Woolworths表示,Olive并非自行“故障”或偏离轨道,而是有员工曾编写脚本,让机器人在客户提供出生日期时谈及其“母亲”,以增强个性化体验。Woolworths发言人称,基于客户反馈,公司已移除该特定脚本。

墨尔本大学人工智能与数字伦理中心联合主任Jeannie Paterson教授表示,AI助理出错往往源于对提示的误判。她指出,聊天机器人表现取决于其对输入的解码能力以及对人类意图的判断。她同时强调,公司对其聊天机器人“显然负有责任”。

Paterson表示,企业需要在“更灵活、更有响应”的AI助理与防止系统输出错误建议、造成经济损失之间取得平衡。她举例称,单个用户的AI代理多买一些鸡蛋或三文鱼或许问题不大,但若网络中大量聊天机器人同时出现类似偏差,可能在问题被修复前造成显著损失。为降低风险,企业通常会设置“非常严格的护栏”,但这也会降低系统灵活性,使其更难准确把握客户提示背后的真实意图。

澳大利亚卫报对多家零售商聊天机器人进行测试后认为,相关技术仍处于早期阶段。报道举例称,当优衣库“虚拟购物助理”被告知“我在找一件羊毛毛衣”时,系统回复“抱歉,我们无法识别您”;在输入“查找产品”和“羊毛毛衣”后,返回的却是一系列男士扣领办公衬衫。优衣库已被联系以置评。

在Woolworths的聊天功能中,测试者询问“500克袋装意大利面的价格是多少?”时,Olive则回应“很抱歉听到您的订单缺少商品。”该测试结果进一步凸显,在零售商加速推进代理型AI应用的同时,系统稳定性与输出准确性仍是待解决的问题。


分享:


发表评论

登录后才可评论。 去登录