亚马逊(Amazon)人工智能助理 Alexa 应用大量资料训练,以提升语音辨识和应答的准确性,但亚马逊从未透露提升 Alexa 准确性的细节,据 Bloomberg 报导亚马逊在训练 Alexa 时,有大量员工辨识分析数百万条语音,由于人类加入,语音助理提供服务的过程,就会面临如何保护用户隐私的问题,至今亚马逊没有给更好的解释。
语音助理训练会使用大量资料,亚马逊宣布时,往往会介绍大量机器学习技术的应用如何提升语音助理的性能,但提升辨识准确率最高效的办法就是让人来听。这一点在亚马逊 Alexa 冗长的用户服务协议中列明,但很少会有用户注意到这些内容。随着语音助理在日常生活的应用越来越普遍,用户也开始关注语音助理如何工作,但各大公司对语音助理的服务和技术细节往往避而不谈,特别是有员工参与语音辨识这些细节从未公开讨论。
机器学习技术应用时,人类参与资料的分析通常解释为资料注释,这是自然语言辨识、翻译、图像辨识等技术应用的基础工作之一,比如 Alexa 无法准确辨识用户的口音,不同地区重复的地名或其他难以辨识的资讯,技术研发时并没有考虑到这些因素,应用就需要人类介入修正。
在全球有成千上万亚马逊公司、供应商和合作方员工参与 Alexa 语音助理的工作,从技术层面来看,半监督学习的模式是提升机器学习技术效率的主要方式,但问题在于大多数用户并不知道自己的语音可能被另一个人听到,同时语音可能包括用户的隐私资料,且这些资料可能被人为滥用,整个过程都得不到有效监管。
据 Bloomberg 报告显示,当员工从 Alexa 语音助理听到一些负面内容,一旦涉及执法机构调查,亚马逊有可能提出这些语音资料,之前有案例 Alexa 语音当成庭审证据,更糟糕的是 Alaxa 部分员工会与其他同事分享、讨论听到语音的有趣或尴尬的内容,此举涉嫌侵犯用户隐私。
亚马逊声明,人为介入只为帮助一小部分 Alexa 语音,以便改善用户体验,这有助于提升语音辨识的准确率和升级自然语音理解系统,Alexa 才能为用户服务,但执行过程有严格的技术和操控限制,对任何滥用 Alexa 资料的行为都是零容忍,员工无法获得语音发出者的用户资料,任何涉及个人隐私的资料都是保密的。
如果是如 Amazon 在 2018 超级杯的广告影片般,以这些真人收听回复,我想很多会很愿意试一下吧。
- Amazon Workers Are Listening to What You Tell Alexa
(首图来源:亚马逊)