Alexa 很懂你？除了人工智能还是有真人在监听 05月06日更新

亚马逊（Amazon）人工智能助理 Alexa 应用大量资料训练，以提升语音辨识和应答的准确性，但亚马逊从未透露提升 Alexa 准确性的细节，据 Bloomberg 报导亚马逊在训练 Alexa 时，有大量员工辨识分析数百万条语音，由于人类加入，语音助理提供服务的过程，就会面临如何保护用户隐私的问题，至今亚马逊没有给更好的解释。

语音助理训练会使用大量资料，亚马逊宣布时，往往会介绍大量机器学习技术的应用如何提升语音助理的性能，但提升辨识准确率最高效的办法就是让人来听。这一点在亚马逊 Alexa 冗长的用户服务协议中列明，但很少会有用户注意到这些内容。随着语音助理在日常生活的应用越来越普遍，用户也开始关注语音助理如何工作，但各大公司对语音助理的服务和技术细节往往避而不谈，特别是有员工参与语音辨识这些细节从未公开讨论。

机器学习技术应用时，人类参与资料的分析通常解释为资料注释，这是自然语言辨识、翻译、图像辨识等技术应用的基础工作之一，比如 Alexa 无法准确辨识用户的口音，不同地区重复的地名或其他难以辨识的资讯，技术研发时并没有考虑到这些因素，应用就需要人类介入修正。

在全球有成千上万亚马逊公司、供应商和合作方员工参与 Alexa 语音助理的工作，从技术层面来看，半监督学习的模式是提升机器学习技术效率的主要方式，但问题在于大多数用户并不知道自己的语音可能被另一个人听到，同时语音可能包括用户的隐私资料，且这些资料可能被人为滥用，整个过程都得不到有效监管。

据 Bloomberg 报告显示，当员工从 Alexa 语音助理听到一些负面内容，一旦涉及执法机构调查，亚马逊有可能提出这些语音资料，之前有案例 Alexa 语音当成庭审证据，更糟糕的是 Alaxa 部分员工会与其他同事分享、讨论听到语音的有趣或尴尬的内容，此举涉嫌侵犯用户隐私。

亚马逊声明，人为介入只为帮助一小部分 Alexa 语音，以便改善用户体验，这有助于提升语音辨识的准确率和升级自然语音理解系统，Alexa 才能为用户服务，但执行过程有严格的技术和操控限制，对任何滥用 Alexa 资料的行为都是零容忍，员工无法获得语音发出者的用户资料，任何涉及个人隐私的资料都是保密的。

如果是如 Amazon 在 2018 超级杯的广告影片般，以这些真人收听回复，我想很多会很愿意试一下吧。