文|差评
前几天,差评君上网时,看到了这么一条有意思的新闻。。。
英国媒体 The Guardian ,也就是「 卫报 」发布了一篇文章,说「 苹果合约方定期听取 Siri 录音」 。。。差评君看完这个消息,感觉信息量有点大:和 Siri 讲话会被录音?这个录音还会被苹果拿到外面给别人听??
这两个事情,经过苹果证实,确实有小于 1% 的语音片段会被录下来上传,做人工分析。也就是说这份报道是真的。你平时和 Siri 说的话,真的有小概率会被录音,而且给苹果外包的第三方做分析。而这么做的原因,和苹果之前写在隐私说明里的目的是一致的:提升 Siri 的用户体验。
尽管这种通过「 用户体验计划 」收集数据的方式已经被各大公司用了很久了,但苹果这一出还是让差评君觉得很不习惯 ——这可是苹果啊,那个最重视隐私,在广告宣传中把隐私作为最大卖点的苹果啊。。。在今年 1 月 CES 时期,从不参加 CES 的苹果照例缺席了 CES ,但竖起了大大的广告,写着「 在 iPhone 上发生的事情,只会呆在你的 iPhone 里」。
虽然苹果证实的 1% 不算太高,但很明显,他们做的和这句宣传语是有出入的。在语音助手收集录音这件事情上,向来注重隐私的苹果都做成这样了,这个行业还会好么?事实上就是。。。不太乐观。首先,差评君要先和差友们说清楚一点,现在的大公司做「 用户体验计划 」时收集的数据,除非法律要求,一般都是「 脱敏 」的 —— 也就是去标识化,能看到数据是啥,但分辨不出数据来源在哪。
如果哪家大公司这一点没有做好,那就不仅仅是大新闻了,而是丑闻了。。。也就是说,无论是华为也好,苹果也好,三星、谷歌等等,一般情况下你都不用太担心有人用他们通过「 用户体验计划 」收集到的数据找到你。那差评君为啥还说「 不太乐观 」?因为文字信息这东西对电脑来说是字符,是可以用机器对敏感内容做一些预先处理的,苹果在这一点上尤其用心,还用到了差分隐私技术。
而语音内容的转换过程本身就是个极为复杂的机器学习过程,在这个过程中,往往需要人类参与给这些内容做标识,告诉机器哪段识别对了,哪段不对,把屎把尿地把语音人工智能教好。说白了,要有人工参与这件事,这一点似乎做语音助手的科技公司都没少干。苹果把一部分 Siri 录音传给第三方,让他们判断语音助手被唤醒的时候是不是意外,Siri 回答得好不好等等。。。
美国电商巨头亚马逊也雇人专门听自家语音助手 Alexa 采集的录音,从而提升体验
谷歌的 Google Assistant 语音助手虽然好用,但早些时候也证实聘请合同工听取用户录音。。。
由于给这些录音打标签等工作没啥技术含量,差评君上面提到的三巨头都选择了外包合约工来做这件事。也就是说,在语音助手上,大家都在用一套类似的做法:录音让人类来检查录音这些人还都是第三方合约工国内的很多科技公司,也或多或少存在类似的情况。比如小米曾经公布了小爱同学的聊天统计,结果起到了负面宣传效果,一堆网民在微博下评论质疑隐私问题。
但目前为止,虽然让人类来听这些录音,或多或少让人觉得心里膈应,但总归还是「 脱敏 」的吧?这里差评君就要提及普遍存在的另一个潜在问题了 —— 意外唤醒。「 天猫精灵 」、「 小爱同学 」、「 Hey,Siri 」、「 OK,Google 」 。。。现在语音助手都能被语音唤醒,但有时候机器会「 误听 」到唤醒词,在主人不知道的时候就开始聆听了。。。
你确实不会在主动唤醒语音助手以后,开始说「 我家住在 XXX 」、「 银行卡号是 XXX 」。但如果你不知道它被唤醒了,然后刚好随机算法轮到这 1% 的采集时间了呢?根据「卫报」文章里做爆料的苹果外包工说:「 有不少录音的内容涉及隐私对话,例如医患讨论病情,商业合同,涉及犯罪的交易,以及性相关的内容」
很多时候,用户本人都不知道,语音助手就被唤醒了,然后稀里糊涂地就被录音传了,然后。。。听到录音的是另一个活生生的人类。总之,这一套逻辑下来可以看到,这很不安全,对隐私也存在威胁。而这,目前还是没有啥好的解决方法,我们作为用户能选择的,顶多就是抛弃便利,关闭个性化和优化服务,或者干脆就不用。
这个问题说到底还是绕不开「 隐私和便利 」这个话题。况且,人工智能产品如果样本数据量不够,是很难做好的。
科技公司们的初心也许就是单纯地想做「 用户体验计划 」,靠数据提升服务水平,又因为语音识别的特殊性,不得不介入人工。但,这不意味着他们可以用妥协的方案来将就着,也不意味着他们应该在直到有人爆料之前,都一声不吭。隐私和便利如何抉择,我们都抓秃了头,但不代表这就没法解决了。苹果广泛使用的差分隐私技术,解决了传统数据隐私问题;也许哪一天有一门技术,可以搞定语音数据的隐私问题。但不论如何,差评君觉得,这些大公司在语音助手的「 用户体验计划 」上,起码应该尊重用户的知情权。资料来源:The Guardian 「Apple contractors 'regularly hear confidential details' on Siri recordings 」The Guardian 「Amazon staff listen to customers' Alexa recordings, report says 」TheGuardian 「Google workers can listen to what people say to its AI home devices」VRT NEWS 「Google employees are eavesdropping, even in your living room, VRT NWS has discovered」苹果官网 「 我们如何保护你的隐私安全。」腾讯科技「 亚马逊被爆全球雇佣数千人“偷听”Alexa用户说话 」新浪微博“ 其实我银行账户里的数字,听到了应该也没人想偷”
评论