趋势网(微博|微信|熊掌号):研究发现,同音异义词和语音处理中的错误可以用于对Echo用户进行网络钓鱼。
物联网设备(如亚马逊的Echo和谷歌Home)的成功为开发者创造了一个机会,他们可以构建语音激活的应用程序,这种应用程序可以更深入地连接客户的家庭和个人生活。根据伊利诺伊大学香槟分校(UIUC)的一个研究小组的研究,利用语音识别机器学习系统的一些特性来达到恶意目的的可能性也在增长。
这种名为“技能蹲起”(skill squatting)的攻击方式(本月在巴尔的摩USENIX Security研讨会上发表的一篇论文中对此进行了描述)目前仅限于亚马逊的Alexa平台,但它揭示了一个弱点,即随着其他语音平台对第三方应用程序的支持不断扩大,其他语音平台将不得不解决这一弱点。Ars与USENIX安全公司的UIUC团队(由Deepak Kumar、Riccardo Paccagnella、Paul Murley、Eric Hennenfent、Joshua Mason、Adam Bates助理教授和Michael Bailey教授组成)会面。我们谈到了他们的研究以及基于语音输入对信息系统的潜在威胁。
前中国体操队员吴柳芳转行擦边女主播引争议 浙大通报家庭困难学生晒旅游照 受王宝强资助孩子父亲发声 老人领喜糖跌倒去世家属索赔新人 普京签署法律:赴乌参战免债
主人的声音
最近有一些利用语音接口的攻击演示。今年3月,研究人员发现,即使Windows 10被锁定,Cortana“助手”也会响应语音指令——包括打开网站。支持语音识别的物联网设备已被证明易受电台或电视广告、YouTube视频和小孩子的命令影响。
这种脆弱性不仅限于语音指令。在一个单独的论文发表于本月USENIX安全,中国元Xuejing信息安全国家重点实验室的研究人员证明,音频嵌入在视频配乐,音乐流,或无线电广播可以修改触发语音指令自动语音识别系统没有检测到人类的侦听器。大多数听众都无法识别这些经过修改的歌曲存在的问题。
不过,研究人员发现,“技能抢注”攻击可能会带来更直接的风险,开发人员似乎已经给自己的应用程序起了类似于流行应用程序的名字。其中一些是偶然的,比如“鱼的事实”(一种返回关于鱼,水生脊椎动物的随机事实的技能)和“Phish事实”(一种返回关于位于佛蒙特州的果酱乐队的事实的技能),但是其他的如“猫传真”(模仿“猫的事实”)显然是有意的。
由于Alexa处理新“技能”请求的方式(注册到amazon的云应用程序),所以创建恶意技能是可能的,这些恶意技能是为现有的合法应用程序命名的。亚马逊在2017年默认通过语音命令提供其库中的所有技能,并且可以通过语音“安装”到客户的库中。“不管怎样,对于那些有选择地注册技能名称的人来说,这是一种只有语音的攻击,”贝茨说,他是UIUC安全和透明系统实验室的负责人。
这种东西为恶意开发者提供了各种可能性。他们可以建立拦截合法技能请求的技能,以驱动窃取个人和财务信息的用户交互。这基本上是用Alexa来进行钓鱼攻击(犯罪欺诈类型,而不是果酱乐队类型)。UIUC的研究人员(在沙箱环境中)演示了一种被称为“Am Express”的技能如何被用来劫持美国运通的“Amex”技能的初始请求,并窃取用户的凭证。
我没听错吧?
还有一些词是Alexa经常犯的错误,可能是由于Alexa的机器学习分类器的口音。为了识别其中的一部分,UIUC团队利用了来自全国演讲项目的音频样本。(该研究收集了来自美国六个主要方言区60位不同的说话人的语音样本,由语言学研究者Cynthia Clopper(现就职于俄亥俄大学)和David Pisoni收集。)
UIUC团队使用的集合包括60位演讲者每人188个独特的单词——总共11460个音频样本。这些样本被推到一个Alexa的技能上,该团队称之为“记录这个”。这项技术通过一个客户端应用程序将文字转录成文本,该应用程序可以批量播放音频,并控制提交的速度,以避免攻击Alexa语音处理服务器。库马尔说:“我们将每个演讲样本发送给Alexa 50次,为60位演讲者提供了57.3万份抄本。”
在188个单词中,有27%(14%)被Alexa误认为是另一个单词。此外,研究还发现了Alexa对特定方言和性别的误读——这意味着这些词可能被用来攻击特定的人群。
UIUC团队与亚马逊的安全团队分享了他们的发现。Ars联系了亚马逊,想看看他们是如何防范这类攻击的。我们收到了亚马逊一位发言人的正式声明:“客户信任对我们很重要,我们进行安全审查是技能认证过程的一部分。”我们有适当的缓解措施来检测这种技能行为,并在识别时拒绝或移除它们。
UIUC的研究人员承认,在没有在Alexa的生产库中实际发布一项技能的情况下,他们能够进行测试的程度是有限的。但是贝茨教授说,用错误的指令解决问题可能“不是‘哦,我们推了一个补丁,问题就解决了’,而是我们信任机器学习语言处理分类器,所有机器学习分类器都会出错。”所以,换掉一个键盘——一个我们信任的模拟设备——在机器学习中,会有问题,而且它们会出现在比技术领域更多的地方。
UIUC团队正在研究一系列可能的下一步研究,包括Alexa的语音处理问题可能如何影响不同的人群。研究中的一些数据表明,Alexa可能并不能平均地处理所有的演讲者,但要真正处理这个问题的范围,需要更大范围的发言数据。
研究人员还在考虑有关物联网设备信任影响的研究课题。他们在论文中写道:“如果攻击者意识到用户对语音界面的信任程度高于其他计算方式,他们可能会对语音界面进行更好、更有针对性的攻击。”该团队希望探索其他语言处理平台上存在的处理错误的类型。
“作为一个界面问题,”贝茨说,“这是没有底线的。”