趋势网(微博|微信)讯:
美国大选前夕更多富人计划离开美国 考研报名禁止使用海马体照片 乌克兰称已同朝鲜军队发生交战 2024美国大选选举日投票正式开始 女子称卖40万手表后银行卡被冻结
(Facebook易用性团队成员马特·金,杰夫·维兰德,吴少梅)
如果你问Facebook成长团队中的一员,到底是什么在发挥着如此重大的作用,能够让你们公司每天都有十亿用户,他们很可能会这样说“是图片”。自2005年起,Facebook用户就能上传无数张照片。Facebook推出图片功能一年后,社交网络吸引了全球客户的眼球。人们很难想象Facebook的页面上没有图片所呈现的效果。但是对于上千万的失明人士和有视力障碍的人来说,Facebook的页面上没有照片已经不是什么稀奇怪事了,而是存在了十年以上的事实。
今天Facebook推出自动为失明人士和有视力障碍的人解说图片内容的人工智能,失明人士和有视力障碍的人无法观赏Facebook图片的事实将不复存在。这种功能叫自动选择文本,由Facebook成立五年的易用性团队创造的。该团队由Facebook产品团队前任用户研究员杰夫·维兰德带领。产品团队先前为视频制作隐藏字幕和为Facebook IOS调整默认字体大小添加选项,百分之十的Facebook用户使用该功能。
今天,自动选择文本应用于IOS系统,之后安卓系统和网络系统也会有该功能。自动选择文本能够通过机器分析认出照片中的物品,而机器分析又通过运算建立人工智能做出预测。例如,如果你在一个软件上存入足够数量的狗狗图片,机器便会及时认出照片中的狗狗。自动选择文本先在Facebook上辨认事物,然后通过苹果手机画外音功能大声为用户描述图片内容。尽管这功能还处于刚起步阶段,但能准确辨认出列表中的物品概念,包括运输领域的(车,船,飞机),自然界中的(雪,海洋,日出),与运动相关的(如篮球场),及食品类(如寿司)。该技术还能描述人(如婴儿,面带笑容的,带胡子的)及分辨自拍照。
上周,我去门罗公园观览了Facebook的易用性实验室,看技术的实际运作。维兰德也在那里,还有马特·金,Facebook 里一位失明的工程师,出生以后视力不佳,大学时就看不见东西了。他自十九世纪八十年代起就倡导易用性电脑。今天,他在万维网团队中代表Facebook负责易用性网页的技术规格研发。
失明人士最初使用互联网是通过屏幕阅读器,该软件是用于给失明人士解说屏幕上的主要功能(链接,按键,某些文本等等)以及保证失明人士与互联网的互动。网络经过多年的发展,为失明人士提供越来越便利的服务。比如说,通过Facebook页面的下三角形,你就可以隐藏你的帖子或者将其设为垃圾邮件。此外,屏幕阅读器不会将其解说成三角形,而是“趣事选项,折叠弹出按钮”。以那样的方式,失明用户就能更好地了解他们如何与互联网互动。
但是,大多数网络已经很长一段时间无法为失明人士提供便利服务。“之前,你可以听到文件夹的名称,但你不知道它们是否能点击打开,”金说,“它就像搜寻复活节彩蛋一样,一点都不有趣。即使我找到了彩蛋,大部分彩蛋都是图片。人们通过图片交流,但是我根本无法知道图片的具体内容。”Facebook想出一系列方案解决这个问题。“我们不愿再让问题复杂化,”金说,“我们可以在人们上传图片时,让他们填写照片描述:‘请为失明人士添加图片解说’。这样会让人们抓狂的,而且也行不通。(这就是Twitter正在讨论的使用办法,尽管添加描述是可选择的。)
Facebook的照片日上传规模庞大,每天用户通过Facebook,Instagra m, Messenger和Whats App等应用上传二十亿张图片。因此,易用性团队调去人工智能开发部,设计出能自动辨认图像的软件。“我们需要解决这个问题,让即将加入社区的无法看清图片和明白个中含义的失明人士像正常人一样从这个平台享受同样的乐趣,获得同样的利益,”金说。
在一次演示会中,金突然中断讲关于Facebook的故事,其中也包括图片上传。如果你想回想一下你曾经所了解的网页设计,你可以看看五分钟失明人士如何使用电脑。金通常有自己的屏幕阅读器为他迅速解说电脑各项功能,现在轻便的音频指示器引导他打开网页,为他解说Facebook的帖子内容,辨认链接,显示各类功能按钮。当他按要求在笔记本上输入命令时,他的手指在键盘上摸索。对于这个操作我是完全晕头转向不知该怎样做,直到金把屏幕打开,保存了我们在Facebook上所看到的小段解说词。
Facebook贴吧上有一张带字幕的图片“周日挥霍之夜”,而手机的解说是“比萨饼”。金重新打开屏幕之时,有一张巨大的加了橄榄的意大利香肠比萨饼。另一张图片字幕是“庆祝”,图片解说是“门外那三位笑容满面”。结果竟然是…门外那三位笑容满面。“现在我才知道这个故事的精华所在,”金说,“有时一个词的魅力真的很惊人。”
Facebook不是唯一用机器辨别图片的应用,而是少数能够迅速辨认复杂图片的人工智能。同样的输关键字搜索图片技术在谷歌图片和网络相册也能体验得到。但是这种技术容易解析错误,而且上百万的东西无法解析正确。去年,谷歌因为两位黑人照片打上大猩猩的标签而被迫公开道歉。
通过默认选项,Facebook仅能为图片提供建议性标签,前提是该应用百分之八十确定该图片的物体具体是什么。但是,公司领导告诉我,如果涉及到敏感图象,比如说人种描述这类,在做出解说提示前需要更高的辨认率。如果对图像中的物体没有充分的把握,Facebook显然不会轻易给出解说提示。“在某些情况,没有信息比坏的信息要来的好,”维兰德说。
科技公司将一个项目解说成“刚刚开始”真是老土,但是在这个例子,这个解说的确正确。今天,它仅在一个平台上提供服务,而且仅用英文解说。还有成千上百的物品Facebook无法有百分之八十的把握能够准确辨认出。(人工智能辨认“比萨饼”,但是要准确辨别出“加了橄榄的辣香肠比萨饼”还需要很长一段时间才能做到。)但是该团队正努力设计两个新工具:能够辨认视频中的物品,这种技术在11月首次展示出来。还有一些可看性问答功能,用户可以通过该功能询问图片内容并收到人工智能的回复。比如说,你想知道图片中的人物是谁,人工智能会告诉你图片中Facebook友人的名字。
在这个平台,自动可选择性标签代表着技术的惊人展现。但是从某种规模说来,它们也代表着机会增多-显然,一般残障人士不大可能上Facebook.“能够使用Facebook的人感叹其功能强大,而不方便使用者会感到痛苦,”金说,“设计人工智能为失明人士服务的原因是要告诉失明人士,你能够加入世界性社区的谈话对我们来说非常重要。也就是说,作为人,你有问题,我们来替你解决。我们欢迎加入我们的每一个人,我们会努力让每一个人加入我们。