汇聚全球视觉新闻资讯
你所在的位置:汇视网 > 关注 >快讯

机器学习团队主管解密Facebook语音识别战略

发布时间:2017-07-14 04:10  来源:搜狐   编辑:安远  阅读量:16793   

原标题:机器学习团队主管解密Facebook语音识别战略

△Facebook机器学习团队主管Joaquin Quinonero Candela在Facebook的F8开发者大会上发表演讲

  • Facebook应用机器学习小组正在改变恶意评论、视频和音频技术

  • 去年,Facebook开发了一个响应“Hey Oculus”的语音识别系统

苹果有Siri,亚马逊有Alexa。微软公司创建了Cortana以及Alphabet推出了Google Assistant。技术巨头正在通过大量市场设备和应用程序为消费者带来语音识别服务。

▍唯独一家公司缺席:Facebook

虽然马克·扎克伯格(Mark Zuckerberg)在全球范围内致力于推动语音识别应用程序,(上周,Facebook超过了20亿活跃用户,WhatsApp突破12亿人)但Facebook在语音控制方面仍然落后于对手。

公司面临的困境太多了。研究公司去年预测,到2022年,语音识别市场将达到100亿美元。除了这笔钱,互联网公司需要消费者使用他们的语音工具,以便他们积累更多的数据,以提高准确性。

设备制造商在推出语音技术方面具有很大的优势,因为它们可以直达消费者。不像苹果,亚马逊和Alphabet,Facebook没有一个硬件或移动操作系统,供数百万人家庭用户使用。

Facebook在硬件方面最接近的是Oculus,VR制造商被Zuckerberg在2014年以20亿美元收购。随着Facebook试图在语音识别方面大展拳脚,Oculus是其试水的方式之一。

△用户在CES 2016拉斯维加斯展上体验Oculus VR

当你佩戴头盔时,可以说“Hey Oculus”并得到回应。例如,你可以要求查看视图,或打开特定的游戏或搜索应用商店。该技术适用于Oculus Rift和Samsung Gear VR,由Oculus提供支持。

Facebook的应用机器学习小组负责人Joaquin Quinonero Candela在上周在该公司的硅谷总部接受采访时表示:“要探索任何有趣的免提界面,你一定需要说话。

Facebook在业务中使用语音识别技术,远远超出了Oculus的范畴。公司还部署了自动生成某些视频字幕的系统,更多的语音产品正在研发中。

Facebook 在2013年聘请了纽约大学教授Yann LeCun,意图加码人工智能。LeCun是长期以来在机器学习领域的三驾马车之一。

▍推和拉

几个月后,Facebook的工程师们在LeCun研究团队的带领下开始开发产品,并准备广泛的普及。2015年9月Facebook成立了应用机器学习小组,在三年前到任Facebook的微软研究部的资深人士Candela主导了团队的构成。

Facebook在语音识别方面一直保持领先地位,问题是谷歌、苹果和微软近年来也提高了系统的准确性。

Candela表示,他的团队大约在二年半前开始从事语音增强工作,2013年Facebook收购Jibbigo(Jibbigo是一家iOS和Android设备语音翻译应用的领先开发商,曾在2009年推出全球首款语音翻译应用),其创始人同时进入公司参与语音识别工作。

Facebook的研究与开发分为两类:推拉。推动很像投资,如果某些创新功能在未来会大面积普及,那么我们会着手去缔造,而拉动是工程师要求内部构建新功能时。

Speech(恶意言论)正属于推动类项目。

研究人员提出的一个研究成果是自动生成视频的字幕,这个技术Google曾于2009年开始为YouTube视频提供此项服务。

▍寻找问题

Facebook最初专注于广告。理由是,当时人们通常会用声音来播报最新消息,所以广告客户通过公司动态传递信息,在视频广告中运行文本。

Facebook的基础设施部门的工程经理Reena Philip表示:“我们在语音识别领域试图寻找一个问题空间,通过这个空间我们可以为用户带来价值。” 她与广告团队联手,紧密合作建立了一个产品原型。

该功能于2016年第二季度推出。随着Facebook技术的进一步深入,可以为美语、英语视频自动生成字幕。

Candela说:“我们做了实验 - 如果我们把字幕数据标注在视频上,我们可以增加两位数的参与度。

与视频字幕系统不同,Oculus语音识别功能是触发Candela小组工作的一个案例。

在Gear VR上,应用和游戏很难找到,因为太多的应用位于其中。大声地说出一个应用名称,成为寻找特定应用的一个可行的替代方案。

△使用Facebook的Oculus Rift虚拟现实头盔时看到的Oculus Voice用户界面

Facebook的产品经理Merlyn Deng表示,Oculus Rift与游戏,可能是我们可以做的。

Philip在2015年加入Facebook之前,在亚马逊Alexa工作,他说非英文单词的标注是“很典型”的。

Facebook必须确保三星智能手机Gear VR(三星推出的一款vr头盔)会响应“Hey Oculus”。与Oculus Rift头盔不同的是,Gear VR只是由手机提供支持,后台没有强大的计算机系统。

Philip说:“目前只能处理到这种程度,但是会越来越好。” 苹果和谷歌已经找到了将语音激活压缩到手机中的方法,现在Facebook已经跟上了脚步。

在第四季度在Oculus发布了语音识别时,仅在美式英语中可运行,但是该团队增加了对更多英语方言的支持。

“我们希望对人们的兴趣和内容建立深刻的语义理解。”

-Merlyn Deng,Facebook的产品经理

随着时间的推移,Facebook可以使Oculus语音识别技术离线运行。公司还可能最终支持英语以外的语言。

Merlyn说,“我们要对人们的兴趣和内容建立深刻的语义理解。”

如果分析Facebook的优势,你应该可以猜测其下一步可能怎么做。Facebook会分析你的兴趣,你朋友的兴趣以及这些关系链数据。Facebook拥有用户的图片,视频和文本内容,以及多年来人们在社交网络上分享的文章和其他内容。

Merlyn说:“其他语音助手可能会羡慕他们所掌握的数据,我们试图做的事情必须与我们的使命和数据一起紧密相连”。

如今,Facebook是全球最大的社交网络。你有想象过Facebook上,各种用户使用千万种语音来互动吗,这个愿景值得去追求。

来源:CNBC

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

相关搜索热词:战略,机器