Instagram新推两款AI过滤工具,没错!背后功臣就是Deep Text

2017-06-30 17:56:56 来源:雷锋网 热度:
6月30日消息 据外媒《连线》杂志报道,Instagram 本周四发布了两款新工具。一款为自动评论过滤器,另一款为垃圾消息过滤器。两款过滤工具的技术基础都采用了Facebook的人工智能系统。

  该公司表示,这两项工具可用来减少垃圾消息的数量,同时屏蔽内容和视频中的攻击性评论。

  自动评论过滤器自去年9月就一直存在,用户可以选择自动启动该程序。该程序可利用机器学习来识别可能引人反感的评论。如果在评论过滤器开启的情况下仍然出现攻击性评论,那么用户可以像以往一样直接向Instagram报告。Instagram表示,评论过滤器目前仅支持英语,不过未来将支持其他语言。

  另一方面,垃圾消息过滤器自去年10月上线以来就一直处于对外界保密的状态。而上线9月有余都未被用户发现,于 Instagram 而言已经说不准是好事还是坏事。目前该功能可以自动清除英语、西班牙语、葡萄牙语、阿拉伯语、法语、德语、俄语、日语和汉语共9种语言的垃圾消息。

  雷锋网了解到,Facebook于2012年以10亿美元收购了Instagram,并将其内部技术迁移至Facebook的数据中心。

  据报道,此次Instagram 发布的评论过滤器就是使用了Facebook 旗下AML实验室建立的“Deep Text”系统。在Facebook 上,其可以结合机器学习辅助器完成每日 40 亿次以上的翻译功能的处理。此外,该系统还能在一秒之内理解超过二十多种语言的数千封邮件的内容。

  如此前雷锋网报道的Facebook 在AI+广告中的应用和探索一文里,就详细的介绍了这一文本系统对 Feeds Ads的支持。

  去年6月,Deep Text上线。其一开始被定位为内部工具,用来帮助Facebook 工程师快速排序大量文本,创建分类规则。其后 Instagram 高管深入了解该系统之后,立即看到了机会——借其打击垃圾邮件。因为对于Instagram 的用户来说,垃圾邮件几乎是一个极其影响用户体验的烦恼。

  在决定使用该系统之后,Instagram 第一步就是聘请了一批人员对该平台进行评论,并将评论按照“垃圾邮件”和“非垃圾邮件”分类。事实上,这种工作,在社交媒体涉及的技术行业而言非常普遍。先利用人类来训练机器,让其执行单调甚至无聊的工作,如此反复,最终机器会慢慢变得聪明和智能。

  Instagram 相关负责人表示,最终通过不断地数据整合,有3/4的数据被送入 Deep Text。基于此,Instagram 的工程师可创建算法,并对垃圾邮件可进行正确的分类。

  在经历4个多月的不断测试和研究后,Instagram 团队在去年10月悄悄地上线了垃圾邮件过滤的功能。Instagram 的CEO Kevin Systrom对该功能的效果感到十分满意。他决定利用 Deep Text 来处理更复杂的问题——消除与Instagram 社区准则相悖的意见或评论。为此,Instagram 还公开发布了一个 1200字的长文,来解释其社区的精神。

  与垃圾邮件过滤功能的开发过程类似,这次Instagram 又聘请了一大批的人员,每天就重复干一件事——看评论,并确定该评论是否合适。然后将其分类是否涉及欺骗 or 种族主义 or 性骚扰等等。所有这些工作人员都必须会两种语言。经过一段集中的处理,这些人一共分析了大约200万条评论。

  同时,Instagram的员工率先在自己的手机上内测了该系统,以此协助公司调整算法。与垃圾邮件算法一样,该系统会基于文本语义来分析发帖的人和评论者(以及其发表的历史评论)之间的关系。通过一段时间对神经网络的训练和使用真实数据对模型的测试,Deep Text 已经可以探查到文本之间非常细微的语义差别。

  直至今日,Instagram 终于正式宣布两大工具的上线。

  当然,就目前这两大工具而言,仍然存在一些算法缺陷,如当被问及一些特定句子时,系统无法给出具体的回应。经过前文对 Instagram 这两个工具的开发过程的描述,我们也能看到 Instagram 的AI仍然依赖人类的力量,来训练机器学习系统。

  正如 Facebook欧洲、中东和非洲地区公共政策副总裁 Richard Allen 如是表述,Facebook“还需要很长一段时间,才能依靠机器学习和人工智能来处理评估仇视言论时的复杂性。”

责任编辑:黄焱林

相关推荐

Telairity H.264 编码技术为2010年世界杯全球高清/标清转播提供支持

DVBCN消息2010年7月7日电--Telairity卓越的H.264编码技术是为全球近十亿人观看2010年世界杯足球赛提供支持的“秘密要素”。整个亚洲、南太平洋以及世界杯主办国南非的观众都是依靠Telairity的H.264/AVC编码器来收看高清(HD)和标清(SD)比赛转播的。有了Telairity的H.264现代技术,世界各地的网络运营商和广播、卫星及有线电视公司可以更换掉旧的MPEG-2压缩系统,为客户提供更出色的视频质量并显著降低对带宽的依赖,从而大幅减少传输成本。泰国国营电信公司CATTelecomPublicCompanyLimited安装了Telairity高清和标清编码器

ST高清电视系统级芯片获Adobe AIR for TV认证

意法半导体(STMicroelectronics,简称ST)宣布,其先进的高清电视系统级芯片(SoC)平台取得了巨大进步,此项成果将意法半导体推向能够运行基于Adobe®AIR®的游戏和其它应用软件的下一代互联网电视技术的最前沿。意法半导体已成功移植AdobeAIR®2.5forTV软件至第三代先进互动高清机顶盒系统芯片平台,并通过Adobe产品认证。AdobeAIR软件是AdobeFlash平台的一个重要组件,原始设备制造商(OEM)、原始设计制造商(ODM)、服务开发人员以及应用开发人员能够在这个平台开发丰富的网络应用软件和游戏,专门为机顶盒和数字电视等嵌入式设备和

把面向数字家庭的Adobe Flash引进到MIPS-Based平台

TriplePlayIntegration销售副总裁MikeNottage什么是三重播放集成?TPI公司是一家致力于提供数字家庭视频平台解决方案的专业软件服务公司。TPI公司还是官方Adobe的“ScalingPartner”,为消费电子平台提供FlashPlayer10、AIR和舞台美术技术提供优化的端口。我们有25名具有专业的项目管理和质量保障经验的高级工程师团队,平均具有24年的工作经验.你们能够提供什么样的

Alan Tsai:移动终端GPU之趋势与迷思

DVBCN数字电视中文网讯(敖瑞),2012年6月15日(周五),由ARM主办的“跨界、变革、多赢——ARM移动智能终端研讨会暨应用开发者大会”在上海举行。本次约有20名厂商代表上台演讲;参会并参与展示会的厂商超过30家,均为ARM在各个领域的合作伙伴。ARM亚太市场开发经理AlanTsai做出了“移动终端GPU之趋势与迷思”的精彩演讲。Alan表示:在用户体验上来说,分辨率已经可以高达人眼都无法辨析的地步了。公允的说,业界对GPU的评判标准存在太多的分歧:从三角形的角度来看,涉及到生成率、裁切率等指标,不同类型的GPU产品根本没法比;从填充率的角度上