
挑战

监督学习无可替代

我们可以对机器进行端到端的训练,来完成特定的任务,feeding 原始的 inputs,就会自动给出 outputs。机器学习这个任务的过程是端到端的学习过程。通过这种方式机器,计算机能更好地了解这个世界。

经网络是非常大的,只有在非常强大的计算机上才可以运用,需要有 GPU 加以辅助。

在深度学习变得比较普遍之前,我们首先要确保这样的一些系统可以用于这些情况,比如一个例子是我们在 2009 年、2010 年在纽约大学合作的一个实验,可以看到它可以识别马路上的建筑、天空以及路上的车和人等等,这个在当时并没有被称为最好的系统。再过几年之后,越来越多人相信深度学习是可以奏效的,可以发挥作用的。



在这里大家可以看到这个系统可以识别电脑、酒杯、人、桌子,也可以数出来到底有多少,而且也可以识别出道路、汽车。如果五年之前问系统这些问题的话,我们当时可能认为需要 10-20 年时间才能达到今天呈现的效果。

这也是 Facebook 所做的一些研究,叫做 Detectron。大家可以下载上面的代码,它可以探测 200 多种不同的类别,这也是 Facebook 在 AI 方面的一些研究,我们不仅仅发布了一些论文,同时连代码也都发布出来了,这样的话世界各地都可以更好的熟知这种技术。


当然利用的这样的技术不仅仅可以进行识别图像,面部识别,也可以识别人的行动,也可以用来翻译,这是 Facebook 在加州所做的研究(FairSeq)。我们可以用这个系统进来行翻译的工作。


我刚才讲到每天都会有一些新的应用发布,而深度学习的广泛应用也进一步推动科学方面的研究。在接下来几年里深度学习会发生更大的革命。

接下来为大家举一个例子,这段视频表现出来的是一种加速过程,它可以训练车去进行驾驶,而且可以调整车轮的方向。这样可以让车自己去进行驾驶,而不需要有人去进行校正。


我们通过研究可以实现这样的一种编程,可以利用这样的系统或者培训系统,来完成某一个具体的任务。

这是几年前所开展的工作,是由 Facebook 和纽约大学一起合作做的项目。这个项目是训练模型,让它能够回答相关的问题。在自然语言处理过程中,也可以看到人工神经网络是动态的,在不断变化的。

这是另外一个例子,如果你要建立一个能够回答复杂问题的系统,比如说关于图像的复杂问题等。为了回答这个图片是不是有更多的立体形状,之后我们就会让系统来进行计算。比如说这里有多少是方形体,或者有多少颜色,最后告诉你具体的答案是什么。通过这么做我们可以建立起一个端到端的解答的途径,而且也允许你提出更多新的问题。根据你输入的数据不同,它会有所变化。
大家看到这里是我们最近开发所得到的一些深度学习最新的成就,之后我们来看一下关于 AI 有没有我们触及到的。

机器学习需要常识

有时候让机器学习很长时间才能玩游戏。所以在核心功能方面,现在确实还没有触及到。但这些机器是能做到的,只是我们还没有挖掘出来。我们也可以对机器本身进行更深入的训练,比如我们要让系统进行成千上万次的训练之后,它们才能够进行学习。

有些学习它是与力学相关的,但是在实际的生活当中不可能实时进行,所以我们只能够进行模拟,但它也需要我们进行很多的尝试才能够让机器学到。

婴儿们是怎么学习的呢?比如就像右下角这幅图向他们所展示的,六个月以下的婴儿可能不太了解物理运动,可当他们满了八个月之后,他们已经知道自由落体这个动作了。

所以像右下角的这个小女孩非常了不起,我的一位朋友她给我们展示了婴儿怎么学会一些概念,而且他们也能够了解一些最基本的物理原理,这是他们在生活中最初学到的一些概念,这是凭借人们常识获得的,婴儿们所学会的是就是一些常识。

另外我们向动物展示这样的情景,比如大家看一下这个大猩猩,它们在幼年的时候由培训员给它们进行展示一些东西,所以大猩猩面对这样的魔术会笑出来,而人们会把这当做世界最初的原型。

但我们希望机器能够建立一些样本,使得系统运行,最终机器就能进行一些预测,像人一样有效运行。我们有这样的监督或者学习就能够使得机器得到训练和规划,这是我们所需要建立的一个系统。

不管下次的变革出现在哪里,我觉得它们应该是自我监督或者无监督学习,而且在这样的变革当中也会出现一些常识性的学习。





关于技术监督的趋势很显然是不断的弱化,甚至监督会消失,这就会导致出现一些新理论的产生,比如新语言,或者是一些新的并行文本,我相信之后应该有多维度的可能性。可能会出现一些新框架,包括了一些动态影像。我们会和微软,和亚马逊会进行更多合作,我们也会不断进行开源。
