MIT最新研究:AI可以为流媒体视频带来更好的播放体验

2017-08-16 15:42:19 来源:雷锋网 热度:
在网上看视频时,缓冲或色块问题时有发生,极其影响观看体验。现在,MIT计算机科学与人工智能实验室(CSAIL)利用神经网络算法,最大化地缓解了这种现象。将这种算法应用到YouTube或Netflix等网站之后,观众将会获得更好的体验。此外,这项技术还能应用于VR,缓解现有的网络带宽不够的问题。
 
Engadget上的一篇文章详述了CSAIL新的方法,雷锋网 AI科技评论将其编译如下。
 
缓冲和色块是流媒体视频播放中常常出现的问题。一旦出现这种情况,会影响观看体验,观众换台之后,又会影响广告商的收入。并且,这种情况还给流媒体服务带来了技术上的难点——很难设计出解决方案。
 
MIT 计算机科学与人工智能实验室(CSAIL)新发明的神经网络AI算法或许恰好能满足互联网所需的流畅流媒体服务。
 
 
上面播放的视频并不是以整段传输到电脑上的,那会占用太大的带宽。事实上,数据被分成小片段,然后按顺序传送。但是为了保证视频质量,像YouTube这样的网站是利用ABR(码率自适应)算法来确定视频播放的分辨率。ABR算法通常有两种模式:一种是测量网络传输数据的速率,另一种是保证视频开头有足够的缓冲区。
 
如果基于速率的算法失败了,系统会降低比特率以确保视频继续播放,这会导致色块问题。
 
另外,如果试图将视频快进太多,将会更加影响播放体验,这是因为基于缓冲的系统提前加载新的视频块和缓冲区时,不得不暂停播放。
 
这两种ABR模式本质上是解决同一问题的两面,他们都没有完全解决问题的能力。接下来就是人工智能的用武之地了。
 
实际上已经有了一些关于这个问题的研究。卡耐基梅隆大学的一个研究小组最近开发了一种叫做“模型预测控制”(MPC)的方案,试图预测网络环境如何随时间变化,并基于这个模型做出优化决策。然而,这个系统的问题在于,它只会基于模型自身做出优化决策,不适合那些突然或急剧发生流量变化的网络。
 
CSAIL的新方法被称为“Pensive”,它并不依赖模型,而是用机器学习来计算何时(以及何种情况下)在速率ABR和基于缓冲的ABR之间进行切换。和其他神经网络一样,Pensive使用奖励和惩罚来强化每次试验的结果。随着时间的推移,系统能够调整自己的行为,始终获得最高的奖励。有趣的是,由于可以调节奖励,我们可以调整系统,让它执行我们想要得到的行为。
 
 
麻省理工学院教授Mohammad Alizadeh在一份声明中说:“我们的系统很灵活,无论想要什么样的效果,都可以优化它来实现。甚至可以想象用户个性化自己的流媒体体验,这取决于他们是想要让缓冲优先还是让分辨率优先。”该团队对这个神经网络只进行了总长一个月的下载视频内容的训练,就已经能获得与MPC系统相同的分辨率,但减少了10%到30%的缓冲问题。
 
 
我们最终会看到这一技术被YouTube和Netflix等公司采用,但麻省理工学院的团队希望先将它应用于VR。Alizadeh说:“VR需要4k的分辨率,在使用时,码率很容易就达到每秒上千兆,而现在的网络根本无法支持。我们很高兴看到像Pensieve这样的系统能够为VR等这样的应用做些什么。这只是我们所做出的第一步。”
 

责任编辑:黄焱林

相关推荐

Kevin Smith:Bringing visual computing to life with Mali

DVBCN数字电视中文网讯,2012年6月19日(周二),由ARM主办的“第四届ARM数字家庭应用研讨会暨ARM中国合作伙伴峰会”在深圳举行。本次研讨会的主旨是“开放平台引导产业前行”。包括百视通、欢网科技、乐视等运营商以及厂商代表出席本次活动并作出主题演讲。会场座无虚席,超过200人参与了本次会议。本次DVBCN数字电视中文网作为活动的特邀媒体,全程参与了ARM以及其产业链合作伙伴的所有活动,为DVBCN读者发回现场报道。ARMMPD部门市场VPKevinSmith在会上做出了“Bringingvisualco