德扑人工智能“冷扑大师”首胜中国龙之队,李开复认为人类没有赢的可能

2017-04-07 13:39:23 来源:钛媒体 热度:

4月6日,德州扑克人机大战结束了首日的赛程,在昨日上午的比赛中,人工智能“冷扑大师”暂时领先14145记分牌。

该场“人机大战”由创新工场CEO暨创新工场人工智能工程院院长李开复博士发起, 邀请母校美国卡内基梅隆大学(Carnegie Mellon University)知名的Libratus扑克机器人主创团队访问中国,于海南进行一场“冷扑大师 VS 中国龙之队—人工智能和顶尖牌手巅峰表演赛”。
  
这也是亚洲首度举办的人工智能与真人对打的扑克赛事。

 
冷扑大师是基于卡内基梅隆大学(CMU)Tuomas Sandholm教授和博士生Noam Brown所开发的Libratus无限德州扑克人工智能系统。今年1月份曾在美国匹兹堡的比赛中,将四位职业选手挑落马下,赢走接近总数的筹码。
  
对战方“中国龙之队”则由2016年世界德州扑克大赛WSOP金手链冠军得主杜悦领军。战队成员中许朝军、张淮、童舟、朱亚希、王天建均为扑克玩家圈内熟知的顶级高手。其中,杜悦此前是人人网集团副总裁,曾在2016年的世界德州扑克大赛WSOP的无限注德州扑克赛事中获得冠军。
  
比赛于4月6日至10日举行,为期五天,总共要进行36000副手牌的比拼,获胜一方将获得200万元奖金。
  
首日上半场比赛结束后,有不少网友反映:冷扑大师并没有像AlphaGo对战人类棋手那样,呈现压倒性的优势。
  
对此,李开复回应道,冷扑大师几乎没有输的可能。因为冷扑大师能打败美国冠军,中国冠军虽然很强,但还是不如美国冠军强,所以理论上应该是没有机会的。目前优势不明显,和机器学习还没打开有关。
  
另外,从技术上分析,同围棋相比,扑克的游戏规则更像是在处理真实世界的问题。这是一种有关不确定性的游戏。玩家并不知道对手手中的牌,也不清楚会拿到什么牌,这个过程中同时掺杂着各式的诈和招数。
  
但Libratus背后并没有使用心理战的机制,它所依靠的仍然是大量的数学。Libratus也没有AlphaGo使用的深度学习技术,而是依赖于一种比较古典的线性规划,一种极其强调试错的方法。
  
举例来说,AlphaGo是通过分析人类玩家的3000万棋谱来学习的,Libratus却是从零开始,通过自己跟自己玩大量的游戏进行学习。Libratus还利用了博弈论,通过平衡风险与收益来决定自己的下一步。
  
Liberatus使用了美国匹兹堡的超级计算中心来完成比赛,每做出一个决策大概需要5到10秒钟。如同人类选手在每场比赛后会聚在一起商讨后续的计划,每个夜晚,Libratus 也会使用这台超级计算机优化策略。
  
关于Libratus的商业计划,卡内基梅隆大学计算机学院院长Andrew Moore表示,他自己最喜欢的商业应用是在企业交易或者是企业谈判领域,货物的供需或者货物的交易,可以用这种AI驱动的商业谈判算法来进行,人们甚至可以通过AI去摸清谈判对象的底线和谈判逻辑。
  
李开复也表示,当前BAT的AI应用,主要是以用户为主,但人工智能最大的应用,应该是在企业层面,比如帮保险公司做到更好的收益和平衡,帮银行做更好的理财或者是财产配置,帮券商做投资或者智能投顾,帮医生看片子比人看的更准等等,这些机会特别大。

责任编辑:汪景

相关推荐

李开复详述未来发展趋势:不接受AI的公司将被颠覆

近日,创新工场董事长兼首席执行官李开复在中泰证券资本市场年会上发表了演讲。李开复表示,人工智能、文化娱乐、在线教育B2B和消费升级是未来投资趋势。李开复特别指出,互联网的革命才刚刚开始,它将改变的是彻底改造所有人类的习惯和行业。未来改造会是一个非常彻底的、非常血腥的。那些不能接受互联网+、AI+概念的公司,他们就会被颠覆。他认为未来哪