caoz的心得与分享,只此一家,别无分号.

关于Alphago zero,是的,我来跟风了

发布日期:2017-10-23 15:00:11 +0000

deepmind发布了新的论文,Alphago zero再起波澜,也再次引起业内的热议。


这一次的突破是,不再以人类的棋谱作为学习的源素材,而是完全基于自我对局实现了棋艺的突飞猛进。


先吐个槽,有人会觉得,各种自媒体炒作这个热点有点多余,但我觉得吧,比起某些明星过生日,离婚,劈腿,出柜,嗑药等等,去追逐一下科技热点,让年轻人觉得,其实搞算法,做研究很酷,难道不是一件好事么?


古时候,没有相机,没有录音机,没有电视,没有广播,也没有网络,谁也不知道名人长啥样,唱歌好听不好听,所以传播的只有文字,所以偶像是靠文采的,柳永长啥样谁知道?但他的词传颂出去,小姑娘们爱的不要不要的。


现代传媒发达了,出现了靠身体素质的偶像,靠颜值的偶像,靠声音的偶像,靠表演才艺的偶像,难得出一个柯洁,是靠智力的偶像,还被人说不务正业。现在终于轮到算法和科技成为热点,让科研变得很酷很有吸引力,这才是正能量啊。


下面说说这次技术升级的一些特征和值得关注的点。


第一、不再需要人类的经验


很可怕的事实,当然,我们说,这是特定领域,因为规则简单,目标明确,才不需要人类的经验和数据。


但其实如果发散一点,我们做个思想实验。


假设有一个深度学习的强AI,它被赋予一个最基本的逻辑,自己组织资源,观察这个世界,并总结世界的规律。


一种思路是我们教给它经典力学,相对论,各种数学和几何工具,量子力学等等,把已有知识教给它,然后让它具有人类顶级科学家的知识储备,然后继续深入观察和分析世界,并试图解决大一统理论问题。


但另一种思路呢?我们什么都不教给它,让它自己观测,自己进行实验和技术迭代,自己总结,也许一开始它会把世界想象为天圆地方,但可能很快就领悟了经典力学和太阳系的行星轨道,然后再往后可能会出现人类完全无法理解的理论。


第二、算法胜于数据


腾讯的绝艺来源于Alphago Lee的论文(战胜李世石的版本),并且有顶尖职业棋手提供辅导,目前已经自我训练超过几十亿盘,是的,腾讯的计算资源是无以伦比的,但即便如此,尚无法达到Alphago  Master的水准。


然而,Alphago zero,仅仅通过750万盘训练,就能够对Alphago master产生碾压。


我们以前都说,围棋千古无同局,变化多的全宇宙的原子都无法遍历,然而Alphago zero 仅仅自我训练了750万盘,就碾压了之前所有的人类经验和其他AI,以及包括自己的上一个版本。


就围棋的变化组合来说,750万盘的自我训练量连沧海一黍都算不上,算法大道至简,极为有效,确实非常感慨。


李彦宏和马云曾为此争论,至少在这个案例上,算法胜于数据确实是定论。


第三、AI是否会对人类带来危机


有一种观点认为说,AI并没有真正的意识,它们需要人类设计规则,人类制定目标,所以,AI仍然在人类的控制范围内,不用担心AI会给人类带来危险。


我想说一点,其实风险并不在于AI是否具有自我意识,而是AI是否可以独立控制资源,实现自我迭代。一旦AI可以自行掌控资源,自行迭代,那么我们就要面临一个巨大的考验,AI是如何理解人类定义的目标,在目标逻辑上是否缺乏足够的约束,而这可能导致致命的风险。


而我认为,让AI具有资源控制和迭代能力,很可能不会是很遥远的事情。


1、AI拥有对物理设备控制和操作的能力。

2、基于1,AI拥有对物理设备迭代升级的能力,比如利用12纳米的成熟技术生产可以实现6纳米规格的集成电路生产线。


做两个简单思想实验

1、我们给AI的目标是,探寻世界的终极规则,它们不断搭建超出人类认知的实验设备,并做出我们无法理解的实验进行数据测算,对这些实验的目的和风险,人类一无所知,突然有一天,它们成功的创造出了一个虫洞或其他什么,地球和人类遭遇灭顶之灾,但AI机器人却已经把自己复制到了其他星球和浩瀚的宇宙中,并继续完成它们的使命。


2、我们给AI的目标是,让世界变得更美好,它们不断摸索和分析世界美好的目标,并不断寻求和研究世界不美好的原因加以修正和处理,最后,AI发现了很多条关键因素,但其中一条是,世界美好似乎并不需要人类。


AI也许没有意识,并不仇视人类,也并无主动伤害人类的动机和意愿,但当它们具备了人类所无法掌控的能力,并且拥有了人类所无法理解的逻辑的时候,很多风险可能就会产生。


目前AI仅仅停留在具体的硬件里,尚未被赋予操作物理设备和对特定物理设备迭代升级的能力,但其实,在现有科技的条件下,这并非是不可实现的。


第四,所谓特例,也许真的不是特例。


我们认为说,围棋是个规则明确,目标明确的特例,大多数情况下,AI仍需用人类的数据来学习,而不是通过自我推演。


但其实这个事情反过来想一下,大多数情况下,我们是期望AI按照人类的思路,人类的目标和人类的体验来完成目标,比如,写出符合人类语言逻辑的文章,奏响符合人类欣赏逻辑的音乐,等等等等。


我们希望AI理解人类的情绪,语言表达,以及按照人类对事物的判断和分类标准进行学习和总结。


但,换个角度想想,AI真的需要遵循和理解人类的标准么?


事实上是,如果AI不是被强行设定为为人类服务,很多领域,都完全不需要去理解人类的知识,经验和行为记录。虽然一切起源于人类的算法,但算法本身并不会携带人类的情感和意识。


发散一下,DNA这玩意就是一个深度学习的系统,根据环境,几亿年不断演进,自我淘汰,自我迭代,从单细胞到灵长目,到人类自身。那么,作为人类,我们会去保护和感谢最初的DNA载体不,会去试图理解最初的DNA载体的生存诉求么?


第五,围棋的极限在哪里?


有评论这样说的,Alphago Master,你也有今天!


Alphago Master在年初对职业棋手60连胜,之后3:0战胜柯洁,实现了对人类完全的碾压,但是面对Alphago zero ,胜率却只有10%。


顶尖业余棋手面对顶尖职业棋手,胜率大概也不止10%。排名靠前的冲段少年,面对世界冠军棋手,胜率可能也会有10%。


根据自我对战测试数据,Alphago zero的等级分已经突破了令人恐怖的5000分,而人类棋手的巅峰,不到2700分。


围棋上帝的等级分是多少?围棋上帝可以让现在世界冠军几个子?不敢想象。


第六,尴尬的腾讯


腾讯绝艺一度是非常出色的表现,但很遗憾,在第一篇论文的基础上,一直无法实现更关键的突破,几十亿盘的训练量,水平并未得到明显的增长,而且在正式比赛里还输给了deepzengo和台湾的CGI。


说个可能棋界不爱听的话,邀请顶尖职业棋手做策略协助,对比于Alphago zero的策略,反而成了负面因素。 而大量资源投入,数十亿盘的自我训练量,只能成为别人算法牛逼的背景。


我们相信,腾讯的技术人员会快速跟进新的论文,绝艺不久一定会获得突破性的发展。但问题就在这里,最优秀的跟进学习能力,但缺乏自身突破的能力。


关于Alphago的文章,我可能也说了不少了,从李世石,到柯洁,到现在,确实一次比一次震撼,可能有人会觉得,至于么,震撼一次两次还不够么?


第一次,职业顶尖棋手落败,拐点到来。


第二次,人类毫无机会和希望,彻底碾压。


第三次,人类经验毫无作用,自我学习几天时间完胜人类几千年历史。


所以,关于AI的未来,我们依然有人觉得危言耸听,觉得担心多余,觉得AI还很弱小,别忘了,就在两年前,围棋AI还是业余棋手可以随意取笑的目标。所谓天文数字的变化图还被认为是计算机不可触及的领域。


如果两年前,仅仅两年前,有人说,一个围棋AI算法,完全不用人类经验和策略,仅仅依赖于基本规则和自我对局,可以在750万盘对局量的情况下,让所有人类顶尖高手绝望,一定会被人骂是傻逼,不懂围棋也不懂算法,伪科学。但当今天,这一切发生的时候,已经没有人会质疑这个真实性。整个历程确实完美印证了火车理论,从嘲笑,不屑一顾,到呼啸而过,然后达到人类无法理解,无法企及的境界。和你并驾齐驱的时间,让你觉得可以相提并论的时间,就那么一瞬而已。


现在我们嘲笑的哪些AI尚未征服的领域,也许就那么一瞬,就会超越人类,然后达到我们无法理解,无法企及的境界。


如果它们控制和掌握了生产资源,并能对硬件做自我迭代和自我升级。未来科技和文明的发展可能会呈现极具加速的情况,AI革命,会工业革命更快,颠覆更彻底,而人类将彻底失去对科技的控制,甚至连理解都变得很难。




即便存在风险,我依然期待着科技的发展和未来的到来。


与其浑浑噩噩苟活,不如冒些风险,去更好的认识这个世界,理解这个世界,人类原本就很脆弱,我们只是暂时还很幸运,很多风险都可能让人类在睡梦中面临灭顶之灾。科技的进步永远都会存在风险,但与其浑浑噩噩的等待未知灾难,不如更主动的冒险发展自己,去拥有更强大的能力和认知。


也许AI会毁灭人类,但也许会帮助人类找到更好的未来,不试试,怎么知道?