、非监督学习(unsupervised learning)。在围棋上说,监督学习就是给AI看人类棋谱,告诉他怎么样下好,非监督学习就是让他自己练,自己琢磨怎么样能赢。从谷歌当时发表的论文来看,是两种方式都采用了的。
但现在谷歌如果真的敢用没学过人类棋谱的,无疑是他们发现这种方式的水平已经足够高了,这个在技术上的意义是很大的。
因为现实世界的应用里,大量场景是无法做标签定义,无法做监督学习的,如果人工智能可以自学成才,那应用领域会大幅拓宽。
当然,由于AlphaGo团队要求相关技术细节赛前必须保密,目前还无法确认究竟会是什么版本的狗出现。
3. 团体赛5人联手是否会实力更强?
当然,比柯洁的三番棋意义更大的,是5人联手对付AlphaGo。
这个有点像段誉、虚竹、萧远山联手对付慕容博。单个人下不过,就一块上。单个人总会有误算,有昏招,有恐慌或错觉;5人联手,可以基本上避免任何低级错误,每一手都力求找到最完美的一手。
5个人是个很合适的数字,两三个人还可能有盲点,人太多可能人多嘴杂。这5个人,陈耀烨、时越、周睿羊、唐韦星、芈昱廷,都是当前世界棋坛最顶尖的棋手,都夺得过世界冠军,联合起来水平肯定要比柯洁、李世石都要高很多。
当然,也有人担心,5人联手会不会相互推诿,谁也不出力,谁也不承担责任,平庸,等死。
这个取决于5个人能否采用合理的民主集中制,有人出谋划策,有人最终拍板。当然,这个问题我们能想到,这5个人也想得到。
上周时,5名成员之一,时越接受采访时表示,他们5个人已经在一起训练过。想必如何配合也该达成了共识。当然时越也表示,想要赢棋很渺茫。
现代围棋由于基本都是单个人下(也有联棋比赛,那是一人下一步,不能商量),没有案例可以参照。可以举的一个例子,是当年如日中天的吴清源挑战不败的本因坊秀哉,本来那局吴清源已经取得优势,胜利在望,于是秀哉封盘,然后召集众弟子商讨,最后门下弟子前田陈尔想出了绝妙的白160,反败为胜。所以,高手联手应该还是能提高水平的。
不过这次的赛制有个很不合理的地方:柯洁和AlphaGo的比赛尚且有每方3小时,但5人联棋是每方2小时(之前李世石和AlphaGo也是每方2小时)。单个人下2小时尚嫌紧张,5个人商量,还只有2小时,根本就没有商量探讨的时间啊。
4. 配对赛的意义是最大的?
比5人联手意义更大的,是古力、连笑分别与AlphaGo配合下联棋。
说到底,人工智能还是机器,不是人类。人类不需要畏惧人工智能的发展,而是应该将其应用来提高自己。(那些人工智能进化出人类的思想情感的还只存在于科幻片中)
在AlphaGo横空出世后,那些棋谱都已经成为了棋手们争相研究的宝库。很多以前从未被考虑过的着法,现在开始进入棋手的视野,重新审视之前已认为是确定无误的棋理。在高手对弈时,经常可以看到采用狗流来下。相信在狗肆虐之后,人类棋手水平也会有一个层次的跃升。
正如柯洁有次采访时所说,“包括我,之前都把自己锁定在条条框框中,比如围甲二十多盘棋,几乎一半都是相同的开局套路。当时大家不知道其他招法好不好,先下出新手的人有可能吃亏,所以为了保持胜率,大家都用熟练的开局下法,来拼后半盘内功。现在AlphaGo把我们的思想打开了,是很大好处,大家都有自己的思想和作战方针,能聊的东西多了,棋比以前好看了。”
而这次的比赛,希望能看到古力和连笑能下出比之前更为精彩的棋局;而我们也可以看到,狗狗相争,到底会是矛更利,还是盾更坚。
最后,抛开所有的理性,还是衷心地祝愿,能像武侠片里那样出现奇迹,主角最终打败了反派BOSS,或者至少,赢下一盘。
附此前阿尔狗相关随笔,与此次比赛赛程:
往期精华链接
【星际随笔之九】曲率已驱动了头发——深度分析谷歌AlphaGo击败职业棋手
【星际随笔之12】快评谷歌围棋与李世石大战的规则披露
【星际随笔之16】一个低级失误提前了载入史册的日子——写在谷歌围棋首局战胜李世石之后
【星际随笔之17】信心被完全摧毁 我很同情,以及尊敬李世石——写在李世石输掉和AlphaGo的第二局后
【星际随笔之18】假如围棋界有黄健翔——写在李世石首次战胜AlphaGo后
【星际随笔43】再度回归的Master会带来什么新思考