【AI世代编者按】人工智能的复杂度正在日益提升,而与人玩游戏则是一项技巧十足的任务。美国研究人员艾伦德·辛茨(Arend Hintze)阐述了人工智能和游戏的进化理论,以及未来的发展方向。
以下为原文内容:
1980年代,一位老师让我写一个能玩井字棋的电脑程序。可惜我没写出来。但就在几个星期前,我跟我的一个计算机专业的研究生解释了如何用所谓的“Minimax算法”解决井字棋问题,我们大约用了一个小时就把程序写完了。
我的编程能力这些年的确进步了,但计算机科学也有了长足发展。
几十年前看似无法实现的事情,今天却有可能变得非常容易。1997年,当IBM“深蓝”在6局对战中击败国际象棋大师加里·卡斯帕罗夫(Garry Kasparov)时,人们都感到惊讶不已。2015年,谷歌(微博)披露其DeepMind系统已经掌握了多款1980年代的视频游戏,包括自学《打砖块》游戏的取胜秘诀。2016年,谷歌的AlphaGo系统还在一场5局对战中击败了一位顶尖围棋选手。
关于计算机系统在各类游戏中击败人类选手的探索仍在继续。5月末,AlphaGo将在“中国乌镇围棋峰会”上挑战柯洁。随着计算能力的增强和技术水平的提升,电脑甚至能在那些我们原本认为需要依靠人类的直觉、智慧和狡诈才能胜出的游戏上战胜人类——例如扑克。
我最近看见一段排球运动员跟机器人控制的橡胶手臂对练扣杀的视频,这些手臂竟然能够拦截专业运动员的大力扣杀。由此可见,当机器想要取胜时,人类的抵抗将毫无用处。
这是好事:我们希望有完美的人工智能系统替我们开车,还希望有不知疲倦的系统从X光片上寻找癌症的迹象。但具体到玩游戏这件事情,我们还是不想输给机器。幸运的是,人工智能可以让游戏更加有趣,甚至有可能给我们带来无尽的快乐。
玩不腻的游戏
如今的游戏设计师看到一个问题:开发无敌的人工智能系统根本没有意义。如果毫无胜算,那就没人愿意玩。
但人们希望玩游戏时能获得沉浸、复杂且令人惊喜的体验。即便是当今最好的游戏,玩过一段时间之后也会觉得无聊。理想的游戏模式是主动适应玩家,并通过与之互动来保持游戏的趣味性,甚至让这种状态永远持续下去。
所以,当我们设计人工智能系统时,不能光看到深蓝和AlphaGo的胜利,还应该看到《魔兽世界》这种大型多人在线游戏的巨大成功。这些游戏的图形设计精美,但它们最大的吸引力还在于互动。
多数人对象棋和围棋这种极其复杂的逻辑游戏兴趣不大,而是希望与人联系,营造社区。这些MMO游戏面临的真正挑战并不是它们能否被人类智能或人工智能击败,而是如何让玩家每次玩游戏时都能有新鲜感。
改变模式
目前,游戏环境允许人们与其他玩家展开许多互动。地牢突击队的角色很容易确定:战士负责战斗,医生负责救治伤员,巫师负责远程施法。或者想想《传送门2》,这款多人游戏的重点是通过合作来解开一系列机关和谜题。
跟朋友一起玩这些游戏可以帮助你们形成共同记忆。但这些环境或底层情节的任何变化都必须由人类设计师和开发者来部署。
在现实世界中,各种变化都是自然发生的,不受监督,不是人为设计的,也不会受到人为干预。玩家需要学习,而生物需要适应。有的生物体甚至会共同进化,对彼此的发展作出反应。(武器技术的军备竞赛会出现类似的现象。)
当今的电脑游戏没有这么复杂。正因如此,我不认为开发能玩现代游戏的人工智能技术可以对人工智能研究形成有益的促进。
智能进化
值得一玩的游戏必须因为具有适应性而不可预测,还要因为玩游戏的过程而产生新奇感。未来的游戏需要进化。它们的角色不能仅仅做出反应,还要具备探索和合作能力,甚至要发现各种缺点。
达尔文进化论和学习是地球上一切新奇事物的形成动力,这同样可以成为促进虚拟环境变化的动力。
进化已经掌握了创造自然智能的方法。我们是不是也应该放弃把自己的思维方式植入到人工智能之中的尝试,转而直接推动人工智能实现进化?包括我的实验室和我同事克里斯多夫·阿达米(Christoph Adami)的实验室在内,有几家实验室正在从事所谓的“神经进化”(nero-evolution)研究。
我们在电脑中模拟复杂的环境,例如路网或生物生态系统。我们创造虚拟生物,并让它们模拟数十万代的进化过程。进化本身随后发展出最好的动力,或者成为最适应环境的生物——也就是那些生存至今的生物。
如今的AlphaGo已经开始了这一进程,它通过不断与自己对弈,以及分析顶尖棋手的比赛记录来自我学习。但它并不能像我们这样边下棋边学习,也不能进行无人监督的实验。它无法根据对手的不同来调整战略:对电脑来说,最好的棋就是最好的棋,无论对手的风格如何都不会改变。
通过自己的经验来学习是人工智能未来的发展方向。它们可以大幅增加游戏的趣味性,让机器人不仅能在现实世界中发挥作用,还能在忙碌中不断适应。(编译/长歌)
推荐:人工智能汹涌而来,未来已变!关注“AI世代”微信号(tencentAI),关注未来。
正文已结束,您可以按alt+4进行评论