人工智能alphago学习算法叫什么?深度学习笔记深度学习
阿尔法狗(AlphaGo)是第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能程序。它主要的原理就是深度学习。
2016年3月,AlphaGo与围棋世界冠军、职业九段棋手李世石进行围棋人机大战,以4比1的总比分获胜;
2016年末2017年初,AlphaGo在中国棋类网站上以“大师”(Master)为注册帐号与中日韩数十位围棋高手进行快棋对决,连续60局无一败绩;
2017年5月,在中国乌镇围棋峰会上,AlphaGo与排名世界第一的世界围棋冠军柯洁对战,以3比0的总比分获胜。
柯杰对战AlphaGo
围棋界公认AlphaGo的棋力已经超过人类职业围棋顶尖水平,AlphaGo的胜利是人工智能历史上的一座里程碑。
早在1997年,IBM的国际象棋系统深蓝,击败了世界冠军卡斯帕罗夫时,采用的算法是通过暴力搜索的方式尝试更多的下棋方法从而战胜人类,其所依赖的更多是计算机的计算资源优势。
卡斯帕罗夫对战深蓝
在围棋上,深蓝的方式完全不适用。为了战胜人类围棋选手,AlphaGo需要更加智能且强大的算法。深度学习为其提供了可能。
AlphaGo主要包括三个组成部分:
蒙特卡洛搜索树(MonteCarlo tree search,MCTS)
估值网络(Value network)
策略网络(Policy notebook)
AlphaGo的一个大脑——策略网络,通过深度学习在当前给定棋盘条件下,预测下一步在哪里落子。通过大量对弈棋谱获取训练数据,该网络预测人类棋手下一步落子点的准确率可达57%以上(当年数据)并可以通过自己跟自己对弈的方式提高落子水平。
AlphaGo的另一个大脑——估值网络,判断在当前棋盘条件下黑子赢棋的概率。其使用的数据就是策略网络自己和自己对弈时产生的。
AlphaGo使用蒙特卡罗树算法,根据策略网络和估值网络对局势的评判结果来寻找最佳落子点。
基于以上深度学习的各种算法的有机结合,才让Alpha以悬殊的比分战胜人类选手。
人类选手压力山大
AlphaGo战胜人类世界冠军不是人际博弈的终点,相反,这只是一个开始,极大的促进了人工智能在当今社会的影响力。
有消息称,AlohaGo的开发团队又有了下一个目标,那就是大名鼎鼎的暴雪的星际争霸。结果如何,我们拭目以待。