本讲为第二篇“计算机是如何下棋的”最后一篇:总结。
AlphaGo Zero是如何实现从零学习、自学成才的?本讲介绍AlphaGo Zero的基本原理。
AlphaGo是如何通过左右手互博实现自我学习的?本讲介绍AlphaGo中用到的深度强化学习方法(下)。
AlphaGo是如何通过左右手互博实现自我学习的?本讲介绍AlphaGo中的深度强化学习方法。
本讲介绍AlphaGo的基本原理。
本讲继续介绍AlphaGo采用的蒙特卡洛树搜索方法
本讲介绍AlphaGo采用的蒙特卡洛树搜索方法。
本讲介绍国际象棋系统深蓝所采用的α-β剪枝算法。
本讲介绍计算机下棋的一个基本模型——极小极大模型。
本讲介绍为什么不可能用穷举的方法实现计算机下象棋、围棋。
清华大学计算机系马少平老师,面向人工智能初学者,用通俗易懂的语言,讲述人工智能的基础知识。