唐宇迪-强化学习课件及代码
1-1.强化学习简介.mp4
1-2.强化学习基本概念.mp4
1-3.马尔科夫决策过程.mp4
1-4.Bellman方程.mp4
1-5.值迭代求解.mp4
1-6.代码实战求解过程.mp4
1-7.Q-Learning基本原理.mp4
1-8.Q-Learning迭代计算实例.mp4
1-9.Q-Learning迭代效果.mp4
1-10.求解流程详解.mp4
2-1.Deep-Q-Network原理.mp4
2-2.Deep-Q-Learning网络细节.mp4
2-3,Deep Q-Learning网络参数配置.mp4
评论0