强化学习导论
latest
第二版前言
第一版前言
符号一览
第1章 简介
第一部分 表格解决方法
第二部分 近似解决方法
第三部分 深入研究
第14章 心理学
第15章 神经科学
第16章 应用及案例分析
第17章 前沿技术
参考文献
强化学习导论
Docs
»
第三部分 深入研究
Edit on GitHub
第三部分 深入研究
¶
本书的最后一部分超出了前两部分提出的标准强化学习思想的范畴。 该部分简要地介绍了它们与心理学和神经科学的关系、强化学习应用的一些案例,以及未来强化学习研究的一些前沿领域。
第14章 心理学
14.1 预测与控制
14.2 经典条件反射
第15章 神经科学
15.1 神经科学基础
15.2 收益信号、强化信号、价值和预测误差
15.3 收益预测误差假说
15.4 多巴胺
15.5 收益预测误差假说的实验支持
15.6 TD误差/多巴胺对应
15.7 神经“行动器-评判器”
15.8 行动器与评判器学习规则
15.9 享乐主义神经元
15.10 集体强化学习
15.11 大脑中的基于模型的算法
15.12 成瘾
15.13 本章小结
参考文献和历史评注
第16章 应用及案例分析
第17章 前沿技术
Read the Docs
v: latest
Versions
latest
stable
Downloads
pdf
html
epub
On Read the Docs
Project Home
Builds
Free document hosting provided by
Read the Docs
.