强化学习导论
latest
  • 第二版前言
  • 第一版前言
  • 符号一览
  • 第1章 简介
  • 第一部分 表格解决方法
  • 第二部分 近似解决方法
  • 第三部分 深入研究
    • 第14章 心理学
    • 第15章 神经科学
    • 第16章 应用及案例分析
    • 第17章 前沿技术
  • 参考文献
强化学习导论
  • Docs »
  • 第三部分 深入研究
  • Edit on GitHub

第三部分 深入研究¶

本书的最后一部分超出了前两部分提出的标准强化学习思想的范畴。 该部分简要地介绍了它们与心理学和神经科学的关系、强化学习应用的一些案例,以及未来强化学习研究的一些前沿领域。

  • 第14章 心理学
    • 14.1 预测与控制
    • 14.2 经典条件反射
  • 第15章 神经科学
    • 15.1 神经科学基础
    • 15.2 收益信号、强化信号、价值和预测误差
    • 15.3 收益预测误差假说
    • 15.4 多巴胺
    • 15.5 收益预测误差假说的实验支持
    • 15.6 TD误差/多巴胺对应
    • 15.7 神经“行动器-评判器”
    • 15.8 行动器与评判器学习规则
    • 15.9 享乐主义神经元
    • 15.10 集体强化学习
    • 15.11 大脑中的基于模型的算法
    • 15.12 成瘾
    • 15.13 本章小结
    • 参考文献和历史评注
  • 第16章 应用及案例分析
  • 第17章 前沿技术
Next Previous

© Copyright 2019, Richard S. Sutton,Andrew G. Barto Revision fef2b9bc.

Built with Sphinx using a theme provided by Read the Docs.
Read the Docs v: latest
Versions
latest
stable
Downloads
pdf
html
epub
On Read the Docs
Project Home
Builds

Free document hosting provided by Read the Docs.