機械学習スタートアップシリーズ Pythonで学ぶ強化学習 [改訂第2版] 入門から実践までの表紙

機械学習スタートアップシリーズ Pythonで学ぶ強化学習 [改訂第2版] 入門から実践まで

久保 隆宏

出版日: 2019/9/22

出版社: 講談社

ページ数: 304ページ

最終更新: 2024年12月8日

人気スコア: 80

どんな本?

「Pythonで強化学習が実装できる!」と好評の入門書改訂版。Pythonプログラミングの基礎から、強化学習の概念、そして実践的なアルゴリズムまでをゼロから丁寧に解説します。Policy GradientやA2Cなどの主要な解法について、記述や実装を見直しており、より理解しやすくなりました。本書の強みは、環境構築から始めて、Markov Decision Process、動的計画法、モンテカルロ法、強化学習にニューラルネットワークを適用するDQNやPolicy Gradient、そしてAdvantage Actor Critic (A2C)といった最先端の手法まで、段階的に学べる点です。さらに、強化学習が抱えるサンプル効率の悪さ、局所最適解への陥りやすさ、再現性の低さといった弱点と、それらを克服するためのモデルベース手法との併用、表現学習、進化戦略、模倣学習、逆強化学習まで踏み込んで解説。これにより、学んだ知識を実務での行動最適化や学習最適化に活用する道筋が見えます。コードも公開されているため、すぐに実践できるのも大きなメリットです。

この本に言及している記事

Z

AI系の研究のために読んだ本メモ

by T_Tsei on Zenn 2024年12月8日
"強化学習の基礎が約30ページに凝縮されており、非常に分かりやすい入門書です。深層強化学習の内容も含まれており、最新の研究動向を追うためにも役立ちます。前半の基礎部分だけでも購入する価値があり、強化学習の初学者や、より体系的に学びたい研究者におすすめです。"