商品紹介
理論は裏切らない! ・強化学習で必要になる数理を広くカバーした。・一貫したていねいな解説なので、じっくり読める。付録・参考文献も充実!・ベルマン方程式、TD学習、方策勾配、POMDP、深層強化学習をより深く!/【おもな内容】 第1章 準備 1.1 強化学習とは 1.2 マルコフ決定過程と逐次的意思決定問題 1.3 方策 1.4 逐次的意思決定問題の定式化 第2章 プランニング 2.1 準備 2.2 動的計画法 2.3 動的計画法による解法 2.4 線形計画法による解法 第3章 探索と活用のトレードオフ 3.1 概要 3.2 探索と活用のトレードオフ 3.3 方策モデル 第4章 モデルフリー型の強化学習 4.1 データにもとづく意思決定 4.2 価値関数の推定 4.3 方策と行動価値関数の学習 4.4 収束性 4.5 アクター・クリティック法 第5章 モデルベース型の強化学習 5.1 問題設定の整理 5.2 環境推定 5.3 ブラックボックス生成モデルに対するプランニング 5.4 オンラインのモデルベース型強化学習 第6章 関数近似を用いた強化学習 6.1 概要 6.2 価値関数の関数近似 6.3 方策の関数近似 第7章 部分観測マルコフ決定過程 7.1 部分観測マルコフ決定過程(POMDP)の基礎 7.2 POMDP のプランニング 7.3 POMDP の学習 第8章 最近の話題 8.1 分布強化学習 8.2 深層強化 学習付録A 補足A.1 証明 A.2 ノルム A.3 線形計画法 A.4 自然勾配法の補足
マイメニュー
何か良い本ないかな?
おトクに読める本は?
探してる本はあるかな?
- 詳細検索
- 著者別検索
- 出版社別検索
- 書籍トップ
- 書籍一覧
- ビジネス書・政治・経済
- 小説一般
- 推理・ミステリー小説
- 歴史・戦記・時代小説
- ライトノベル
- コンピュータ・IT
- ホラー・怪奇小説
- SF・ファンタジー小説
- アクション・ハードボイルド小説
- 経済・社会小説
- エッセイ
- ノンフィクション
- 恋愛小説
- ハーレクイン小説
- 英語・語学
- 教育・教養
- 辞書
- 旅行・アウトドア・スポーツ
- 料理・生活
- 趣味・雑学・エンタメ
- 詩歌・戯曲
- 絵本・児童書
- マルチメディア
- 写真集
- ボーイズラブ
- アダルト
- 雑誌トップ
- 雑誌一覧
- ビジネス・政治経済
- 総合週刊誌・月刊誌
- モノ・トレンド
- 男性誌
- 女性誌
- 自動車・乗り物
- コンピュータ・サイエンス
- スポーツ・アウトドア
- エンターテイメント・グラビア
- 暮らし・食・教育
- 趣味・芸術・旅行
- コミック雑誌
- NHKテキスト[語学]
- NHKテキスト[一般]
- 有料メルマガ
- 無料コンテンツ/カタログ
書籍を探す
コミックを探す
雑誌を探す
新聞を探す
リンク
ヘルプ