ゼロから作るDeep Learning〈4〉強化学習編

著者:斎藤 康毅【著】
出版社:オライリー・ジャパン

商品説明

内容説明

人気シリーズの第4弾。今回のテーマは強化学習です。実際のコードを提示し動かしながら学ぶという本シリーズのスタイルを踏襲し、外部ライブラリに頼らず、強化学習を支える基本的な技術やアイデアをゼロから実装しながら学びます。本書では読者が強化学習独特の理論を確実にマスターできるように、強化学習という難解なテーマの構成要素の一つひとつを「理論」と「実践」の双方から丁寧に解説します。数式だけで説明する理論書とは異なり、読者はコードを通してハッとする気づきを数多く得られるでしょう。



目次

1章 バンディット問題
2章 マルコフ決定過程
3章 ベルマン方程式
4章 動的計画法
5章 モンテカルロ法
6章 TD法
7章 ニューラルネットワークとQ学習
8章 DQN
9章 方策勾配法
10章 さらに先へ
付録



著者等紹介

斎藤康毅[サイトウコウキ]
1984年長崎県対馬生まれ。東京工業大学工学部卒、東京大学大学院学際情報学府修士課程修了。現在、企業にて人工知能に関する研究開発に従事(本データはこの書籍が刊行された当時に掲載されていたものです)



出版社内容情報

超人気シリーズの第4弾−−今回のテーマは強化学習!
人気シリーズの第4弾。今回のテーマは強化学習です。実際のコードを提示し動かしながら学ぶという本シリーズのスタイルを踏襲し、外部ライブラリに頼らず、強化学習を支える基本的な技術やアイデアをゼロから実装しながら学びます。本書では読者が強化学習独特の理論を確実にマスターできるように、強化学習という難解なテーマの構成要素の一つひとつを「理論」と「実践」の双方から丁寧に解説します。数式だけで説明する理論書とは異なり、読者はコードを通してハッとする気づきを数多く得られるでしょう。




【ご確認ください】

ご注文確定時に在庫切れの場合もございます。
 ご注文時の在庫先によっては4日以上(〜7日)かかる場合もございます。 当ストアではお取り寄せのご対応を行っておりません。

ご予約品と既刊商品カート・ご注文番号が分かれます
 ひとつのご注文番号におまとめすることはできません。
 ※ご予約品のうち、発売日が同じ商品のみひとつのカート・ご注文番号でご注文可能です。
 ※送料はご注文番号ごとに計算されます。

■ギフトなどのためにお届け先を別住所に登録されましても、金額入りの明細書は商品に同梱されます。当ストアでは一切のギフト対応を行っておりません。

■ご注文・お問い合わせの前に「お買い物ガイド」「ご注意点」をよくお読みください。

■お届け日のご指定は承っておりません。

■「帯」はお付けできない場合がございます。