この注文でお急ぎ便、お届け日時指定便を無料体験
Amazonプライム無料体験について
¥6,600 税込
ポイント: 198pt  (3%)  詳細はこちら
無料配送4月6日 日曜日にお届け
詳細を見る
または 最も早い配送 明日 4月5日にお届け(13 時間 33 分以内にご注文の場合)
詳細を見る
残り15点(入荷予定あり) 在庫状況について
¥6,600 () 選択したオプションを含めます。 最初の月の支払いと選択されたオプションが含まれています。 詳細
価格
小計
¥6,600
小計
初期支払いの内訳
レジで表示される配送料、配送日、注文合計 (税込)。
出荷元
Amazon.co.jp
Amazon.co.jp
出荷元
Amazon.co.jp
支払い方法
お客様情報を保護しています
お客様情報を保護しています
Amazonはお客様のセキュリティとプライバシーの保護に全力で取り組んでいます。Amazonの支払いセキュリティシステムは、送信中にお客様の情報を暗号化します。お客様のクレジットカード情報を出品者と共有することはありません。また、お客様の情報を他者に販売することはありません。 詳細はこちら
Kindleアプリのロゴ画像

無料のKindleアプリをダウンロードして、スマートフォン、タブレット、またはコンピューターで今すぐKindle本を読むことができます。Kindleデバイスは必要ありません

ウェブ版Kindleなら、お使いのブラウザですぐにお読みいただけます。

携帯電話のカメラを使用する - 以下のコードをスキャンし、Kindleアプリをダウンロードしてください。

KindleアプリをダウンロードするためのQRコード

著者をフォローする

すべてを表示
何か問題が発生しました。後で再度リクエストしてください。

強化学習(第2版) 単行本(ソフトカバー) – 2022/11/1

5つ星のうち4.7 10個の評価

{"desktop_buybox_group_1":[{"displayPrice":"¥6,600","priceAmount":6600.00,"currencySymbol":"¥","integerValue":"6,600","decimalSeparator":null,"fractionalValue":null,"symbolPosition":"left","hasSpace":false,"showFractionalPartIfEmpty":true,"offerListingId":"s5XfVyCKuMw4z1xFusH67FHzPj9cvtqbRrCgEK%2Fh%2F3LWFY0UuM5IXI6HErwqBmiQ8kT0ymqk9H5Q4yVZgDjwy7h3uUtILlYOb6nlyMRplUS2Yu%2FIwrZtd01XhPdpOKylKtd%2FO%2FnC4lc%3D","locale":"ja-JP","buyingOptionType":"NEW","aapiBuyingOptionIndex":0}]}

購入オプションとあわせ買い

不朽の名著、待望の改訂版!

強化学習発展の立役者自らが書き下ろした書。「強化学習の考え方とアルゴリズムを明確に簡潔に説明する」という第1版の特長はそのままに、第2版では、発展的手法や心理学・神経科学との関係の紹介が大幅に加筆されています。第I部では、テーブル形式の範囲でできるだけ多くの強化学習を扱い、核となる考え方を単純な設定で進めます。第II部では、そうした考え方を関数近似に拡張します。第III部では、心理学・神経科学との関係、AlphaGoなどのケーススタディ、将来展望について述べています。
ますます重要性を増す強化学習について、基礎から応用までを学べる一冊です。

[原著]Reinforcement Learning, Second Edition: An Introduction (The MIT Press, 2018)***

「第1版は、強化学習の学習者には必読の教科書となっています。刊行から20年の時間が経ち、AlphaGoなどの新しい技術も出てきました。こうした新しい話題をカバーしながら、基礎からしっかりと説明がされているのが、この改訂版です。……強化学習の分野もまだまだこれから大きく発展していくと考えられますが、本書は、現時点で、この分野を学ぶための最もわかりやすく整理された教科書だと思います。」
――東京大学教授・松尾 豊(監訳者序文より)

◆‏ 電子版は森北出版Webサイトにて

【目次】
第1章 序
第I部 テーブル形式の解法
第2章 多腕バンディット問題
第3章 有限マルコフ決定過程
第4章 動的計画法
第5章 モンテカルロ法
第6章 TD学習
第7章 nステップ・ブートストラップ法
第8章 テーブル形式手法におけるプランニングと学習

第II部 近似による解法
第9章 近似を用いた方策オン型予測
第10章 関数近似を用いた方策オン型制御
第11章 近似を用いた方策オフ型手法
第12章 適格度トレース
第13章 方策勾配法

第III部 さらに深く
第14章 心理学
第15章 神経科学
第16章 応用と事例紹介
第17章 強化学習のこれから
最大10%ポイント還元:
紙書籍 まとめ買いキャンペーン

よく一緒に購入されている商品

対象商品: 強化学習(第2版)
¥6,600
最短で4月6日 日曜日のお届け予定です
残り15点(入荷予定あり)
この商品は、Amazon.co.jpが販売および発送します。
+
¥3,300
最短で4月6日 日曜日のお届け予定です
在庫あり。
この商品は、Amazon.co.jpが販売および発送します。
+
¥3,080
最短で4月6日 日曜日のお届け予定です
残り20点(入荷予定あり)
この商品は、Amazon.co.jpが販売および発送します。
総額: $00
当社の価格を見るには、これら商品をカートに追加してください。
ポイントの合計: pt
詳細
追加されました
これらの商品のうちのいくつかが他の商品より先に発送されます。
一緒に購入する商品を選択してください。

商品の説明

著者について

株式会社エウレカ

東京大学特任助教 博(工)

東京大学教授 博(工)

はこだて未来大学教授 工博

全脳アーキテクチャ・イニシアティブ 代表

登録情報

  • 出版社 ‏ : ‎ 森北出版 (2022/11/1)
  • 発売日 ‏ : ‎ 2022/11/1
  • 言語 ‏ : ‎ 日本語
  • 単行本(ソフトカバー) ‏ : ‎ 496ページ
  • ISBN-10 ‏ : ‎ 4627826621
  • ISBN-13 ‏ : ‎ 978-4627826625
  • 寸法 ‏ : ‎ 24.3 x 18.5 x 2.5 cm
  • カスタマーレビュー:
    5つ星のうち4.7 10個の評価

著者について

著者をフォローして、新作のアップデートや改善されたおすすめを入手してください。

カスタマーレビュー

星5つ中4.7つ
10グローバルレーティング

この商品をレビュー

他のお客様にも意見を伝えましょう

まだカスタマーレビューはありません

0のカスタマーレビューおよび10のカスタマー評価があります。