30日間無料体験

この注文でお急ぎ便、お届け日時指定便を無料体験 Amazonプライム無料体験について

単行本（ソフトカバー）
￥3,740 (225pt)

￥3,740 税込

ポイント: 225pt (6%) 詳細はこちら

無料配送 5月22日水曜日にお届け
詳細を見る

または最も早いお届け日時指定便明日 8:00 - 12:00の間にお届け（1 時間 57 分以内にご注文の場合）
詳細を見る

お届け先を選択

在庫あり。在庫状況について

￥￥3,740 () 選択したオプションを含めます。最初の月の支払いと選択されたオプションが含まれています。詳細

出荷元

Amazon.co.jp

出荷元

Amazon.co.jp

販売元

Amazon.co.jp

販売元

Amazon.co.jp

支払い方法

お客様情報を保護しています

支払い方法

お客様情報を保護しています

Amazonはお客様のセキュリティとプライバシーの保護に全力で取り組んでいます。Amazonの支払いセキュリティシステムは、送信中にお客様の情報を暗号化します。お客様のクレジットカード情報を出品者と共有することはありません。また、お客様の情報を他者に販売することはありません。詳細はこちら

詳細はこちら

すべて見る

ギフトの設定

￥1,944 税込

【通常配送送料無料】【30日間返品保証有り】【お急ぎ便＆お届け日時指定便対応可】【適格請求書発行可能】書き込みありません。古本のため多少の使用感やスレ・キズ・傷みなどあることもございますが全体的に概ね良好な状態です。水濡れ防止梱包の上、迅速丁寧に発送させていただきます。【当社は適格請求書発行事業者です。ご注文後にご注文履歴から適格請求書をダウンロードしていただけます】≪30日間返品保証：商品状態に当商品コメントと相違する点があった場合は到着後30日間、返品・返金を承ります≫【通常配送の配送料は無料です】≪お届け日時指定便は、最短でご注文日の翌日以降からご都合の良い到着日時を指定してご注文頂けます≫【マケプレお急ぎ便は、速達扱いの配送方法で、発送翌日（北海道・沖縄県は発送翌々日）に到着するように発送し、最短でご注文日の翌日に到着します】≪お届け日時指定便とマケプレお急ぎ便は、時期による物量、天候状況、配送地域等によってはご利用頂けない場合がございます≫ 【通常配送送料無料】【30日間返品保証有り】【お急ぎ便＆お届け日時指定便対応可】【適格請求書発行可能】書き込みありません。古本のため多少の使用感やスレ・キズ・傷みなどあることもございますが全体的に概ね良好な状態です。水濡れ防止梱包の上、迅速丁寧に発送させていただきます。【当社は適格請求書発行事業者です。ご注文後にご注文履歴から適格請求書をダウンロードしていただけます】≪30日間返品保証：商品状態に当商品コメントと相違する点があった場合は到着後30日間、返品・返金を承ります≫【通常配送の配送料は無料です】≪お届け日時指定便は、最短でご注文日の翌日以降からご都合の良い到着日時を指定してご注文頂けます≫【マケプレお急ぎ便は、速達扱いの配送方法で、発送翌日（北海道・沖縄県は発送翌々日）に到着するように発送し、最短でご注文日の翌日に到着します】≪お届け日時指定便とマケプレお急ぎ便は、時期による物量、天候状況、配送地域等によってはご利用頂けない場合がございます≫ 一部を表示

無料配送 5月22日水曜日にお届け（22 時間 57 分以内にご注文の場合）
詳細を見る

お届け先を選択

残り1点ご注文はお早めに在庫状況について

￥￥3,740 () 選択したオプションを含めます。最初の月の支払いと選択されたオプションが含まれています。詳細

選択した拡張機能は、この出品者では利用できません。詳細

${cardName}は選択した出品者では利用できません

${maxQuantity}より大きい数量の場合は${cardName}は使用できません。

この商品は、ブックスドリーム参考書・専門書・医学書専門店【30日返品保証・お急ぎ便対応可・適格請求書発行可能】が販売、発送します。

Amazonの他の出品者

新品＆中古品 (82)件の出品：￥1,536 + ￥320 配送料

著者をフォロー

斎藤康毅

+ フォロー

この著者の他の本

画像はありません

選択したカラーの画像がありません。
カラー：

このビデオを見るには、次をダウンロード Flash Player

ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装単行本（ソフトカバー） – 2016/9/24

斎藤康毅 (著)

4.4 832個の評価

すべての形式と版を表示

{"desktop_buybox_group_1":[{"displayPrice":"￥3,740","priceAmount":3740.00,"currencySymbol":"￥","integerValue":"3,740","decimalSeparator":null,"fractionalValue":null,"symbolPosition":"left","hasSpace":false,"showFractionalPartIfEmpty":true,"offerListingId":"PrQ7Qtc96vaWNsA2QfC0TwPBK7ruk%2F6RZ%2F8Cii5lDXO%2FPLj%2FC39w95RULgXshGzu%2F9Itp79IvtqZ2OmyWlVS491%2FJM1PiS0LD%2BCeQ9UARMlUesOsNsroMelfnDNUGJZVfGLFL3Qx1nc%3D","locale":"ja-JP","buyingOptionType":"NEW","aapiBuyingOptionIndex":0}, {"displayPrice":"￥1,944","priceAmount":1944.00,"currencySymbol":"￥","integerValue":"1,944","decimalSeparator":null,"fractionalValue":null,"symbolPosition":"left","hasSpace":false,"showFractionalPartIfEmpty":true,"offerListingId":"PrQ7Qtc96vaWNsA2QfC0TwPBK7ruk%2F6RFdb1vNyPTz41XhC9%2BpaSG%2Fa5NdzQN7E4333sK2x5h3GG5gOg5mGAiXaa6SPKEdLvitGnzEouQVGDfoGOS0fFUhXC55Y36cdsKNiei5w9sNE9vVYqqwVOHz05IwLVwG5f9OeVyIC5so3UzOgcR5EHIA%3D%3D","locale":"ja-JP","buyingOptionType":"USED","aapiBuyingOptionIndex":1}]}

購入オプションとあわせ買い

ディープラーニングの本格的な入門書。外部のライブラリに頼らずに、Python 3によってゼロからディープラーニングを作ることで、ディープラーニングの原理を楽しく学びます。
ディープラーニングやニューラルネットワークの基礎だけでなく、誤差逆伝播法や畳み込みニューラルネットワークなども実装レベルで理解できます。
ハイパーパラメータの決め方や重みの初期値といった実践的なテクニック、Batch NormalizationやDropout、Adamといった最近のトレンド、自動運転や画像生成、強化学習などの応用例、さらには、なぜディープラーニングは優れているのか?なぜ層を深くすると認識精度がよくなるのか?といった“Why"に関する問題も取り上げます。

続きを読むもっと少なく読む

この商品に関する問題を報告する

本の長さ

320ページ
言語

日本語
出版社

オライリージャパン
発売日

2016/9/24
寸法

21 x 15 x 2 cm
ISBN-10

4873117585
ISBN-13

978-4873117584
すべての詳細を表示

よく一緒に購入されている商品

ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装

￥3,740

225ポイント(6%)

最短で5月22日水曜日のお届け予定です

在庫あり。

この商品は、Amazon.co.jpが販売および発送します。

+

￥3,960

238ポイント(6%)

最短で5月22日水曜日のお届け予定です

在庫あり。

この商品は、Amazon.co.jpが販売および発送します。

+

￥4,400

264ポイント(6%)

最短で5月22日水曜日のお届け予定です

在庫あり。

この商品は、Amazon.co.jpが販売および発送します。

総額:

当社の価格を見るには、これら商品をカートに追加してください。

ポイントの合計: pt

もう一度お試しください

詳細

追加されました

一緒に購入する商品を選択してください。

斎藤康毅
244
単行本（ソフトカバー）
68個の商品：￥2,120から
斎藤康毅
17
単行本（ソフトカバー）
12個の商品：￥3,960から
斎藤康毅
67
単行本（ソフトカバー）
29個の商品：￥3,019から
斎藤康毅
148
単行本（ソフトカバー）
46個の商品：￥2,800から
Andreas C. Muller
246
単行本（ソフトカバー）
73個の商品：￥886から
スキルアップAI株式会社小縣信也
100
単行本（ソフトカバー）
48個の商品：￥4,450から

商品の説明

出版社からのコメント

■本書「まえがき」より

本書は「ディープラーニング」についての本です。ディープラーニングを理解するために必要な知識を、初歩的なことから一つひとつ積み重ねながら説明していきます。ディープラーニングとは何なのか、どういう特徴があるのか、どういう原理で動作しているのか、といったことをできるだけやさしい言葉で説明します。ただし、技術の概要だけを説明するのではなく、一歩踏み込んでより深く理解してもらうことを目的としています。そこが本書の特徴のひとつです。

では、ディープラーニングについて、“より深く"理解するにはどうしたらよいでしょうか?筆者が考えるに、そのための最も良い方法は、実際に作ってみることです。実際に動くプログラムをゼロから作り、ソースコードを読みながら考える――そのような作業が、ディープラーニングを(さらに言えば、高度に見える何らかの技術を)正しく理解する上で重要だと筆者は信じて疑いません。ここで、「ゼロから」という言葉を用いましたが、それはできるだけ外部の既成品(ライブラリやツールなど)には頼らないということを意味します。つまり、本書が目標とすることは、中身の分からないブラックボックスは極力使わずに、自分が理解できる最低限の知識から出発し、最先端のディープラーニングを作り上げることなのです。そして、その作るという過程を通して、ディープラーニングについてより深く理解してもらいたいと思っています。

著者について

斎藤康毅(さいとうこうき):1984年長崎県対馬生まれ。東京工業大学工学部卒、東京大学大学院学際情報学府修士課程修了。現在、企業にて、コンピュータビジョンや機械学習に関する研究開発に従事。翻訳書に『実践 Python 3』『コンピュータシステムの理論と実装』『実践機械学習システム』(以上、オライリー・ジャパン)などがある。

登録情報

出版社 ‏ : ‎ オライリージャパン (2016/9/24)
発売日 ‏ : ‎ 2016/9/24
言語 ‏ : ‎ 日本語
単行本（ソフトカバー） ‏ : ‎ 320ページ
ISBN-10 ‏ : ‎ 4873117585
ISBN-13 ‏ : ‎ 978-4873117584
寸法 ‏ : ‎ 21 x 15 x 2 cm

Amazon 売れ筋ランキング: - 2,087位本 (本の売れ筋ランキングを見る)
- - 21位人工知能

カスタマーレビュー:
4.4 832個の評価

著者について

著者をフォローして、新作のアップデートや改善されたおすすめを入手してください。

斎藤康毅

Brief content visible, double tap to read full content.

Full content visible, double tap to read brief content.

1984年長崎県対馬市生まれ。東京工業大学卒、東京大学大学院修士課程修了。現在は、株式会社Preferred Networksにて人工知能に関する研究開発に従事。

2017年ITエンジニア本大賞（技術書部門大賞）、2019年ITエンジニア本大賞（審査員特別賞）受賞。

著書に『ゼロから作る Deep Learning』シリーズ、翻訳書に『コンピュータシステムの理論と実装』『実践機械学習システム』『実践 Python 3』（以上、オライリー・ジャパン）などがある。

カスタマーレビュー

5つのうち4.4つ

832グローバルレーティング

この商品をレビュー

カスタマーレビューを書く

レビューのソート基準

上位レビュー、対象国：日本

レビューのフィルタリング中に問題が発生しました。後でもう一度試してください。

Kyle

ディープラーニングの実装と学習過程を解説してくれる凄い著作

2016年10月24日に日本でレビュー済み

Amazonで購入

人の脳神経回路の仕組みを模したニューラルネットワークをどのように実装して、どのように学習させていくべきかを絵図数式、さらにはPython3による実装で解説してくれている。
コンピュータが一見曖昧で判定基準の定義が難しい事象(本書では主に文字認識)などを、どのようなプロセスを経て学習していくのかを本書を読めばイメージできるようになると思う。
高校数学程度の知識（主に、微分、行列、数列）くらいあれば内容を理解できるレベルに落とし込んでいてくれるのが素晴らしい。効率良い実装方法、理論などを、検証データによる事例も合わせて証明し、pythonの実装コードを記載してくれているという至れり尽くせりの内容。
現時点(2016年)で、関連する研究機関や業務、海外の論文を入手翻訳できる環境でないとなかなか知ることの出来ない手の内を、一般に向け執筆してくれた事に敬意を送りたい。ディープラーニングに興味を持つ足がかりになる一冊。

●本書のニューラルネットワークの実装の演習例「手書き数字データ（MNISTのデータセット）の分類の学習」（４章より抜粋、簡単な実装と処理手順まとめ）
ニューロンを全結合層、活性化関数、損失関数などで実装し、単純なニューラルネットワークを組む。
モデル例：
　入力層:W1(行784、列50) -> 出力層:W２(行50、列10) -> ソフトマックス:Y(10)
　※バイアスのノードは簡略化してレビュー説明するため省略している。
実行：バッチでなく１データ単位の場合：
０：ニューラルネットワーク内の入力層と出力層（W１、W２）の各ニューロン（行列の要素ごと）の持つパラメータ（重み）はランダム値で初期化
１：28*28ピクセルの手書き数字データ（MNISTのデータセット）をシリアライズして784個にわけ、対応する784個の入力層（W１）のニューロンに入力
２：入力層（W1)で入力値とニューロンの持つパラメータ（重み）が行列の積による計算がされ、計算された値全てに活性化関数による計算を行い、次の出力層にベクトルデータ（列単位で纏められ列数のベクトルとなる）が渡される。
３：出力層（W２）で、前の入力層から渡ってきたベクトルデータと各ニューロンのパラメータ（重み）による行列の積による計算を行う。その出力のベクトルデータ（列単位で纏められ列数のベクトルとなる）全てをソフトマックス関数（Y）で処理し１０個（数字０〜９それぞれの分類結果の確率）の出力がされる。その内いちばん出力が高いのが文字識別分類の答えである。
４：正解ラベル（教師データ）と比較して、識別精度のズレを損失関数で導き出し、それを各層（W１、W２）のニューロンが持つパラメータ（重み）の誤差（精度のズレ）として、それぞれパラメータ（重み）更新する。
５：学習の場合は、上記１〜４をある程度の学習データ数繰り返す。推論（分類）の場合はテストデータで上記１〜３を実施する。
（※上述のモデルで省いたが、W 1,W2での行列の積での計算の直後に、バイアスと呼ばれる「層ごとにもつ前の層からの値の影響を受けない定数」を加算する処理も含まれている。バイアス数は、次の層にわたす出力（当該層の列数ぶんある）に加算するため、その列数分持っている。実装上では初期値はゼロだが、学習時は損失関数を計算して上記工程４でバイアスの更新も行っている。）
　それだけでMNISTデータセット（手書き数字画像）を学習でき、精度の高い文字識別の分類ができるようになる。
従来のコードによる条件分岐などのアルゴリズムでの分類ではとても複雑になり実装も困難と言えるものが、単純なニューロンのネットワークの繋がりで簡単に実現できることに驚きである。
上記は、単純なニューラルネットワークだが、本書籍ではより画像識別に強いCNNかつある程度ディープなニューラルネットワークの実装まで紹介してくれる。

この一冊で、どういった問題には、どのような機械学習モデル（レイヤ、関数）を採用すれば良いかの概要はわかるようになる。

※３.３.２でニューラルネットワークの内積（行列の内積）の説明をしているが、説明内容は積（行列の積）である気がする。(レビュー対象が初版であるため、修正はされているかもしれない）
行列の積と内積は計算が違うので注意。
行列の内積：行と列の、x成分とy成分の積の和

以下、内容まとめメモ
---------------------------------------
1.Python入門

pythonインストール
基本的なデータ型
基本構文
Numpyライブラリ：算術計算
Matpolotlibライブラリ：グラフ出力

---------------------------------------
2.パーセプトロン

パーセプトロンはニューラルネットワークの起源。
複数の信号を入力(各重み比重あり)して、一つの信号を出力する。
入力と出力部分は、ニューロンと呼ばれる。
多層になるほど、ニューロン数が増える。
重みとバイアス値のみ変更して、AND, NAND, OR判定をする関数の作成。
パーセプトロンの限界：単層ではXORを再現できず。線形で示された領域しか表現できない。
多層パーセプトロンでXORゲートを実装できる。
加算器、基数変換も多層パーセプトロンで再現可能。
2層パーセプトロンがあればコンピュータも理論上実装可能。

---------------------------------------
3.ニューラルネットワーク

パーセプトロンで手動設定していた重みを自動で学習できるのがニューラルネットワーク。
入力層、中間層（隠れ層）、出力層からなる
活性化関数が新たに登場する。
活性化関数：主に入力信号の総和を出力信号に変換する。その際、どのように出力を活性化するかは種類によって異なる。
（非線形関数）
・シグモイド関数：滑らかな２次グラフS字曲線を描く0.0〜1.0の実数
・ステップ関数：0/1のみの出力
（正規化線形関数）)
・ReLU関数：0でない場合は、1.0までの実数を出力

ニューラルネットワークの層から次の層への複数ノードの計算は、行列の積と同じプロセス。（行列の積と内積の違い注意）
層同士の計算には手前の層の列数と、後続の層の行数の数を一致させる必要がある。（行列の積の計算のため）

ニューラルネットワークは、分類問題（クラス分類）、回帰問題（数値予測）に用いることができる。
　回帰問題：出力層に恒等関数が適切=入力データから連続的な数値の予測を行う
　分類問題：出力層にソフトマックス関数（分類クラス数だけ出力があり、出力の総和が１になる）いちばん高い出力のクラスが最も可能性の高い分類として選ぶ。ニューラルネットワークでは一般的に出力がいちばん高いニューロンに相当するクラスを認識結果にできるので、ソフトマックス関数を省略できる。

活性化関数に線形関数（ステップ関数など）を使うのはNG
理由は、層を深くする意味がなくなる。線形関数の層を重ねた計算は、1つの層でまとめて計算できてしまう

・mnistデータセットによる手書き数字画像の文字認識
訓練画像60000, テスト画像10000
28*28ピクセルの一枚の画像に一つの数字。各ピクセルは0~255の濃さの数値
正解数字のラベルデータ付き：one-hot表現
＞正解ラベルだけが１で他は０の表現。0-9の文字の分類で2が正解のone-hot表現は以下のデータ
　[0,0,1,0,0,0,0,0,0,0]

ニューラルネットワークの作成
入力層７８４個（28*28)
隠れ層２つ
　１つ目１００のニューロン
　２つ目５０のニューロン
出力層10個（0〜９）の１０クラス分類
実装では、sample_weight.pklをニューラルネットワークに読み込む
　学習済みの重みパラメータをpklにしたもの。
　pkl:実行中のオブジェクトファイルを保存する機能（python)

入力、ニューロンの数、出力の配列の対応
入力層:X(784) -> 隠れ層１:W1(行784*列50) -> 隠れ層2:W2(行50*列100) -> 出力層:W3(行100*列10) ->ソフトマックス:Y(10)
手前の層の列数と、後続の層の行数の数を一致させる必要がある。（行列の積のため）

これで手書き数字の文字識別分類ができる。
sample_weight.pklで各ニューロンに文字を正しく認識できる重みを与えてあるため、正しく推論できている。

---------------------------------------
4.ニューラルネットワークの学習

損失関数という指標により、その値が最も小さくなる重みパラメータを探すのが学習の目標。
与えられた題材データをそのままの生のデータでend to endで学習できるのがDEEP LEARNING。
・訓練データ（教師データ）：学習用
・テストデータ：汎用能力確認用（未知なデータに対する性能）
過学習：特定データセットだけに過度に対応してしまった状態。過学習は避けるべき。全体的は汎用能力がベスト。

・損失関数：導入の理由として、この損失関数を基準として、その値が最も小さくなる重みパラメータの値を探す。例えば分類問題において、正解ラベルと比較して、不正解であれば損失関数の値が±に大きく、正解であれば値が±に小さく出力される。各ニューロンでの損失関数の値は、ニューロン全体の最も小さな損失関数がある場所への勾配を示しており、その誤差で各ニューロンのパラメータ（重み）を更新して正しい学習をさせて誤差を最小限に目指す技術。
・認識精度を高くするパラメータを得たいのに、損失関数を加えたら２度手間になるのではないか、指標は認識精度でいいのではないか、という疑問の回答：「認識精度」では、精度の数値が連続しない（２次グラフで表示したときに関数の線が途切れてしまう。ステップ関数の挙動みたいなもの）。ニューラルネットワークでは、認識精度を指標にすると、パラメータの微分が、ほとんどの場所で０になってしまうので、損失関数の値がプラスにも、マイナスにも変化しなくなってしまうのでパラメータの更新ができなくなってしまう。認識精度はパラメータの微小な変化にさほど反応を示さず、反応があったとしても不連続にいきなり変化する（ステップ関数の挙動に近い）。そのため、微小は変化が抹殺されるため、損失関数の変化は意味をなさなくなってしまう。ステップ関数のような挙動ではニューラルネットワークの学習は行えない。損失関数ならば、パラメータの微小な変化にも反応して数値が連続的に変わる。ニューラルネットワークの各パラメータは、大きな値変化でのみ更新されるものではなく、微小な変化にも合わせて更新されそれらが各ニューロンのパラメータに影響が伝播していった状態の方が、学習精度がよくなる。
損失関数例：
　・２乘和誤差
　・交差エントロピー誤差

・勾配の見つけ方：
数値微分：
微分とはある瞬間の変化の量を表したもの。
１０分間に２キロ走った、では１分間では、１秒では、とどんどん時間を小さくすることで、ある瞬間の変化の量を得られる。
偏微分：複数の関数からによる微分。得られたものは勾配
ベクトルで２次元グラフに描画すると、羅針盤のようにある一点に向かって矢印が指し示される。その一点から遠くなる程ベクトルの矢印の大きさも大きくなる。
機械学習では、勾配が必ずしもいちばん低いところをさす訳でない。凹凸が非線形に入り組んでいる場合がある。あくまで、各地点で低くなる方向を指すのみであることに注意。
それらの求めた勾配から最小を撮るときのパラメータを探すのが「勾配法」
・勾配降下法：最小を探す
・勾配上昇法：最大を探す

特徴量：入力データから本質的なデータを的確に抽出できるように設計された変換器。特徴量はベクトルで表現
特徴量：SIFT,SURF,HOG
識別器：SVM,KNN
問題に応じて、適切な特徴量を使わないと、良い結果は得られない。
ニューラルネットワークは、特徴量も自動学習する。

学習率：ハイパーパラメータの一つ。ただのパラメータ（重み、バイアス）とは別物で、人の手で設定。
一般的には最適な値を人の手で試行錯誤が必要。

ニューラルネットワークの学習：確率的勾配下降法(SDG)
(1)ミニバッチ学習
ビッグデータなどの数百万、数千万のデータに対して損失関数を計算するのは現実的で無いので、一部のデータを無作為で抽出し、近似として利用する。
(2)勾配の算出
ミニバッチの損失関数を減らすために、各重みのパラメータの勾配を求める。
勾配は損失関数の値を最も減らす方向を示す。
(3)パラメータの更新
重みパラメータを勾配方向に微小量だけ更新する。
(4)上記(1)〜(3)を繰り返す。

実装：損失関数によるパラメータの更新は、学習率と勾配の積を、パラメータに加算する。層内のニューラルネットワーク全体のパラメータを更新するイメージ。
勾配が大きいほど更新される数値の幅が大きい。

エポック(epoch):全学習データを一回全部網羅した単位＝１エポック

機械学習で使用するデータセットは、訓練データとテストデータに分けて使用する。
訓練データはあくまで訓練用、実際の学習成果はテストデータで評価を行う。

・mnistの手書き数字画像データを実際に読み込んで学習し、パラメータ（重み）を更新して正しく推論ができるかの検証。（前章で使った、模範的な重みを持ったsample_weight.pklなしで正しく学習して推論できるか検証）
　画像データと、正解ラベルで学習。
　ミニバッチ学習によって、損失関数が徐々に減っていることを確認。
　訓練データで学習し、正解率もエポック数を繰り返すごとに上昇していることを確認。
　テストデータとの正解率を比較し、双方の正解率に乖離がなく、過学習になっていないことを確認。

---------------------------------------
5.誤差逆伝播法

損失関数の勾配は数値微分だと計算に時間がかかる。
効率よく行う方法として「誤差逆伝播法」を使用する。

誤差逆伝播ならば、単純な計算で微分を求められる。
計算グラフの逆伝播によって、各ノード（ニューロン）の微分を求めることができる。
解析的な計算方法の方が処理が軽い。

損失関数の誤差逆伝播では、損失関数との差分が逆方向に伝わる。＞学習における重要な性質。
正解ラベルと異なれば、損失関数による誤差は大きくなるので、その誤差を伝播してくことになる。
正解ラベルと一致すれば、損失関数による誤差は小さいので、誤差の伝播影響は少ない。

単純な、加算、乗算の逆伝播の説明から絵図を踏まえて入り、最終的にはReLU関数、Sigmoid関数、Affine、Softmax(出力用）の絵図説明、実装を紹介してくれている。

---------------------------------------
6.学習に関するテクニック

最適な重みパラメータ更新のテクニック:
SDGの欠点：強い勾配に反応しやすく、弱い勾配を検知しにくいため、強い勾配に振り回されがちな非効率な勾配探索経路になる。
欠点を補うアルゴリズムとして、Momentum,AdaGard,Adamによるパラメータ更新手法の紹介。

重みの初期値：
全て０にするのはよくない。誤差逆伝播法によって全ての重みが均一に更新されてしまうため。重みの対称的な構造を崩す、ランダムな初期値が必要。
初期値設定の技術：
・ReLU：「Heの初期値」が有効
・Sigmoid,Tanhなど：「Xavierの初期値」が有効
MNIST(手書き数字画像）のデータセットでは、XavierよりHeの方が学習が進む。（検証あり）

Batch Normalizationのアルゴリズム
活性関数の出力値の分布を適度な広がりを持つように調整する方法
・学習を早く進行できる
・初期値にそれほど依存しない
・過学習を抑制する。
層の例：
Affine -> batchnorm -> ReLu --> Affine -> batchnorm -> ReLu --> Affine ->softmax

過学習の対策：
・Weight decay
　過学習を抑制する手法。学習の過程において、重みパラメータで大きな値をとる事に対して、ペナルティを課す方法。
・Dropout
　ニューラルネットワークが複雑になるとWeight decayだけでは対応が困難になる場合の手法。ニューロンをランダムに消去しながら学習する手法。

ハイパーパラメータの検証：
ハイパーパラメータ：各層のニューロンの数やバッチサイズ、パラメータの更新の際の学習系数やWeight decayなどを指す。
テストデータを使って、ハイパーパラメータの評価を行ってはいけない。テストデータに対して過学習してしまうことを指す。
ハイパーパラメータは専用の確認データが必要。一般的には検証データとよぶ。
ハイパーパラメータの探索は、良い値が存在する範囲を徐々に絞りながら進めるのが良い方法。

---------------------------------------
7.畳み込みニューラルネットワーク

Convolutional Neural Network:CNN(畳み込みニューラルネットワーク)
画像処理、音声認識などで利用される。

新たなレイヤ
・「Convolutionレイヤ（畳み込み層）」
・「Poolingレイヤ（プーリング層）」

畳み込み層：
従来の全結合のニューラルネットワークでは画像データ（縦・横・チャンネル[R,G,Bなど]）の３次元のデータを平らな１次元なデータにする必要があった。
一方、畳み込み層では、入力データをそのまま３次元のデータとして受け取り、同じく３次元のデータとして次の層にデータを出力する。
畳み込み層の積和処理(縦横の空間サイズが圧縮される)による処理の流れを絵図、数式で紹介。
パディング（周囲幅を0値で埋める）、ストライド（フィルター適用する位置の間隔）を紹介。
最終的に３次元の畳み込み演算で複数フィルターを利用した処理までイメージできるよう紹介。

プーリング層：
縦横方向の空間を小さくする演算。
例：2*2の空間を要約するように１つの要素にする。
・学習するパラーメータはない
・チャンネル数はそのままにする
・微小な位置変化に対してロバスト（頑健）：入力データのズレを吸収

CNNで流れるデータは４次元配列。
例：(10,1,28,28)
高さ２８、横幅２８、１チャンネルのデータが１０個

・畳み込み層、プーリング層の実装、CNNの実装
MNISTデータセットで学習
畳み込み層第１層のフィルターを画像表示
学習前はランダム初期化されていたため疎なノイズ画像だったが、学習後は規則性を持った模様画像になっている。
画像ごとに縦方向のエッジに反応するものと、横方向のエッジに反応するものなどが、模様から判別できる。
層が深くなるにつれて、抽出される情報（強く反応するニューロン）は抽象化されていく。
層が深い場合の例：最初はエッジに反応し、続いてテクスチャ、そして複雑な物体のパーツに反応するように変化する。
モノを意味を理解するように、反応する対象が変化していっている。

実装：
CNNの畳み込み層は、データ枚数、チャンネル、高さ、幅の４次元データで扱う。そこにパディングやストライドのハイパーパラメータを引数として畳み込み処理を実装している。検証のMNISTのデータは、単純な全結合層の場合は画像データ(28*28)をシリアライズして入力していた（４章の実装）が、畳み込み層はデータ構造を維持できるため、元のMNISTのデータ(枚数、チャンネル数、高さ、幅)と、畳み込み層の行列の構造と一致しているので、そのまま読み込ませることができる。

---------------------------------------
8.ディープラーニング

層を深くしたディープなニューラルネットワーク。
・mnistによる画像識別分類するCNNの実装

mnist問題の性能が良いモデルのランキング上位はCNN
層が深くなくても性能が出る（畳み込み層２、全結合層２程度）
手書きの数字という単純な問題のため、ネットワークの表現力をそこまで高めなくても良い。

層を深くすることのメリット：
・パラメータ数が少なくなる。
例：5*5を1つに要約する２層の場合は２５個のパラメータが必要
　　5*5を3*3のフィルターで1つの要約にする３層の場合は、3*3の畳み込みを二回で済む
ので、3*3*2=18個のパラメータですむ。
　層が深くなるほど、パラメータ数を抑える恩恵が増える。＞より大きな入力を小さなパ
ラメータ数で扱える。
・学習データ数が少なくても効率的に学習できる。

認識精度を上げる的ニック：訓練画像を人工的に拡張水増し
・位置ずらし
・画面歪み
・回転
一般画像では、輝度の変更、拡大縮小も有効。

ディープラーニングの高速化：
・GPU利用
・複数台分散学習
・演算ビット削減：精度が低くても（ノイズが乗っても）ディープラーニングの出力結果は変わらない頑健性がある。

ディープラーニングの利用：
・物体検出
・セグメンテーション：画像に対してピクセルレベルで被写体の区分けクラス分類を行う
・画像キャプション：画像に説明文章を生成

ディープラーニングの未来：
・画像スタイル変換：写真をゴッホ調に変換など
・画像生成：まったく新しい画像の生成
・自動運転

---------------------------------------
付録A：Softmax-with-Los レイヤの計算グラフ

以上。

98人のお客様がこれが役に立ったと考えています

役に立った

mike

おかげでディープラーニングが理解できました

2023年7月9日に日本でレビュー済み

Amazonで購入

ITのベテランを自称するものですが、最近のAIのアプローチであるデープラーニングに苦手意識を持っていましたが本書のおかげで基本を理解できました。ちなみにこ本書のシリーズ（１−４巻）、いずれも良書でした。

2人のお客様がこれが役に立ったと考えています

役に立った

AmazonPowerlow

勉強になりました。

2024年2月26日に日本でレビュー済み

Amazonで購入

いろいろと勉強になりました。

2022年6月6日に日本でレビュー済み

Amazonで購入

シンプルにニューラルネットワークを構築してDLを学ぶというコンセプトが特徴で、数冊読んだDL入門書の中では分かりやすいと言える。
だが、コードを読んで理解できるかと言われると理解が難しく、実際に理解できるまでには何度も読み返さなければならない。
可読性が高いpythonをプログラミング言語として選択したメリットを実感できない、というのが率直な感想。
開き直って一切numpyを利用しないプログラム例も示してくれた方が、回帰問題や分類問題への応用も理解しやすいと思うのだが。

9人のお客様がこれが役に立ったと考えています

役に立った

いなさん

「AIの解説本」であり、プログラミングや数学の解説本ではない。

2023年3月30日に日本でレビュー済み

Amazonで購入

「プログラミング未経験、AI未経験、平均的な高校数学の知識」という条件で読みました。

プログラミングは基礎が身に付いている前提で話が進むので、Python未経験だと理解するのが難しいと思います。

数学面では微分や線形代数の考え方が登場しますが、これもある程度理解している前提で話が進みます。

本書の趣旨である「AIの理論」については非常に丁寧な解説がされており、時間をかけて向き合えば本質的な理解ができるようになっています。

「プログラミング」や「数学」の部分が経験者向けのレベルなので、自分は『Python1年生シリーズ』の本と、無料の「chainerチュートリアル」というサイトでその辺りの不足知識を補いました。

15人のお客様がこれが役に立ったと考えています

役に立った

green man

大満足

2023年3月29日に日本でレビュー済み

Amazonで購入

とても綺麗な状態で大満足です。

3人のお客様がこれが役に立ったと考えています

役に立った

亜

プログラミング初心者でも大まかに理解できる

2021年10月2日に日本でレビュー済み

Amazonで購入

最終的にAIを作成できるまで行ってみたいと願う
プログラミング初心者です。

他の本「AlPhaZero 人工知能プログラミング実践入門」を
理解することができなかったので，こちらの本から読み進めることにしました。

読み終わるまでには，ほぼ毎日少しずつ読み進めて11日掛かりました。

本の感想ですが，章を進む毎にステップアップしていくような
説明になっているため，初心者でも取り掛かりやすいと感じました。

事前にpythonの初歩のコードについて慣れておく必要がありますが，
２章パーセプトロン，３章ニューラルネットワークまでは，
数学が苦手な自分でも気持ちよく読み進めることができました。

４章ニューラルネットワークの学習
５章誤差逆伝搬法
６章学習に関するテクニック
が特に難しく，詳しく理解するには解説サイトとあわせて
読み進めない限り全く理解できないレベルでした。

とはいえ，大まかな流れを理解するには，
本を読み進める程度でも可能でした。

※自分は，４章だけしっかり勉強して
　５章と６章は流れを理解する程度に留めました。

７章の畳み込みネットワークは，
前章までの知識をもとに，ほぼ理解できました。

８章は，最新技術に関する只の説明だったので，
読み流しました。

読んだ結果として，少し基礎知識が付けられたと感じましたので，
理解できなかった本に再チャレンジしてみたいと思います。

2人のお客様がこれが役に立ったと考えています

役に立った

龍

分かりやすかったが情報が古い？、

2023年11月1日に日本でレビュー済み

Amazonで購入

ディープラーニングは分かりやすいけど情報が古め。(それでも基礎は分かるから良いと思う)

1人のお客様がこれが役に立ったと考えています

役に立った

	非会員	プライム会員
通常配送	¥410 - ¥450*	無料
お急ぎ便	¥510 - ¥550
お届け日時指定便	¥510 - ¥650

Amazon Advertising 商品の露出でお客様の関心と反応を引き出す	Audible（オーディブル）「聴く」読書会員なら聴き放題	アマゾンウェブサービス（AWS）クラウドコンピューティングサービス	Amazonアウトレット訳あり商品をお手頃価格で販売

Amazonビジネス（法人購買）請求書払い法人価格・数量割引	AmazonGlobal 65か国/地域以上への海外配送がより簡単に	Shopbop 世界中の厳選されたファッションアイテム

プライム無料体験をお試しいただけます

著者をフォロー

画像はありません