「ニューラルネット」って、ぼくのデスクの引き出しと同じくらい複雑なんですよ。整理した方が早いんですけど。
凡田さんのデスク、先週まで3層、現在5層、レシート3年分が層構造の最下層 とのことですわ。
大蔵さん、なぜそんな詳細まで…
私が 昨日 経費精算の催促で目視確認 いたしましたから。

- ニューラルネットワークとは、ひとことで言えば 判断する部品(ニューロン)を何個も、何層にも繋げた装置。1個だけのパーセプトロン(#007)を大量に積み重ねたもの。
- なぜ重ねるか。1個だけでは単純な切り分けしかできないが、層を重ねるほど複雑な判断ができるようになる。GPT のような大規模 AI も、結局はこれを巨大にしただけ(層の数やしくみは本文で)。
- イメージは 組織の判断リレー。アナリストが下調べし、マネージャーがまとめ、パートナーが結論を出す——情報が層を通るたびに磨かれていく流れと同じ構造。
「AI 解説で必ず出てくる ニューラルネットワーク って何?」と聞かれて、一言で答えられるか。
正解は「パーセプトロン1個を、何個も、何層にも繋げただけ」だ。
パーセプトロンは「入力に重みを掛けて合計し、しきい値を超えたら発火する」という、ニューロン1個の最小モデル(1958年 Frank Rosenblatt 発)。詳細はパーセプトロン(#007)の記事へ。それを大量に積んだのがニューラルネットワーク。本記事は NN の構造を、(1) 層という概念、(2) なぜ 「深く」 するのか、(3) コンサル業務との接続 の3点で押さえる。
ニューラルネットワーク = ニューロンの 「層構造」
NN は、ニューロン(パーセプトロン)を 層(layer) という単位で並べる。
それぞれの役割:
- 入力層: 外部から来るデータ(画像のピクセル、トークンの埋め込みベクトル等)を受け取る
- 隠れ層: データを加工する中間処理。ここが何をしているかは人間には直感的に分かりにくい(=ブラックボックス)
- 出力層: 最終的な答えを出す(画像分類なら「犬 vs 猫」、LLM なら「次のトークンの確率分布」等)
各層には数十〜数万個のニューロンが並ぶ。隣の層との間で全結合(各ニューロンが、隣の層の全ニューロンと繋がる)が一般的。
GPT-3 のような LLM はこの仕組みを 96層 重ねている。1層あたり数万次元のベクトルが流れる。膨大な数の 「ニューロン同士の接続」 が処理の本体だ。
「深い」とは何か
「ディープラーニング(深層学習)」の 「ディープ」 は、隠れ層が複数あること を指す。
歴史的には:
- 1980年代までの NN: 隠れ層0〜1層(=浅い)
- 2010年代以降のディープラーニング: 隠れ層 10層〜100層〜
- 現代の LLM: 数十〜数百層
なぜ 「深い」 方が良いのか — それは次のセクションで。
なぜ 「深く」 するのか — 普遍近似定理と表現力
1層のパーセプトロンは XOR が解けない(線形分離可能な問題しか解けない、Minsky & Papert 1969年、詳細はパーセプトロン記事(#007))。これが第1次 AI ブームを終わらせた原因の一つ。
ところが層を増やすと、状況が劇的に変わる。
数学的な事実として:
隠れ層が1層でも、ニューロンを十分多く並べれば、どんな連続関数でも任意の精度で近似できる(普遍近似定理, Cybenko 1989)
つまり、理論上、十分大きな NN はどんな問題でも解ける。ということになっている。
ただし「理論上」と「実用上」は別の話。実用上は、ニューロンの数を増やすより、層を増やす方が効率的ということが経験的に分かっている:
- 1層に数百万ニューロン並べる → 学習が極めて難しい
- 100層に数千ニューロンずつ並べる → 同じ表現力で学習しやすい
これが「深さ」が現代AIの主役になった理由。深さ = 抽象化の段数、と捉えると直感的。
- 最初の層: ピクセルや文字の粗い特徴
- 中間の層: 線・形・単語の関係性
- 後ろの層: 物体・概念・意味
各層が前の層の出力をさらに抽象化していく。これが「階層的な特徴抽出」と呼ばれる現象。
NN は 「学習する」 装置
ここが重要。NN はただ繋いだだけでは動かない。学習(training) という段階が必要。
学習とは、ニューロン同士の接続の 「重み」 を、データを使って調整する プロセス。
未学習のNN: 重みはランダム → でたらめな出力
↓ 大量のデータで学習
学習済みNN: 重みが調整済み → 適切な出力
GPT-3 で言うと、1,750億個 の重みが、インターネット中のテキストデータで何ヶ月もかけて調整されている。1個1個の重みは小さな数字だが、合計で巨大な 「知識の固まり」 になる。
学習の中身は別記事(重み・訓練・損失関数・勾配降下・逆伝播)に譲るが、ここで覚えておきたいのは:
- NN の 「知性」 は、全部 重みの中に詰まっている
- 学習 = データを見て重みを更新する作業
- 学習後は重みを固定して、推論(=入力に対して答えを出す)に使う
つまり NN という箱の 「中身」(=重み) を、データで作り込んでいく のが機械学習。これが「ルールを人間が書く」古典AIとの根本的な違い。
コンサル業務にもう一歩寄せる
NN を「多段階のレポート連鎖システム」と思って業務に重ねる。
コンサル組織の構造を思い出してほしい:
[現場データ] → [アナリスト] → [マネージャー] → [パートナー] → [社長報告]
各層で:
- アナリスト: 生データから数字や事実を抽出
- マネージャー: 数字を意味のある要約に変換
- パートナー: 要約を経営判断に翻訳
- 社長: 最終的な意思決定
これが そのままニューラルネットワークの構造。各「層」が前の層の出力を加工して、より抽象的な情報に変える。最後に「結論」が出る。
| NN の概念 | コンサル組織で言うと |
|---|---|
| 入力層 | 現場データ・顧客インタビュー |
| 隠れ層 | アナリスト → マネージャー → パートナーの連鎖 |
| 出力層 | 社長/CEO 報告書の結論 |
| ニューロンの重み | 各役職の人の判断基準・経験値 |
| 学習 | プロジェクト経験で各人の判断が磨かれる |
| 多層化 | 階層を増やすほど抽象度が上がる |
コンサルが普段やっている「情報の階層的処理」が、機械の中で何百層も並列に走っているのが LLM、と理解すると違和感が消える。

あー…これ、まさにアイマイ社の組織図だ。俺がアナリスト時代に作ったExcelが、御託さんの口で要約されて、赤崎部長のパワポになって、最後 南雲社長が「で、儲かるんだろ?」って言って終わる。情報が層を通るたびに、原型を保たない。
フッ、それは凡田が要約の精度を理解していないからだ。私は 入力から出力までの情報損失を最小化する達人 で…
あら、御託さんが要約なさると、必ずニーチェかハラリかサンデルが出てくるので、入力にあった 「顧客の声」 が完全に消える こと、私 過去13年間で何度も拝見してますわよ。
…(視線を逸らす)
凡田くんの話を聞いてふと思ったんだけど、ベランダの家庭菜園もまさに NN だな。土と水と日光が入力、葉っぱと根が隠れ層、最終的にミニトマトが出力…でも今年は隠れ層のどこかでエラーが起きたみたいで、トマトが緑のまま固まってる。
部長、その問題、AI関係ない気がします…
あの、トマトの場合、入力(日光・水・温度・土の養分)を観測してログ取りすれば、どの隠れ層で異常が起きたか特定できるんですよ。週末、部長宅のベランダ訪問させていただければ、ぼくが診断します。
川口くん、本当に来てくれるの?嬉しい!
…(部長の家にAI診断で訪問する川口、何の業務範囲ですの?)

「深さ」がもたらした革命
ディープラーニングが2010年代以降に爆発的に発展した理由は、3つに集約される:
- 計算リソース: GPU の発展で、深い NN を訓練できるようになった
- データ: インターネットの発展で、訓練に使える大量のデータが揃った
- アルゴリズム: 誤差逆伝播(別記事)など、深い NN を効率的に学習する手法が確立した
この3つが揃った2012年、ImageNet という画像分類コンペで AlexNet という深層 NN が、従来手法を圧倒的差で破った。これが現代 AI 革命の起点。
そこから先は、皆さんが知っている通り。深さは指数的に伸び、ニューロンの数は爆発し、いまや GPT-3 で 1,750億パラメーター に到達している。
私が都銀の融資審査をやっていた40年前、判断モデルは “人間NN” で、隠れ層は3〜4段だった。アナリスト → 課長 → 部長 → 役員、と上がる過程で、情報が要約されて伝わる。いまの96層と、本質は同じということか?
はい社長、本質は同じです。違いは、機械が 24時間休まずに、99億回の重み更新を、人間より100万倍速くやってる だけです。
凡田さん、それは少し失礼な言い方ですわ。私は13年間、手作業で Excel に判断ロジックを埋め込んで きました。あれは少なくとも200層あります。
大蔵さん、Excelで200層って、構造的に組めるの?
部長、私の Excel は シート間 INDEX/MATCH 参照を200段重ねた、有機的な多層構造 ですわよ。後継者は誰一人解読できないので、私が辞めたら会社が止まります。
…(青ざめる)
…大蔵くん、辞めないでくれよ。
当面 辞めるつもりはございませんけれど、社長、私の Excel スキルを AI で代替する研究プロジェクト を、御託さんと川口くんで進めていらっしゃると伺いました。
…(自分の名前が出て驚く)
…(無言で社長を見つめる)
…凡田くん、川口くん、ちょっと、後で会議室来てくれ。
