ニューラルネットワーク — パーセプトロンを積み重ねた「深い」装置

月初の朝会の前で…

凡田(チームリーダー・38, 主人公)

「ニューラルネット」って、ぼくのデスクの引き出しと同じくらい複雑なんですよ。整理した方が早いんですけど。

大蔵(アシスタントマネージャー・35)

凡田さんのデスク、先週まで3層、現在5層、レシート3年分が層構造の最下層 とのことですわ。

凡田

大蔵さん、なぜそんな詳細まで…

大蔵

私が 昨日経費精算の催促で目視確認 いたしましたから。

このページのまとめ

ニューラルネットワークとは、ひとことで言えば 判断する部品(ニューロン)を何個も、何層にも繋げた装置。1個だけのパーセプトロン(#007)を大量に積み重ねたもの。
なぜ重ねるか。1個だけでは単純な切り分けしかできないが、層を重ねるほど複雑な判断ができるようになる。GPT のような大規模 AI も、結局はこれを巨大にしただけ(層の数やしくみは本文で)。
イメージは 組織の判断リレー。アナリストが下調べし、マネージャーがまとめ、パートナーが結論を出す——情報が層を通るたびに磨かれていく流れと同じ構造。

「AI 解説で必ず出てくる ニューラルネットワーク って何?」と聞かれて、一言で答えられるか。

正解は「パーセプトロン1個を、何個も、何層にも繋げただけ」だ。

パーセプトロンは「入力に重みを掛けて合計し、しきい値を超えたら発火する」という、ニューロン1個の最小モデル(1958年 Frank Rosenblatt 発)。詳細はパーセプトロン(#007)の記事へ。それを大量に積んだのがニューラルネットワーク。本記事は NN の構造を、(1) 層という概念、(2) なぜ「深く」するのか、(3) コンサル業務との接続 の3点で押さえる。

ニューラルネットワーク = ニューロンの「層構造」

NN層構造図: 入力層→隠れ層1→隠れ層2→...→出力層、各層のニューロンが全結合

図1: ニューラルネットワークの層構造(入力層・隠れ層 ×複数・出力層、各層のニューロンが全結合)

NN は、ニューロン(パーセプトロン)を 層(layer) という単位で並べる。

それぞれの役割:

入力層: 外部から来るデータ(画像のピクセル、トークンの埋め込みベクトル等)を受け取る
隠れ層: データを加工する中間処理。ここが何をしているかは人間には直感的に分かりにくい(=ブラックボックス)
出力層: 最終的な答えを出す(画像分類なら「犬 vs 猫」、LLM なら「次のトークンの確率分布」等)

各層には数十〜数万個のニューロンが並ぶ。隣の層との間で全結合(各ニューロンが、隣の層の全ニューロンと繋がる)が一般的。

GPT-3 のような LLM はこの仕組みを 96層 重ねている。1層あたり数万次元のベクトルが流れる。膨大な数の「ニューロン同士の接続」 が処理の本体だ。

「深い」とは何か

「ディープラーニング(深層学習)」の「ディープ」は、隠れ層が複数あること を指す。

歴史的には:

1980年代までの NN: 隠れ層0〜1層(=浅い)
2010年代以降のディープラーニング: 隠れ層 10層〜100層〜
現代の LLM: 数十〜数百層

なぜ「深い」方が良いのか — それは次のセクションで。

なぜ「深く」するのか — 普遍近似定理と表現力

1層のパーセプトロンは XOR が解けない(線形分離可能な問題しか解けない、Minsky & Papert 1969年、詳細はパーセプトロン記事(#007))。これが第1次 AI ブームを終わらせた原因の一つ。

ところが層を増やすと、状況が劇的に変わる。

数学的な事実として:

隠れ層が1層でも、ニューロンを十分多く並べれば、どんな連続関数でも任意の精度で近似できる(普遍近似定理, Cybenko 1989)

つまり、理論上、十分大きな NN はどんな問題でも解ける。ということになっている。

ただし「理論上」と「実用上」は別の話。実用上は、ニューロンの数を増やすより、層を増やす方が効率的ということが経験的に分かっている:

1層に数百万ニューロン並べる → 学習が極めて難しい
100層に数千ニューロンずつ並べる → 同じ表現力で学習しやすい

これが「深さ」が現代AIの主役になった理由。深さ = 抽象化の段数、と捉えると直感的。

最初の層: ピクセルや文字の粗い特徴
中間の層: 線・形・単語の関係性
後ろの層: 物体・概念・意味

各層が前の層の出力をさらに抽象化していく。これが「階層的な特徴抽出」と呼ばれる現象。

NN は「学習する」装置

ここが重要。NN はただ繋いだだけでは動かない。学習(training) という段階が必要。

学習とは、ニューロン同士の接続の「重み」を、データを使って調整する プロセス。

未学習のNN: 重みはランダム → でたらめな出力
       ↓ 大量のデータで学習
学習済みNN: 重みが調整済み → 適切な出力

GPT-3 で言うと、1,750億個 の重みが、インターネット中のテキストデータで何ヶ月もかけて調整されている。1個1個の重みは小さな数字だが、合計で巨大な「知識の固まり」になる。

学習の中身は別記事(重み・訓練・損失関数・勾配降下・逆伝播)に譲るが、ここで覚えておきたいのは:

NN の「知性」は、全部重みの中に詰まっている
学習 = データを見て重みを更新する作業
学習後は重みを固定して、推論(=入力に対して答えを出す)に使う

つまり NN という箱の「中身」(=重み) を、データで作り込んでいく のが機械学習。これが「ルールを人間が書く」古典AIとの根本的な違い。

コンサル業務にもう一歩寄せる

NN を「多段階のレポート連鎖システム」と思って業務に重ねる。

コンサル組織の構造を思い出してほしい:

[現場データ] → [アナリスト] → [マネージャー] → [パートナー] → [社長報告]

各層で:

アナリスト: 生データから数字や事実を抽出
マネージャー: 数字を意味のある要約に変換
パートナー: 要約を経営判断に翻訳
社長: 最終的な意思決定

これが そのままニューラルネットワークの構造。各「層」が前の層の出力を加工して、より抽象的な情報に変える。最後に「結論」が出る。

NN の概念	コンサル組織で言うと
入力層	現場データ・顧客インタビュー
隠れ層	アナリスト → マネージャー → パートナーの連鎖
出力層	社長/CEO 報告書の結論
ニューロンの重み	各役職の人の判断基準・経験値
学習	プロジェクト経験で各人の判断が磨かれる
多層化	階層を増やすほど抽象度が上がる

コンサルが普段やっている「情報の階層的処理」が、機械の中で何百層も並列に走っているのが LLM、と理解すると違和感が消える。

登場人物の反応 ①

凡田(チームリーダー・38, 主人公)

あー…これ、まさにアイマイ社の組織図だ。俺がアナリスト時代に作ったExcelが、御託さんの口で要約されて、赤崎部長のパワポになって、最後南雲社長が「で、儲かるんだろ?」って言って終わる。情報が層を通るたびに、原型を保たない。

御託(シニアコンサル・39)

フッ、それは凡田が要約の精度を理解していないからだ。私は 入力から出力までの情報損失を最小化する達人 で…

大蔵(アシスタントマネージャー・35)

あら、御託さんが要約なさると、必ずニーチェかハラリかサンデルが出てくるので、入力にあった「顧客の声」が完全に消える こと、私過去13年間で何度も拝見してますわよ。

御託

…(視線を逸らす)

赤崎(部長 / AI戦略推進室室長・42)

凡田くんの話を聞いてふと思ったんだけど、ベランダの家庭菜園もまさに NN だな。土と水と日光が入力、葉っぱと根が隠れ層、最終的にミニトマトが出力…でも今年は隠れ層のどこかでエラーが起きたみたいで、トマトが緑のまま固まってる。

凡田

部長、その問題、AI関係ない気がします…

川口(アナリスト・22)

あの、トマトの場合、入力(日光・水・温度・土の養分)を観測してログ取りすれば、どの隠れ層で異常が起きたか特定できるんですよ。週末、部長宅のベランダ訪問させていただければ、ぼくが診断します。

赤崎

川口くん、本当に来てくれるの?嬉しい!

大蔵

…(部長の家にAI診断で訪問する川口、何の業務範囲ですの?)

「深さ」がもたらした革命

ディープラーニングが2010年代以降に爆発的に発展した理由は、3つに集約される:

計算リソース: GPU の発展で、深い NN を訓練できるようになった
データ: インターネットの発展で、訓練に使える大量のデータが揃った
アルゴリズム: 誤差逆伝播(別記事)など、深い NN を効率的に学習する手法が確立した

この3つが揃った2012年、ImageNet という画像分類コンペで AlexNet という深層 NN が、従来手法を圧倒的差で破った。これが現代 AI 革命の起点。

そこから先は、皆さんが知っている通り。深さは指数的に伸び、ニューロンの数は爆発し、いまや GPT-3 で 1,750億パラメーター に到達している。

登場人物の反応 ②

南雲(社長・60-62)

私が都銀の融資審査をやっていた40年前、判断モデルは “人間NN” で、隠れ層は3〜4段だった。アナリスト → 課長 → 部長 → 役員、と上がる過程で、情報が要約されて伝わる。いまの96層と、本質は同じということか?

凡田(チームリーダー・38, 主人公)

はい社長、本質は同じです。違いは、機械が 24時間休まずに、99億回の重み更新を、人間より100万倍速くやってる だけです。

大蔵(アシスタントマネージャー・35)

凡田さん、それは少し失礼な言い方ですわ。私は13年間、手作業で Excel に判断ロジックを埋め込んで きました。あれは少なくとも200層あります。

赤崎(部長 / AI戦略推進室室長・42)

大蔵さん、Excelで200層って、構造的に組めるの?

大蔵

部長、私の Excel は シート間 INDEX/MATCH 参照を200段重ねた、有機的な多層構造 ですわよ。後継者は誰一人解読できないので、私が辞めたら会社が止まります。

赤崎

…(青ざめる)

南雲

…大蔵くん、辞めないでくれよ。

大蔵

当面辞めるつもりはございませんけれど、社長、私の Excel スキルを AI で代替する研究プロジェクト を、御託さんと川口くんで進めていらっしゃると伺いました。

御託

…(自分の名前が出て驚く)

川口

…(無言で社長を見つめる)

南雲

…凡田くん、川口くん、ちょっと、後で会議室来てくれ。

ニューラルネットワーク — パーセプトロンを積み重ねた 「深い」 装置

ニューラルネットワーク = ニューロンの 「層構造」

「深い」とは何か

なぜ 「深く」 するのか — 普遍近似定理と表現力

NN は 「学習する」 装置

コンサル業務にもう一歩寄せる

「深さ」がもたらした革命

ニューラルネットワーク — パーセプトロンを積み重ねた「深い」装置

ニューラルネットワーク = ニューロンの「層構造」

なぜ「深く」するのか — 普遍近似定理と表現力

NN は「学習する」装置