あの、ぼく入社1年で AI関連の論文を1,247本 読破したんですよ。第一次ブームから第三次まで全部。
川口、それ “知識” じゃなくて “週末に外出しない病” の症状だぞ。
あの、ぼく週末も会社のサーバールームで論文整理して…
知ってる。だから言ってる。

- AIは過去70年で3度のブームを経験している。最初の2回は失望で終わった。
- 失敗の共通構造は「人間がルールを書き出す」という前提の破綻にあった。
- 今回(Transformer/LLM時代)が違うのは、(1) 自然言語がUIになった、(2) 1つのモデルが汎用になった、(3) 知的労働の代替が現実距離に入った という3点。
- つまりこれは「ブームの3回目」ではなく、業務基盤そのものを書き換える出来事である。
AIは過去70年で、3度のブームを経験している。最初の2回は、いずれも期待が膨らみ、失望に終わった。
しかし今、起きている3度目だけは、明らかに違う構造を持っている。
その違いを言葉ではなく構造として捉えるには、過去2回がどんな仮説で立ち上がり、どこで破綻したかを見ておく必要がある。本記事はその輪郭を辿る。
第1次AIブーム(1950s–60s) — 論理で知能を作るという幻想

AI(Artificial Intelligence)という用語が生まれたのは、1956年のダートマス会議。コンピュータの黎明期に、研究者たちはこう確信していた。人間の知能は、論理操作の組み合わせで再現できる。
この時代の主流は 記号処理(symbolic AI)。世界の事象を記号で表現し、論理ルールで推論する。たとえば:
- 「ソクラテスは人間である」
- 「人間は皆死ぬ」
- ∴「ソクラテスは死ぬ」
定理証明、簡単な対話システム(ELIZA)、パズル解きは確かに動いた。「あと10年で人間と同等の知能が作れる」と、本気で信じられていた。
なぜ失敗したか
現実の知能は、論理ルールだけではまったく足りなかった。
問題は「あいまいさ」「文脈」「常識」だ。人間が無意識に処理しているこれらの要素を、すべて記号と論理ルールに落とそうとすると、ルールが爆発的に増えて管理不能になる。「鳥は飛ぶ」と書けば、すぐに「ペンギンは?」「死んだ鳥は?」「絵に描かれた鳥は?」という例外の山に埋もれる。
結果、1970年代に AIの冬 が訪れ、研究予算は劇的に削減された。
第2次AIブーム(1980s) — エキスパートシステムの限界
1980年代、AIは別のアプローチで再浮上する。エキスパートシステムだ。
考え方はシンプル。専門家の判断ロジックを if–then ルールで書き出し、知識ベース化する。代表例:
- MYCIN — 細菌感染症の診断と抗生剤の選定
- DENDRAL — 質量分析の結果から分子構造を推定
- XCON — DEC社のコンピュータ構成設定(年間4,000万ドル節約と報告された)
商業的に企業導入が進み、AI市場は1980年代後半に活況を呈した。日本では「第五世代コンピュータ計画」が国家プロジェクトとして始まった時期でもある。
なぜまた失敗したか
エキスパートシステムは、2つの構造的限界に突き当たる。
- 知識獲得のボトルネック:専門家から知識を引き出してルール化する作業は、専門家本人にしかできず、スケールしない。
- ルールの保守不能:ルールが数千を超えると、互いに矛盾し始め、保守できなくなる。新事例ごとに人手でルールを増やすしかない。
つまり「すべてのケースを人間が事前に書き出す」という前提が、再び破綻した。1990年代、2度目のAIの冬に入る。
第3次AIブーム(2010s〜) — ディープラーニングが越えた壁
第3次の転換点は、2012年。画像認識コンペ ImageNet で、AlexNet というディープラーニング(深層学習)モデルが、従来手法を圧倒的な差で破った。エラー率の改善幅が、それまでの年次改善の十倍以上だった。
何が違ったのか。一言で言うと、「ルールを書く」から「データから学ぶ」への発想転換だ。
ディープラーニングは、人間がルールを書く代わりに次の3点を揃える:
- 大量のデータ(画像・テキスト・音声)
- 多層ニューラルネット(脳の神経回路を粗くモデル化した構造)
- 計算リソース(主にGPU)
そしてデータから自動で「特徴」を学習する。「鳥は飛ぶ」というルールを書かなくても、数百万枚の画像から「これが鳥である」と判別する能力を、モデル自身が獲得する。
何が実用化したか
2010年代後半、ディープラーニングで以下が実用域に入った。
- 画像認識(顔認識、医療画像診断、自動運転の物体検知)
- 音声認識(SiriやAlexa)
- 機械翻訳(Google翻訳の品質ジャンプ)
- 囲碁(AlphaGo、2016年に世界トップ棋士を破る)
ただし、ここまでは特化型だった。画像認識モデルは画像しかできず、翻訳モデルは翻訳しかできない。タスクごとに専用モデルを訓練する必要があった。
フッ、ルールベースの限界か。…本質はそこではないがな。MBB時代の友人も言っていたが、結局AIの問題は哲学なんだ。サンデルの本でも読んでから出直せ。
えっと…じゃあ御託さんがおっしゃるそのルール、デスクトップリサーチして、PowerPointにまとめておきます…(今夜10時から)

2020s後半 — Transformer/LLMが起こしたこと
第3次の真の転換点は、ディープラーニングの中でさらに起きた。2017年、Googleが発表した Transformer という新しいニューラルネットの構造だ。
Transformerをベースにした大規模言語モデル(LLM, Large Language Model)が、その後の世界を作る。
- 2020年: GPT-3 — モデル規模を上げただけで、できることが質的にジャンプした
- 2022年末: ChatGPT — 大衆に届くインタフェースで一般公開
- 2024–2026年: GPT-4o / Claude 4 / Gemini 2.x が業務適用フェーズに入る
何が決定的に変わったか
LLMが過去のAIと構造的に違うのは、3つの点に集約される。
- 自然言語そのものがUIになった。プログラムを書ける人だけでなく、日本語で話しかけられる全員が使える。
- 汎用モデルになった。同じモデルが、翻訳・要約・コード生成・市場分析・営業文章まで、ほぼあらゆる知的タスクをこなす。
- 知的労働の代替が現実的距離になった。専門家のアシスタント程度ではなく、専門家自身が代替されかねないところまで来ている。
構造的まとめ — 3度目が「ブーム」では終わらない3つの理由
過去2回のブームと、今回(2020s)の決定的な違いを、構造として整理する。
| 観点 | 第1次・第2次 | 今回(LLM時代) |
|---|---|---|
| 作り方 | 人間がルールを書く | データから自動学習 |
| 使える人 | 専門家・研究者のみ | 自然言語で全員 |
| 汎用性 | タスクごとに専用 | 1つのモデルで多用途 |
| 業務インパクト | 限定的 | 知的労働の代替級 |
「ブームで終わる」とは、期待値が実装を上回り、失望に至ることだ。過去2回はその構造に陥った。
しかし今回は順序が逆だ。期待値より先に、実装が届いている。すでに業務で使われ、すでに人を置き換え始めている、というのが現状だ。
つまりこれは「ブームの3回目」ではない。産業革命の入口だ。電気やインターネットに続く、業務基盤そのものの変化として位置づけるべき出来事である。
うむ、これは産業革命だ。私が率いる。……で、AIって、結局なんだっけ? とりあえずパワポにしてみるか。
フッ、AIなど私は前から触っているがな。具体的に何を? …本質はそこではない。MBA仲間の話によれば、ハラリも同じことを言っていた。
これ、PFCバランスでいうと…じゃなくて、線形代数からやり直さないと無理ですよね!? いや、本来のコンサルとしては、押さえておかないと…!
あら…私の経験では、こういうのは長続きしないんですよね。Excelで十分です、ええ。……今夜のサウナどうしようかしら。
あの…ぼくの仕事、たぶん全部AIに置き換えられるんですよね…(淡々と、でも内心は震えている)
