AIの歴史 — なぜ今度は本物なのか｜アイマイコンサルティング

月曜の朝礼前で…

川口(アナリスト・22)

あの、ぼく入社1年で AI関連の論文を1,247本 読破したんですよ。第一次ブームから第三次まで全部。

凡田(チームリーダー・38, 主人公)

川口、それ “知識” じゃなくて “週末に外出しない病” の症状だぞ。

川口

あの、ぼく週末も会社のサーバールームで論文整理して…

凡田

知ってる。だから言ってる。

このページのまとめ

AIは過去70年で3度のブームを経験している。最初の2回は失望で終わった。
失敗の共通構造は「人間がルールを書き出す」という前提の破綻にあった。
今回(Transformer/LLM時代)が違うのは、(1) 自然言語がUIになった、(2) 1つのモデルが汎用になった、(3) 知的労働の代替が現実距離に入った という3点。
つまりこれは「ブームの3回目」ではなく、業務基盤そのものを書き換える出来事である。

AIは過去70年で、3度のブームを経験している。最初の2回は、いずれも期待が膨らみ、失望に終わった。

しかし今、起きている3度目だけは、明らかに違う構造を持っている。

その違いを言葉ではなく構造として捉えるには、過去2回がどんな仮説で立ち上がり、どこで破綻したかを見ておく必要がある。本記事はその輪郭を辿る。

第1次AIブーム(1950s–60s) — 論理で知能を作るという幻想

AI(Artificial Intelligence)という用語が生まれたのは、1956年のダートマス会議。コンピュータの黎明期に、研究者たちはこう確信していた。人間の知能は、論理操作の組み合わせで再現できる。

この時代の主流は 記号処理(symbolic AI)。世界の事象を記号で表現し、論理ルールで推論する。たとえば:

「ソクラテスは人間である」
「人間は皆死ぬ」
∴「ソクラテスは死ぬ」

定理証明、簡単な対話システム(ELIZA)、パズル解きは確かに動いた。「あと10年で人間と同等の知能が作れる」と、本気で信じられていた。

なぜ失敗したか

現実の知能は、論理ルールだけではまったく足りなかった。

問題は「あいまいさ」「文脈」「常識」だ。人間が無意識に処理しているこれらの要素を、すべて記号と論理ルールに落とそうとすると、ルールが爆発的に増えて管理不能になる。「鳥は飛ぶ」と書けば、すぐに「ペンギンは？」「死んだ鳥は？」「絵に描かれた鳥は？」という例外の山に埋もれる。

結果、1970年代に AIの冬 が訪れ、研究予算は劇的に削減された。

第2次AIブーム(1980s) — エキスパートシステムの限界

1980年代、AIは別のアプローチで再浮上する。エキスパートシステムだ。

考え方はシンプル。専門家の判断ロジックを if–then ルールで書き出し、知識ベース化する。代表例:

MYCIN — 細菌感染症の診断と抗生剤の選定
DENDRAL — 質量分析の結果から分子構造を推定
XCON — DEC社のコンピュータ構成設定(年間4,000万ドル節約と報告された)

商業的に企業導入が進み、AI市場は1980年代後半に活況を呈した。日本では「第五世代コンピュータ計画」が国家プロジェクトとして始まった時期でもある。

なぜまた失敗したか

エキスパートシステムは、2つの構造的限界に突き当たる。

知識獲得のボトルネック：専門家から知識を引き出してルール化する作業は、専門家本人にしかできず、スケールしない。
ルールの保守不能：ルールが数千を超えると、互いに矛盾し始め、保守できなくなる。新事例ごとに人手でルールを増やすしかない。

つまり「すべてのケースを人間が事前に書き出す」という前提が、再び破綻した。1990年代、2度目のAIの冬に入る。

第3次AIブーム(2010s〜) — ディープラーニングが越えた壁

第3次の転換点は、2012年。画像認識コンペ ImageNet で、AlexNet というディープラーニング(深層学習)モデルが、従来手法を圧倒的な差で破った。エラー率の改善幅が、それまでの年次改善の十倍以上だった。

何が違ったのか。一言で言うと、「ルールを書く」から「データから学ぶ」への発想転換だ。

ディープラーニングは、人間がルールを書く代わりに次の3点を揃える:

大量のデータ(画像・テキスト・音声)
多層ニューラルネット(脳の神経回路を粗くモデル化した構造)
計算リソース(主にGPU)

そしてデータから自動で「特徴」を学習する。「鳥は飛ぶ」というルールを書かなくても、数百万枚の画像から「これが鳥である」と判別する能力を、モデル自身が獲得する。

何が実用化したか

2010年代後半、ディープラーニングで以下が実用域に入った。

画像認識(顔認識、医療画像診断、自動運転の物体検知)
音声認識(SiriやAlexa)
機械翻訳(Google翻訳の品質ジャンプ)
囲碁(AlphaGo、2016年に世界トップ棋士を破る)

ただし、ここまでは特化型だった。画像認識モデルは画像しかできず、翻訳モデルは翻訳しかできない。タスクごとに専用モデルを訓練する必要があった。

登場人物の反応

御託（シニアコンサル・39）

フッ、ルールベースの限界か。…本質はそこではないがな。MBB時代の友人も言っていたが、結局AIの問題は哲学なんだ。サンデルの本でも読んでから出直せ。

川口（アナリスト・22）

えっと…じゃあ御託さんがおっしゃるそのルール、デスクトップリサーチして、PowerPointにまとめておきます…（今夜10時から）

2020s後半 — Transformer/LLMが起こしたこと

第3次の真の転換点は、ディープラーニングの中でさらに起きた。2017年、Googleが発表した Transformer という新しいニューラルネットの構造だ。

Transformerをベースにした大規模言語モデル(LLM, Large Language Model)が、その後の世界を作る。

2020年: GPT-3 — モデル規模を上げただけで、できることが質的にジャンプした
2022年末: ChatGPT — 大衆に届くインタフェースで一般公開
2024–2026年: GPT-4o / Claude 4 / Gemini 2.x が業務適用フェーズに入る

何が決定的に変わったか

LLMが過去のAIと構造的に違うのは、3つの点に集約される。

自然言語そのものがUIになった。プログラムを書ける人だけでなく、日本語で話しかけられる全員が使える。
汎用モデルになった。同じモデルが、翻訳・要約・コード生成・市場分析・営業文章まで、ほぼあらゆる知的タスクをこなす。
知的労働の代替が現実的距離になった。専門家のアシスタント程度ではなく、専門家自身が代替されかねないところまで来ている。

構造的まとめ — 3度目が「ブーム」では終わらない3つの理由

過去2回のブームと、今回(2020s)の決定的な違いを、構造として整理する。

観点	第1次・第2次	今回(LLM時代)
作り方	人間がルールを書く	データから自動学習
使える人	専門家・研究者のみ	自然言語で全員
汎用性	タスクごとに専用	1つのモデルで多用途
業務インパクト	限定的	知的労働の代替級

「ブームで終わる」とは、期待値が実装を上回り、失望に至ることだ。過去2回はその構造に陥った。

しかし今回は順序が逆だ。期待値より先に、実装が届いている。すでに業務で使われ、すでに人を置き換え始めている、というのが現状だ。

つまりこれは「ブームの3回目」ではない。産業革命の入口だ。電気やインターネットに続く、業務基盤そのものの変化として位置づけるべき出来事である。

登場人物の反応

赤崎（部長 / AI戦略推進室室長・42）

うむ、これは産業革命だ。私が率いる。……で、AIって、結局なんだっけ? とりあえずパワポにしてみるか。

御託（シニアコンサル・39）

フッ、AIなど私は前から触っているがな。具体的に何を? …本質はそこではない。MBA仲間の話によれば、ハラリも同じことを言っていた。

凡田（チームリーダー・38、主人公）

これ、PFCバランスでいうと…じゃなくて、線形代数からやり直さないと無理ですよね!? いや、本来のコンサルとしては、押さえておかないと…!

大蔵（アシスタントマネージャー・35）

あら…私の経験では、こういうのは長続きしないんですよね。Excelで十分です、ええ。……今夜のサウナどうしようかしら。

川口（アナリスト・22）

あの…ぼくの仕事、たぶん全部AIに置き換えられるんですよね…（淡々と、でも内心は震えている）