機械学習モデル — 「ルールを書かずに、データから振る舞いを決める」すべての AI の共通骨格

給湯室の前で、ペットボトルを取りながら…

凡田(チームリーダー・38, 主人公)

御託さん、そもそも論で恐縮なんですが…「機械学習」って 結局なんなんでしょうね? 私、3年これで飯食ってますけど、ふわっとしか分かってなくて。

御託(シニアコンサル・39)

フッ、凡田、そんなことも知らんのか。機械学習とはな、要するに ダイヤルとノブ だ。

大蔵(アシスタントマネージャー・35)

あら、ダイヤルとノブですって? それなら Excel の スピンボタン でしょう? 私、13年使ってますけど。

御託

……(沈黙)

このページのまとめ

機械学習モデル = 人間がルールを書くのではなく、データから振る舞いを覚えさせる 仕組みの総称。
だから新しい例にも対応できる。「もし〜ならこうする」を一つずつ書く従来のプログラム では追いつかない仕事を任せられる。
イメージは たくさんのダイヤルを持つ装置。正解に近づくよう回し方を調整していく(回す仕組みは本文で)。

「機械学習」という言葉は、いまや業界誌・経営層・顧客提案で 毎日100回見る単語 になった。だが、「で、機械学習って何なんですか?」と素朴に聞かれて、3分で答えられる人は意外に少ない。

本記事はその素朴な疑問に正面から答える。機械学習モデルとは、調整可能なダイヤルとノブをたくさん持った装置を、データで正解に近づくように回す仕組み。これだけ。線形回帰も、ニューラルネットワークも、GPT も、原理は完全に同じ枠の中にいる。

違いはダイヤルの数と並べ方だけ — そこを掴むと、「ディープラーニング」「LLM」「Transformer」がすべて 機械学習モデルのバリエーション だと見えてくる。

機械学習以前 — 「コードで if-then を書く」時代

機械学習を理解するには、まず 機械学習以前のやり方 と対比するのが早い。

1960〜1990年代の AI は、ほぼ全部 ルールベース(エキスパートシステム) だった。やり方はこう:

もし 患者の体温 ≥ 38℃ かつ 喉が痛い:
  → 風邪を疑う
もし 患者の体温 ≥ 38℃ かつ 関節痛 かつ 季節が冬:
  → インフルを疑う
もし …
  → …

医師の判断を 専門家ヒアリング → if-then ルールで書き起こす → コードに落とす。これを何百〜何千ルール積み上げる。当時の医療診断 AI(MYCIN 等)はこの形だった。

限界は あっという間に来た:

ルールが 1,000本を超えると人間が管理しきれない(矛盾が出始める)
例外パターンが 無限に出てくる(「子供」「妊婦」「高齢者」で分岐爆発)
新しい病気が出ると 全ルールを書き直し
そもそも医師本人が「なんで自分がそう判断してるか言語化できない」

この最後が決定的だった。暗黙知をコードに落とすのが、原理的に難しい。経験豊富な医師の「なんとなくおかしい」を if-then で書ききれない。

機械学習という発想転換 — 「コードで書く代わりに、データから学ばせる」

そこで 1990年代後半から発想が反転した。

判断ルールを人間がコードで書くのではなく、過去事例(データ)を山ほど与えて、機械に「ルールに相当する内部状態」を自動で調整させる。

具体的には、調整可能なパラメーター(ダイヤルとノブ)をたくさん持った柔軟な構造 を用意して、入力と正解のペアを大量に見せながら、「正解に近づくようにダイヤルを少しずつ回す」。これを延々と繰り返す。

3Blue1Brown の解説でもこう言われている:

機械学習のアプローチは、タスクを遂行する手続きを具体的にコードで定義するのではなく、調整可能なパラメーター(ダイヤルやノブ)をたくさん持った柔軟な構造を持たせて、与えられた入力に対してどんな出力が適切かというたくさんの例を使って、このパラメーターを調整することでこの振る舞いを真似させようというもの。

つまり 機械学習モデル = 「ダイヤルとノブを持った装置」+「データから自動でダイヤルを回す仕組み」。

このアプローチが革命的だったのは、「人間がルールを言語化できない領域でも、データさえあれば AI が動く」 という点。画像認識・音声認識・自然言語処理は、まさにこの「言語化できない暗黙知」の領域で、ルールベースでは全く歯が立たなかったのが、機械学習で一気にブレイクした。

機械学習モデルの最小単位 — 線形回帰(ダイヤル2個)

機械学習モデルの「原型」として、最も単純な例を見る。線形回帰 だ。

住宅価格を予測したい。入力は 住宅の面積、出力は価格。データは過去の成約事例:

面積(m²)	価格(万円)
40	3,200
55	4,400
70	5,600
85	6,800
…	…

これを表現するモデルは 価格 = a × 面積 + b。ダイヤルは a と b の2個 しかない。

学習とは、過去データを使って a と b の値を、誤差が最小になるように調整する だけ。Excel の「近似曲線」で出てくる y = 80x + 0 みたいなあの式、あれが線形回帰のダイヤルを回した結果。

線形回帰(ダイヤル2個) vs パーセプトロン(数個) vs NN(数千〜数億) vs GPT-3(1,750億)のダイヤル数比較

図1: ダイヤルの数で見る機械学習モデルの「スケール」の変遷

これが 機械学習モデルの最小形。ダイヤル2個でも立派な機械学習モデルである。「データから振る舞いを決める」 という原則さえ満たせば、全部機械学習。

ダイヤルを増やすと何ができるか — 線形回帰から GPT まで

ダイヤルが2個では「直線1本」しか引けない。住宅価格のような単純な関係なら十分だが、現実のタスクの多くは直線では足りない。

そこで ダイヤルを増やす。これが機械学習モデルの歴史:

モデル	ダイヤル数	できること	登場時期
線形回帰	2〜数十個	連続値の予測(住宅価格・売上)	古典統計
ロジスティック回帰	数十〜数百個	二値分類(スパム判定・与信)	古典統計
パーセプトロン(#007)	数個	線形分離可能な分類	1958
決定木 / ランダムフォレスト	数百〜数万分岐	表データの分類・予測	1980〜90年代
サポートベクターマシン	数千個	文書分類・画像分類(浅い)	1990年代
ニューラルネットワーク(深層)(#008)	数百万〜数億個	画像認識・音声認識	2012〜
Transformer(GPT-2)	15億個	自然な文章生成	2019
GPT-3	1,750億個	少ない例から多様なタスク	2020
GPT-4 (推定)	1.7兆個(推定)	推論・コード・多言語・マルチモーダル	2023

すべて 同じ枠 にいる: 「ダイヤルとノブを持った装置 + データで回す仕組み」。違いは ダイヤルの数と並べ方 だけ。

そして 「深層学習(Deep Learning)」 = ダイヤルを「深く積んだ」機械学習モデル。Transformer も GPT も Claude も Llama も、全部深層学習 = 機械学習モデルの一種、という入れ子構造になっている。

登場人物の反応 ①

大蔵(アシスタントマネージャー・35)

つまり、機械学習って 「ルールを書かずに、データで覚えさせる」 ってことですのね? それなら私、13年やってますわよ? 新人女性の指導は、マニュアル渡さずに 「私の背中を見て覚えなさい」 一択ですもの。

凡田(チームリーダー・38, 主人公)

大蔵さん、それ パラメーターが新人女性の脳内 なだけで、たしかに構造は機械学習ですね。…ただ、ダイヤルを回す仕組みが 「圧と無言」 なのが多少パワハラ寄りでして。

赤崎(部長 / AI戦略推進室室長・42)

ふわっとした方向感としては、機械学習って 「先輩の暗黙知をデータで真似する装置」 なんだね。…うちの千葉の家のローン審査も、20年前は支店長の 「顔つき」 で決まってたらしいよ。あれが機械学習化されたら、私通らなかったかもしれないなあ。

川口(アナリスト・22)

あの、赤崎部長、銀行の与信モデルって 2010年代にほぼ全部機械学習化 されてます。住宅ローンも今は 過去30万件の返済データ から学習した 勾配ブースティング って機械学習モデルで判定してて、人間の「顔つき」は1割も影響してないって論文を…(無言でPDFを開く)

赤崎

……(無言で口を結ぶ)

大蔵

あら、部長、お顔の話はやめましょう。…ところで、いまの川口くんの「勾配ブースティング」って、それも Excel でできますの?

川口

大蔵さん、Excel でも 「XLSTAT」アドイン を入れれば一応…(あ、説明はじめると小一時間…)。

大蔵が新人女性社員に向かって「私の背中を見て覚えなさい」のポーズで腕組み、新人は涙目で手帳を握りしめている。背景はオフィス、横で凡田が苦笑い

機械学習モデルが向く仕事 / 向かない仕事

ここまでで 「機械学習 = ルールを書かずにデータから決める」 という骨格が見えた。では実務的に、どんな仕事に向いて、どんな仕事に向かないのか。

判断の目安はシンプルで、「if-then で書きたくないほどルールが複雑か、暗黙知か」の一点。

仕事の性質	機械学習向き?	理由
明確な手続きで決まる(税額計算・利息計算)	❌ 不向き	if-then で正確に書ける。学習させる必要なし
過去事例が大量にある(与信・不正検知)	⭕ 向く	事例から判断軸を自動抽出できる
暗黙知の塊(画像診断・翻訳)	⭕⭕ 最適	人間がルールを書ききれない領域
ルールが頻繁に変わる(法律改正対応)	△ 微妙	毎回再学習が必要、ルールベースの方が速い場合も
事例が極端に少ない(レアな疾患・新規事業)	❌ 不向き	そもそも学習データが足りない
説明責任が極めて重い(司法判決)	△ 制約大	「なぜそう判定したか」の説明が困難

コンサル業務に重ねると、「マニュアル化できる業務 = if-then で書ける = 機械学習である必要なし」「マニュアル化に20年かかる業務 = 暗黙知の塊 = 機械学習の主戦場」 という整理になる。

つまり、AI に 真っ先に代替されるのは「マニュアルに書けないが、過去事例は山ほどある」業務。コンサル業界で言えば 「ベテラン社員の「感覚」で判断していたタスク」 がここに該当する。皮肉なことに、これは シニアコンサルの市場価値の核 でもある。

登場人物の反応 ②

南雲(社長・60-62)

ふむ…つまり俺の 40年の融資判断 は、データ化すれば機械が肩代わりするということか。これは由々しき事態だ。…ところで、ゴルフ場で会った地銀の頭取が 「うちは AI 融資審査をやめた」 と言ってたが、あれは何故だ?

川口(アナリスト・22)

地銀の場合、学習データが地域に偏ってる のと 事例数が大手の100分の1 なので、機械学習モデルの精度が出ないことが多いんです。あと、貸出先が 地元の中小企業の社長との関係性 でほぼ決まるので、データ化しきれない領域でして…これも論文があるんですけど(無言でブックマークを開きかける)。

御託(シニアコンサル・39)

ま、待て川口、お前がしゃべりすぎだ。…そもそもだな、機械学習の本質は サンデル流に言えば 「共同体的判断 vs 個別判断」の構造でだな、ハーバードの教室では…(と言いつつ昨夜のVtuber配信通知が鳴って画面に目をやる)

大蔵

御託さん、いま画面に 「3D配信記念」 って通知が出てましたわよ? ご家族の?

御託

……(画面を素早く伏せる)

凡田

(これ、論点が機械学習から完全に逸れてる…) 社長、結論としては、暗黙知が機械学習で形式知化される 時代に入ったので、当社の「ベテランの感覚」も データに残しておくべき 、という戦略提言で…

南雲

うむ、いいねえ、それを パワポ300枚 でまとめてくれ。…これからの時代は、ベテランの感覚もデータ化だ。儲かるんだろ?

川口

あ、はい、やっておきます。(また300枚…)

御託がデスクで突然スマホの通知に気づき、画面を慌てて伏せようとしている。大蔵が横目でチラ見、御託は冷や汗1滴。背景はオフィス

KEY TAKEAWAYS

抑えておきたいポイント

機械学習モデル = ルールを書かずにデータから振る舞いを決める装置。骨格は「ダイヤルとノブ × データで回す仕組み」。
線形回帰(ダイヤル2個)も GPT-3(1,750億個)も 同じ枠。違うのはダイヤルの数と並べ方。
機械学習以前(エキスパートシステム)が限界に達したのは、暗黙知をコードで書ききれなかった から。
深層学習・Transformer・LLM はすべて 機械学習モデルのバリエーション。
向く仕事: 暗黙知の塊・過去事例が大量。向かない仕事: 明確な手続き・事例が少ない・説明責任重い。
コンサル感覚: 「マニュアル化できる仕事 = AI化不要」「マニュアル化に20年かかる仕事 = AI の主戦場」。シニアの市場価値の核がここにある。