会議室の窓辺で外を眺めながら…
御託(シニアコンサル・39)

フッ、線形回帰こそ、機械学習の 最も美しい姿 だ。y = ax + b。この単純な式に、宇宙の単純性 が宿っている。ニーチェは 『美しいものは単純である』 と言ったが、まさにそれだ。

凡田(チームリーダー・38, 主人公)

えーと、御託さん、線形回帰は単に 「a と b の2つの数字を当てるだけ」 の作業 です。哲学的な深みは特になくて、Excel の =SLOPE() と =INTERCEPT() で2秒で出ます。

大蔵(アシスタントマネージャー・35)

あら、御託さんは本日も 「哲学化」 モード絶好調ですわね。…線形回帰、私 Excel で13年やってます けど、宇宙の単純性とは特に出会ったことがありませんわ。

御託

……(目を逸らす。本当は今朝の 3D LIVE で推しが 「線形回帰って美しいよね〜」 と言ってたのを聞いただけ、とは言えない)

会議室の窓辺で御託が哲学的に線形回帰を語り、凡田が冷静ツッコミ、大蔵が
このページのまとめ
  • 線形回帰 = 散らばった点の集まりに 1本の直線を引いて、入力から出力をざっくり予測する、最も古典的な機械学習モデル。
  • シンプルゆえに 速い・解釈できる・データが少なくても使える。だから LLM 時代の今も実務(KPI 予測や 機械学習モデル(#011) の入口)から消えない。
  • イメージは 定規で点の真ん中を通す線を引く 感じ。傾きと切片という2つのツマミだけで、その線が決まる(式 y = ax + b は本文で)。

機械学習モデル(#011) 記事で「最も単純な機械学習モデル = 線形回帰、ダイヤル2個」と1段落で触れた、その深掘り。勾配降下(#015)過学習(#019)Optimizer(#017) といった現代の深層学習用語を散々扱ってきたが、線形回帰はそれら全てが不要な、「勾配降下なしで一発で解ける」 古典的な最小モデル

しかも、これが 2026年現在もコンサル業務で最も使われている機械学習モデル。LLM 時代になっても消えていない。理由は「速い・解釈可能・データが少なくても使える」という現実的なメリットが LLM とは別軸で強いから。

線形回帰とは — y = ax + b、それだけ

具体例で見る。住宅価格を予測したい。入力は 面積(m²)、出力は 価格(万円)

面積(m²) 価格(万円)
40 3,200
55 4,400
70 5,600
85 6,800
100 8,000

この表を散布図にすると、ほぼ1本の直線に乗る(価格 = 80 × 面積)。これを式で表すと:

価格 = a × 面積 + b   (a = 80, b = 0 を当てるのが学習)

パラメーターは たった2個(ab)。これを過去データから当てる作業が 線形回帰の学習。当てた後は、新規物件の面積を入れれば価格が予測できる。

住宅価格データの散布図と線形回帰によるフィット直線、残差(縦の点線)も表示

図1: 線形回帰 — 散布図に 「ベストフィットの直線」 を1本引く

どう a, b を決めるか — 最小二乗法、解析解で一発

「ベストフィットの直線」 とは何か。各データ点と直線の 「縦のズレ(残差)」 の二乗和を最小にする 直線のこと。これが 最小二乗法

驚くべきことに、線形回帰は 解析解(=連立方程式を解いて閉じた式で答えが出る) が存在する。勾配降下(#015) でぐるぐる回す必要がない。

つまり線形回帰は、「訓練」 という言葉を使うほどの作業ですらない。「データを入れたら一発で答えが出る数学的操作」。これが計算速度の異常な速さに繋がっている。

なぜまだ実務で使われ続けているか — 3つの理由

2026年現在、LLM が世界を変えつつあるなかで、線形回帰は 消えるどころか実務での利用が増えている。理由は3つ。

① 速い(=データを入れたら即答)

100万件のデータでも、線形回帰は 1秒以下で fit する。深層学習なら何時間〜何日かかる規模でも、線形回帰は瞬時。リアルタイム性が要る業務(在庫予測、価格推定、需要予測)で第一選択。

② 解釈可能(=なぜその答えか説明できる)

「面積が1m²増えると価格が80万円上がる」と 誰でも理解できる形 で答えが出る。これは深層学習にはできない芸当。

規制業界(金融、医療、保険)では 「AI の判定理由を説明できること」が法律で必須 な場面が多く、説明可能な線形回帰が今でも現役。

③ データが少なくても動く

線形回帰は パラメーター2個(多変量でも数十個)なので、過学習(#019) のリスクが低い。データ100件あれば実用レベル、1,000件あれば十分。深層学習の 「数百万件必須」 とは別世界。

多変量線形回帰 — 入力を複数にする実用版

実務では入力が1つということはまずない。住宅価格なら 面積 + 築年数 + 駅距離 + 階数 + 角部屋フラグ など。これらを全部入力にした式が 多変量線形回帰

価格 = a₁ × 面積 + a₂ × 築年数 + a₃ × 駅距離 + a₄ × 階数 + a₅ × 角部屋 + b

パラメーターは 入力1つにつき1つ + bias 1個。10個の入力なら 11パラメーター。それでも GPT-3 の 1,750億パラメーターと比べると桁が違うほど小さい。

これだけでも、住宅価格・売上予測・需要予測・広告 ROI 分析 等のビジネス予測の 9割は実用レベル で対応できる。

分類問題への拡張 — ロジスティック回帰

線形回帰は連続値の予測(住宅価格、売上 等)向け。分類問題(=YES/NO、買う/買わない) には少し改良が必要。

その改良版が ロジスティック回帰:

名前に 「回帰」 と入っているが、実体は分類器。「線形回帰 + 活性化関数」 の組み合わせは、実は NN の最小単位そのもの

本質: NN は線形回帰の 「積み重ね」

ここで重要な気づき。ニューラルネットワーク(#008) は、線形回帰を活性化関数付きで何層も重ねたもの

NN の各ニューロン = 「入力の線形結合(線形回帰)+ 活性化関数(#012)
NN 全体 = それを何層も重ねたもの
つまり、NN は線形回帰の 「巨大な階層構造」 として理解できる。

つまり、線形回帰を理解することは、NN の 「最小単位」 を理解すること機械学習モデル(#011) の階段で言うと:

線形回帰は LLM の 「先祖」 であり、今も同じ枠の中で生きている。LLM が線形回帰を駆逐したわけではなく、用途で住み分けている。

登場人物の反応 ①
大蔵(アシスタントマネージャー・35)

つまり、私の Excel =SLOPE() と =INTERCEPT() は、現代の AI の 最小単位 を13年実装し続けてきた、ということになりますわね。これは 「AI 老舗実装者」 として認定されてしかるべきでは?

川口(アナリスト・22)

大蔵さん、技術的には正確です。=SLOPE/=INTERCEPT は内部で 正規方程式 を解いていて、これは scikit-learn の LinearRegression と同じアルゴリズム。…ちなみに大蔵さんの13年の Excel スキルは、論文に投稿できるレベルのケーススタディとして…(無言で計量経済学の paper を3本タブで開きはじめる)

凡田(チームリーダー・38, 主人公)

俺も広告時代に CPC と CTR の線形回帰 を毎日 Excel で出してて、R²(決定係数) を見ながら「0.7 以下なら直線フィッティング諦める」みたいなルールでやってた。あれ完全に 線形回帰の実務運用 だったんだよな。

御託

フッ、凡田、それは 「線形性の限界」 を発見した瞬間 だ。線形回帰が破綻する点で、お前は 非線形性の存在 を体感した。ニーチェ的に言えば 「単純さの彼方」 に出会ったのだ。

大蔵

御託さん、「線形性の限界」「単純さの彼方」 も、今朝の 3D LIVE で配信されていた ご様子ですわね。本日は ニーチェ × Vtuber の融合回ですの?

大蔵がノートPC画面でExcel =SLOPE() と =INTERCEPT() を見せ

コンサル業務での実際 — 線形回帰が消えない理由

コンサルの実務で、いつ線形回帰を選び、いつ LLM や深層学習を選ぶか。整理する。

業務 線形回帰が第一選択 深層学習/LLM が必要
売上予測 / 需要予測 ⭕ 標準ツール 大量データ + 非線形パターンがある場合のみ
KPI 因果分析 ⭕ 説明可能性が必須 不要(むしろ規制で禁止される業界も)
A/B テスト分析 ⭕ 統計的標準 不要
与信スコアリング ⭕ ロジスティック回帰(規制対応) 大手では併用、ただし説明用には線形回帰
画像認識(製品検品 等) ❌ 不適 ⭕ CNN / Transformer
文章要約 / 翻訳 ❌ 完全に不適 ⭕ LLM 一択
顧客行動予測(数百次元の特徴) △ 入口として有効 ⭕ Gradient Boosting や NN

つまり、「説明可能性 × 計算速度 × データ少での頑健性」 が必要な業務では、線形回帰が今でも勝つ。深層学習が向くのは「画像・音声・自然言語」など 本質的に非線形で大量データがある領域 だけ。

コンサル業界の現実: 提案資料に 「線形回帰でロジスティックスコアを算出」 と書いてある率は、「AI で予測」 と書いてある率の数倍。AI ブームの裏で、線形回帰は静かに業界を支えている。

登場人物の反応 ②
南雲(社長・60-62)

ふむ、つまり 線形回帰こそが業界を静かに支えている、と。…俺の都銀員時代、融資判定の与信スコア は完全にロジスティック回帰だった。あれは 規制で説明責任があるから線形系しか選択肢が無い、と当時の本部から指示が来た覚えがある。

凡田(チームリーダー・38, 主人公)

社長、まさにそれです。金融・医療・保険などの規制業界では、「なぜその判定か」 の説明責任が法律 で。深層学習だと説明できないので、いまだに ロジスティック回帰が主流。LLM が来てもこの分野は変わらない可能性が高いです。

赤崎(部長・42)

いいねいいね、線形回帰。…ところで、私の 「ふわっとした方向感」 も、ある意味 「a = 0, b = いいね」 という y = いいね の定数関数として、究極の線形モデルなのでは?

大蔵

あら部長、それは 「線形モデル」 ではなく 「定数モデル」 ですわよ。何を入力しても 「いいね」 しか出力されない ので、技術的には 「a = 0 で b だけ」 の退化したモデル ですわね。決定係数 R² は 確実にゼロ です。

川口

あ、社長、結論として当社の 「説明可能AI 戦略」 として、線形回帰系の手法を提案資料に組み込む3カ年計画を、パワポ350枚 でまとめさせていただきます。…(これで休日12週連続)

南雲

うむ、いいねえ。「線形回帰経営」 も響きがいいな。儲かるんだろ?

会議室で赤崎が誇らしげに