フッ、線形回帰こそ、機械学習の 最も美しい姿 だ。y = ax + b。この単純な式に、宇宙の単純性 が宿っている。ニーチェは 『美しいものは単純である』 と言ったが、まさにそれだ。
えーと、御託さん、線形回帰は単に 「a と b の2つの数字を当てるだけ」 の作業 です。哲学的な深みは特になくて、Excel の =SLOPE() と =INTERCEPT() で2秒で出ます。
あら、御託さんは本日も 「哲学化」 モード絶好調ですわね。…線形回帰、私 Excel で13年やってます けど、宇宙の単純性とは特に出会ったことがありませんわ。
……(目を逸らす。本当は今朝の 3D LIVE で推しが 「線形回帰って美しいよね〜」 と言ってたのを聞いただけ、とは言えない)

- 線形回帰 = 散らばった点の集まりに 1本の直線を引いて、入力から出力をざっくり予測する、最も古典的な機械学習モデル。
- シンプルゆえに 速い・解釈できる・データが少なくても使える。だから LLM 時代の今も実務(KPI 予測や 機械学習モデル(#011) の入口)から消えない。
- イメージは 定規で点の真ん中を通す線を引く 感じ。傾きと切片という2つのツマミだけで、その線が決まる(式 y = ax + b は本文で)。
機械学習モデル(#011) 記事で「最も単純な機械学習モデル = 線形回帰、ダイヤル2個」と1段落で触れた、その深掘り。勾配降下(#015)、過学習(#019)、Optimizer(#017) といった現代の深層学習用語を散々扱ってきたが、線形回帰はそれら全てが不要な、「勾配降下なしで一発で解ける」 古典的な最小モデル。
しかも、これが 2026年現在もコンサル業務で最も使われている機械学習モデル。LLM 時代になっても消えていない。理由は「速い・解釈可能・データが少なくても使える」という現実的なメリットが LLM とは別軸で強いから。
線形回帰とは — y = ax + b、それだけ
具体例で見る。住宅価格を予測したい。入力は 面積(m²)、出力は 価格(万円)。
| 面積(m²) | 価格(万円) |
|---|---|
| 40 | 3,200 |
| 55 | 4,400 |
| 70 | 5,600 |
| 85 | 6,800 |
| 100 | 8,000 |
この表を散布図にすると、ほぼ1本の直線に乗る(価格 = 80 × 面積)。これを式で表すと:
価格 = a × 面積 + b (a = 80, b = 0 を当てるのが学習)
パラメーターは たった2個(a と b)。これを過去データから当てる作業が 線形回帰の学習。当てた後は、新規物件の面積を入れれば価格が予測できる。
どう a, b を決めるか — 最小二乗法、解析解で一発
「ベストフィットの直線」 とは何か。各データ点と直線の 「縦のズレ(残差)」 の二乗和を最小にする 直線のこと。これが 最小二乗法。
驚くべきことに、線形回帰は 解析解(=連立方程式を解いて閉じた式で答えが出る) が存在する。勾配降下(#015) でぐるぐる回す必要がない。
- 正規方程式: 行列計算1回で a と b が同時に求まる
- Excel の
=SLOPE(y範囲, x範囲)と=INTERCEPT(y範囲, x範囲)がこれを内部で計算している - Python なら scikit-learn の
LinearRegression().fit()1行
つまり線形回帰は、「訓練」 という言葉を使うほどの作業ですらない。「データを入れたら一発で答えが出る数学的操作」。これが計算速度の異常な速さに繋がっている。
なぜまだ実務で使われ続けているか — 3つの理由
2026年現在、LLM が世界を変えつつあるなかで、線形回帰は 消えるどころか実務での利用が増えている。理由は3つ。
① 速い(=データを入れたら即答)
100万件のデータでも、線形回帰は 1秒以下で fit する。深層学習なら何時間〜何日かかる規模でも、線形回帰は瞬時。リアルタイム性が要る業務(在庫予測、価格推定、需要予測)で第一選択。
② 解釈可能(=なぜその答えか説明できる)
「面積が1m²増えると価格が80万円上がる」と 誰でも理解できる形 で答えが出る。これは深層学習にはできない芸当。
規制業界(金融、医療、保険)では 「AI の判定理由を説明できること」が法律で必須 な場面が多く、説明可能な線形回帰が今でも現役。
③ データが少なくても動く
線形回帰は パラメーター2個(多変量でも数十個)なので、過学習(#019) のリスクが低い。データ100件あれば実用レベル、1,000件あれば十分。深層学習の 「数百万件必須」 とは別世界。
多変量線形回帰 — 入力を複数にする実用版
実務では入力が1つということはまずない。住宅価格なら 面積 + 築年数 + 駅距離 + 階数 + 角部屋フラグ など。これらを全部入力にした式が 多変量線形回帰。
価格 = a₁ × 面積 + a₂ × 築年数 + a₃ × 駅距離 + a₄ × 階数 + a₅ × 角部屋 + b
パラメーターは 入力1つにつき1つ + bias 1個。10個の入力なら 11パラメーター。それでも GPT-3 の 1,750億パラメーターと比べると桁が違うほど小さい。
これだけでも、住宅価格・売上予測・需要予測・広告 ROI 分析 等のビジネス予測の 9割は実用レベル で対応できる。
分類問題への拡張 — ロジスティック回帰
線形回帰は連続値の予測(住宅価格、売上 等)向け。分類問題(=YES/NO、買う/買わない) には少し改良が必要。
その改良版が ロジスティック回帰:
- 線形回帰で出した値を シグモイド関数(活性化関数(#012) 記事参照) に通して、0〜1 の確率に変換
- 例: 与信判定 → 「貸し倒れ確率 0.03」のように出力
- 金融、医療診断、不正検知、A/Bテスト分析 で広く使われる
名前に 「回帰」 と入っているが、実体は分類器。「線形回帰 + 活性化関数」 の組み合わせは、実は NN の最小単位そのもの。
本質: NN は線形回帰の 「積み重ね」
ここで重要な気づき。ニューラルネットワーク(#008) は、線形回帰を活性化関数付きで何層も重ねたもの。
NN の各ニューロン = 「入力の線形結合(線形回帰)+ 活性化関数(#012)」
NN 全体 = それを何層も重ねたもの
つまり、NN は線形回帰の 「巨大な階層構造」 として理解できる。
つまり、線形回帰を理解することは、NN の 「最小単位」 を理解すること。機械学習モデル(#011) の階段で言うと:
- 線形回帰(2-10パラ): 最小単位
- パーセプトロン(#007)(数〜数十パラ): 線形回帰 + ステップ関数
- NN(#008)(数百万〜数億パラ): 上記を多層化
- GPT-3(#010)(1,750億パラ): NN の Transformer 化 + 超大規模化
線形回帰は LLM の 「先祖」 であり、今も同じ枠の中で生きている。LLM が線形回帰を駆逐したわけではなく、用途で住み分けている。
つまり、私の Excel =SLOPE() と =INTERCEPT() は、現代の AI の 最小単位 を13年実装し続けてきた、ということになりますわね。これは 「AI 老舗実装者」 として認定されてしかるべきでは?
大蔵さん、技術的には正確です。=SLOPE/=INTERCEPT は内部で 正規方程式 を解いていて、これは scikit-learn の LinearRegression と同じアルゴリズム。…ちなみに大蔵さんの13年の Excel スキルは、論文に投稿できるレベルのケーススタディとして…(無言で計量経済学の paper を3本タブで開きはじめる)
俺も広告時代に CPC と CTR の線形回帰 を毎日 Excel で出してて、R²(決定係数) を見ながら「0.7 以下なら直線フィッティング諦める」みたいなルールでやってた。あれ完全に 線形回帰の実務運用 だったんだよな。
フッ、凡田、それは 「線形性の限界」 を発見した瞬間 だ。線形回帰が破綻する点で、お前は 非線形性の存在 を体感した。ニーチェ的に言えば 「単純さの彼方」 に出会ったのだ。
御託さん、「線形性の限界」 も 「単純さの彼方」 も、今朝の 3D LIVE で配信されていた ご様子ですわね。本日は ニーチェ × Vtuber の融合回ですの?

コンサル業務での実際 — 線形回帰が消えない理由
コンサルの実務で、いつ線形回帰を選び、いつ LLM や深層学習を選ぶか。整理する。
| 業務 | 線形回帰が第一選択 | 深層学習/LLM が必要 |
|---|---|---|
| 売上予測 / 需要予測 | ⭕ 標準ツール | 大量データ + 非線形パターンがある場合のみ |
| KPI 因果分析 | ⭕ 説明可能性が必須 | 不要(むしろ規制で禁止される業界も) |
| A/B テスト分析 | ⭕ 統計的標準 | 不要 |
| 与信スコアリング | ⭕ ロジスティック回帰(規制対応) | 大手では併用、ただし説明用には線形回帰 |
| 画像認識(製品検品 等) | ❌ 不適 | ⭕ CNN / Transformer |
| 文章要約 / 翻訳 | ❌ 完全に不適 | ⭕ LLM 一択 |
| 顧客行動予測(数百次元の特徴) | △ 入口として有効 | ⭕ Gradient Boosting や NN |
つまり、「説明可能性 × 計算速度 × データ少での頑健性」 が必要な業務では、線形回帰が今でも勝つ。深層学習が向くのは「画像・音声・自然言語」など 本質的に非線形で大量データがある領域 だけ。
コンサル業界の現実: 提案資料に 「線形回帰でロジスティックスコアを算出」 と書いてある率は、「AI で予測」 と書いてある率の数倍。AI ブームの裏で、線形回帰は静かに業界を支えている。
ふむ、つまり 線形回帰こそが業界を静かに支えている、と。…俺の都銀員時代、融資判定の与信スコア は完全にロジスティック回帰だった。あれは 規制で説明責任があるから線形系しか選択肢が無い、と当時の本部から指示が来た覚えがある。
社長、まさにそれです。金融・医療・保険などの規制業界では、「なぜその判定か」 の説明責任が法律 で。深層学習だと説明できないので、いまだに ロジスティック回帰が主流。LLM が来てもこの分野は変わらない可能性が高いです。
いいねいいね、線形回帰。…ところで、私の 「ふわっとした方向感」 も、ある意味 「a = 0, b = いいね」 という y = いいね の定数関数として、究極の線形モデルなのでは?
あら部長、それは 「線形モデル」 ではなく 「定数モデル」 ですわよ。何を入力しても 「いいね」 しか出力されない ので、技術的には 「a = 0 で b だけ」 の退化したモデル ですわね。決定係数 R² は 確実にゼロ です。
あ、社長、結論として当社の 「説明可能AI 戦略」 として、線形回帰系の手法を提案資料に組み込む3カ年計画を、パワポ350枚 でまとめさせていただきます。…(これで休日12週連続)
うむ、いいねえ。「線形回帰経営」 も響きがいいな。儲かるんだろ?
