線形回帰(Linear Regression) — 機械学習の最小単位、シンプルさ故に実務で消えない装置

会議室の窓辺で外を眺めながら…

御託(シニアコンサル・39)

フッ、線形回帰こそ、機械学習の 最も美しい姿 だ。y = ax + b。この単純な式に、宇宙の単純性 が宿っている。ニーチェは 『美しいものは単純である』 と言ったが、まさにそれだ。

凡田(チームリーダー・38, 主人公)

えーと、御託さん、線形回帰は単に「a と b の2つの数字を当てるだけ」の作業 です。哲学的な深みは特になくて、Excel の =SLOPE() と =INTERCEPT() で2秒で出ます。

大蔵(アシスタントマネージャー・35)

あら、御託さんは本日も 「哲学化」 モード絶好調ですわね。…線形回帰、私 Excel で13年やってます けど、宇宙の単純性とは特に出会ったことがありませんわ。

御託

……(目を逸らす。本当は今朝の 3D LIVE で推しが「線形回帰って美しいよね〜」と言ってたのを聞いただけ、とは言えない)

このページのまとめ

線形回帰 = 散らばった点の集まりに 1本の直線を引いて、入力から出力をざっくり予測する、最も古典的な機械学習モデル。
シンプルゆえに 速い・解釈できる・データが少なくても使える。だから LLM 時代の今も実務(KPI 予測や機械学習モデル(#011) の入口)から消えない。
イメージは 定規で点の真ん中を通す線を引く 感じ。傾きと切片という2つのツマミだけで、その線が決まる(式 y = ax + b は本文で)。

機械学習モデル(#011) 記事で「最も単純な機械学習モデル = 線形回帰、ダイヤル2個」と1段落で触れた、その深掘り。勾配降下(#015)、過学習(#019)、Optimizer(#017) といった現代の深層学習用語を散々扱ってきたが、線形回帰はそれら全てが不要な、「勾配降下なしで一発で解ける」古典的な最小モデル。

しかも、これが 2026年現在もコンサル業務で最も使われている機械学習モデル。LLM 時代になっても消えていない。理由は「速い・解釈可能・データが少なくても使える」という現実的なメリットが LLM とは別軸で強いから。

線形回帰とは — y = ax + b、それだけ

具体例で見る。住宅価格を予測したい。入力は 面積(m²)、出力は 価格(万円)。

面積(m²)	価格(万円)
40	3,200
55	4,400
70	5,600
85	6,800
100	8,000

この表を散布図にすると、ほぼ1本の直線に乗る(価格 = 80 × 面積)。これを式で表すと:

価格 = a × 面積 + b   (a = 80, b = 0 を当てるのが学習)

パラメーターは たった2個(a と b)。これを過去データから当てる作業が 線形回帰の学習。当てた後は、新規物件の面積を入れれば価格が予測できる。

図1: 線形回帰 — 散布図に「ベストフィットの直線」を1本引く

どう a, b を決めるか — 最小二乗法、解析解で一発

「ベストフィットの直線」とは何か。各データ点と直線の「縦のズレ(残差)」の二乗和を最小にする 直線のこと。これが 最小二乗法。

驚くべきことに、線形回帰は 解析解(=連立方程式を解いて閉じた式で答えが出る) が存在する。勾配降下(#015) でぐるぐる回す必要がない。

正規方程式: 行列計算1回で a と b が同時に求まる
Excel の =SLOPE(y範囲, x範囲) と =INTERCEPT(y範囲, x範囲) がこれを内部で計算している
Python なら scikit-learn の LinearRegression().fit() 1行

つまり線形回帰は、「訓練」という言葉を使うほどの作業ですらない。「データを入れたら一発で答えが出る数学的操作」。これが計算速度の異常な速さに繋がっている。

なぜまだ実務で使われ続けているか — 3つの理由

2026年現在、LLM が世界を変えつつあるなかで、線形回帰は 消えるどころか実務での利用が増えている。理由は3つ。

① 速い(=データを入れたら即答)

100万件のデータでも、線形回帰は 1秒以下で fit する。深層学習なら何時間〜何日かかる規模でも、線形回帰は瞬時。リアルタイム性が要る業務(在庫予測、価格推定、需要予測)で第一選択。

② 解釈可能(=なぜその答えか説明できる)

「面積が1m²増えると価格が80万円上がる」と 誰でも理解できる形 で答えが出る。これは深層学習にはできない芸当。

規制業界(金融、医療、保険)では 「AI の判定理由を説明できること」が法律で必須 な場面が多く、説明可能な線形回帰が今でも現役。

③ データが少なくても動く

線形回帰は パラメーター2個(多変量でも数十個)なので、過学習(#019) のリスクが低い。データ100件あれば実用レベル、1,000件あれば十分。深層学習の「数百万件必須」とは別世界。

多変量線形回帰 — 入力を複数にする実用版

実務では入力が1つということはまずない。住宅価格なら 面積 + 築年数 + 駅距離 + 階数 + 角部屋フラグ など。これらを全部入力にした式が 多変量線形回帰。

価格 = a₁ × 面積 + a₂ × 築年数 + a₃ × 駅距離 + a₄ × 階数 + a₅ × 角部屋 + b

パラメーターは 入力1つにつき1つ + bias 1個。10個の入力なら 11パラメーター。それでも GPT-3 の 1,750億パラメーターと比べると桁が違うほど小さい。

これだけでも、住宅価格・売上予測・需要予測・広告 ROI 分析等のビジネス予測の 9割は実用レベル で対応できる。

分類問題への拡張 — ロジスティック回帰

線形回帰は連続値の予測(住宅価格、売上等)向け。分類問題(=YES/NO、買う/買わない) には少し改良が必要。

その改良版が ロジスティック回帰:

線形回帰で出した値を シグモイド関数(活性化関数(#012) 記事参照) に通して、0〜1 の確率に変換
例: 与信判定 → 「貸し倒れ確率 0.03」のように出力
金融、医療診断、不正検知、A/Bテスト分析で広く使われる

名前に「回帰」と入っているが、実体は分類器。「線形回帰 + 活性化関数」の組み合わせは、実は NN の最小単位そのもの。

本質: NN は線形回帰の「積み重ね」

ここで重要な気づき。ニューラルネットワーク(#008) は、線形回帰を活性化関数付きで何層も重ねたもの。

NN の各ニューロン = 「入力の線形結合(線形回帰)+ 活性化関数(#012)」
NN 全体 = それを何層も重ねたもの
つまり、NN は線形回帰の「巨大な階層構造」 として理解できる。

つまり、線形回帰を理解することは、NN の「最小単位」を理解すること。機械学習モデル(#011) の階段で言うと:

線形回帰(2-10パラ): 最小単位
パーセプトロン(#007)(数〜数十パラ): 線形回帰 + ステップ関数
NN(#008)(数百万〜数億パラ): 上記を多層化
GPT-3(#010)(1,750億パラ): NN の Transformer 化 + 超大規模化

線形回帰は LLM の 「先祖」であり、今も同じ枠の中で生きている。LLM が線形回帰を駆逐したわけではなく、用途で住み分けている。

登場人物の反応 ①

大蔵(アシスタントマネージャー・35)

つまり、私の Excel =SLOPE() と =INTERCEPT() は、現代の AI の 最小単位 を13年実装し続けてきた、ということになりますわね。これは 「AI 老舗実装者」 として認定されてしかるべきでは?

川口(アナリスト・22)

大蔵さん、技術的には正確です。=SLOPE/=INTERCEPT は内部で 正規方程式 を解いていて、これは scikit-learn の LinearRegression と同じアルゴリズム。…ちなみに大蔵さんの13年の Excel スキルは、論文に投稿できるレベルのケーススタディとして…(無言で計量経済学の paper を3本タブで開きはじめる)

凡田(チームリーダー・38, 主人公)

俺も広告時代に CPC と CTR の線形回帰 を毎日 Excel で出してて、R²(決定係数) を見ながら「0.7 以下なら直線フィッティング諦める」みたいなルールでやってた。あれ完全に 線形回帰の実務運用 だったんだよな。

御託

フッ、凡田、それは 「線形性の限界」を発見した瞬間 だ。線形回帰が破綻する点で、お前は 非線形性の存在 を体感した。ニーチェ的に言えば 「単純さの彼方」 に出会ったのだ。

大蔵

御託さん、「線形性の限界」 も 「単純さの彼方」 も、今朝の 3D LIVE で配信されていた ご様子ですわね。本日は ニーチェ × Vtuber の融合回ですの?

コンサル業務での実際 — 線形回帰が消えない理由

コンサルの実務で、いつ線形回帰を選び、いつ LLM や深層学習を選ぶか。整理する。

業務	線形回帰が第一選択	深層学習/LLM が必要
売上予測 / 需要予測	⭕ 標準ツール	大量データ + 非線形パターンがある場合のみ
KPI 因果分析	⭕ 説明可能性が必須	不要(むしろ規制で禁止される業界も)
A/B テスト分析	⭕ 統計的標準	不要
与信スコアリング	⭕ ロジスティック回帰(規制対応)	大手では併用、ただし説明用には線形回帰
画像認識(製品検品等)	❌ 不適	⭕ CNN / Transformer
文章要約 / 翻訳	❌ 完全に不適	⭕ LLM 一択
顧客行動予測(数百次元の特徴)	△ 入口として有効	⭕ Gradient Boosting や NN

つまり、「説明可能性 × 計算速度 × データ少での頑健性」 が必要な業務では、線形回帰が今でも勝つ。深層学習が向くのは「画像・音声・自然言語」など 本質的に非線形で大量データがある領域 だけ。

コンサル業界の現実: 提案資料に「線形回帰でロジスティックスコアを算出」と書いてある率は、「AI で予測」と書いてある率の数倍。AI ブームの裏で、線形回帰は静かに業界を支えている。

登場人物の反応 ②

南雲(社長・60-62)

ふむ、つまり 線形回帰こそが業界を静かに支えている、と。…俺の都銀員時代、融資判定の与信スコア は完全にロジスティック回帰だった。あれは 規制で説明責任があるから線形系しか選択肢が無い、と当時の本部から指示が来た覚えがある。

凡田(チームリーダー・38, 主人公)

社長、まさにそれです。金融・医療・保険などの規制業界では、「なぜその判定か」の説明責任が法律 で。深層学習だと説明できないので、いまだに ロジスティック回帰が主流。LLM が来てもこの分野は変わらない可能性が高いです。

赤崎(部長・42)

いいねいいね、線形回帰。…ところで、私の 「ふわっとした方向感」 も、ある意味 「a = 0, b = いいね」 という y = いいね の定数関数として、究極の線形モデルなのでは?

大蔵

あら部長、それは 「線形モデル」 ではなく 「定数モデル」 ですわよ。何を入力しても「いいね」しか出力されない ので、技術的には 「a = 0 で b だけ」の退化したモデル ですわね。決定係数 R² は 確実にゼロ です。

川口

あ、社長、結論として当社の 「説明可能AI 戦略」 として、線形回帰系の手法を提案資料に組み込む3カ年計画を、パワポ350枚 でまとめさせていただきます。…(これで休日12週連続)

南雲

うむ、いいねえ。「線形回帰経営」 も響きがいいな。儲かるんだろ?

KEY TAKEAWAYS

抑えておきたいポイント

線形回帰 = y = ax + b、最も単純な機械学習モデル。パラメーターはたった2個。
解析解(最小二乗法 / 正規方程式)で一発で求まる、勾配降下(#015) 不要。Excel の =SLOPE / =INTERCEPT で2秒。
3大強み: 速い / 解釈可能 / データ少でも動く。これが LLM 時代でも消えない理由。
多変量に拡張すれば、ビジネス予測の9割は実用レベル。
分類向け派生 = ロジスティック回帰。金融・医療の規制業界で標準。
本質: NN は線形回帰の「活性化関数付きで何層も重ねたもの」。線形回帰は LLM の最小単位の祖先。
コンサル感覚: 「説明可能 × 高速 × データ少」 の場面では今も第一選択。AI ブームの裏で静かに業界を支えている。

線形回帰(Linear Regression) — 機械学習の最小単位、シンプルさ故に実務で消えない装置

線形回帰とは — y = ax + b、それだけ

どう a, b を決めるか — 最小二乗法、解析解で一発

なぜまだ実務で使われ続けているか — 3つの理由

① 速い(=データを入れたら即答)

② 解釈可能(=なぜその答えか説明できる)

③ データが少なくても動く

多変量線形回帰 — 入力を複数にする実用版

分類問題への拡張 — ロジスティック回帰

本質: NN は線形回帰の 「積み重ね」

コンサル業務での実際 — 線形回帰が消えない理由

本質: NN は線形回帰の「積み重ね」