残業中の22時、フロアに4人だけ…
凡田(チームリーダー・38, 主人公)

過去にマッチングアプリで嫁とマッチしたとき、相性 99% って出たんですよ。

大蔵(アシスタントマネージャー・35)

あら、それベクトルの内積で計算されたスコアですわよね。

凡田

そう。5項目のプロフィールベクトルが、それぞれ8割以上一致 していて。

大蔵

……(残業中にそれを語る理由は、いずれ深掘りいたしますわ)

22時のフロア、凡田がマッチングアプリの99%画面を懐かしげに眺める、大蔵が冷たい目で見守る
このページのまとめ
  • ベクトルとは、ひとことで言うと 順序が決まった数の並び。たとえば [1.2, -0.4, 0.8] のような形。
  • AI が大事なのは、これが 1つのモノを複数の数で表す道具 だから。文章も画像も、まずこの形にして初めて計算できる。
  • イメージは 「顧客を業界・売上・地域…で並べた1行のスコアシート」。あの横並びの数字こそがベクトル。

「LLM はトークンを ベクトル に変換してから処理する」と聞いて、「ベクトル…?」と引っかかった人向け。

ベクトルは、高校数学に出てきた 「矢印」 のイメージとは少し違う。機械学習の文脈では、ただの 「順序が決まった数のリスト」 に過ぎない。だが、この道具が現代の AI 全体の土台になっている。本記事はベクトルの正体を、仕組み・直感・コンサル業務との接続 の3点で押さえる。

ベクトル = 順序付きの数のリスト

凡田と川口がホワイトボードでベクトルの定義を実演

定義は身も蓋もなくシンプル。

ベクトル = 順序が決まった数のリスト

例:

v1 = [3.2, -1.4]              ← 2次元
v2 = [0.1, 0.5, -0.3]         ← 3次元
v3 = [0.21, -0.43, 0.67, 0.05, ...]  ← N次元(N個の数)

順序が決まっている という点が重要だ。[1, 2][2, 1] は別のベクトル。位置と中身がセットで意味を持つ。

数の個数のことを 次元(dimension) と呼ぶ。2次元、3次元までは「矢印」として図で描けるが、4次元以上は描けない。だが概念としては存在し、機械学習では数千〜数万次元のベクトルが普通に登場する(GPT-3 のトークン埋め込みは 12,288次元)。

直感: 「1つのモノを複数の数字で表現する」道具

なぜわざわざ「順序付きの数のリスト」という概念を使うのか。

理由は単純で、1つのモノに複数の属性があるとき、それをまとめて扱いたいから。

たとえば顧客企業1社を表現したいとする。「会社名」だけでは少なすぎる。実際には:

顧客A = [売上, 業界コード, 従業員数, 地域, 創業年, 成長率, 利益率, ...]

…のような 複数の数値属性のセット が必要になる。これがそのまま「顧客ベクトル」だ。

別の顧客B も同じフォーマットでベクトルにすれば、顧客A と 顧客B の 「近さ」 を計算できる(後述: 内積)。これがレコメンド・類似事例検索・クラスタリングの基盤になる。

コンサル業務にもう一歩寄せる

コンサルが普段やっている仕事の中に、実はベクトルとほぼ同じこと がたくさんある。例:

コンサル業務 これは実質「ベクトル」
顧客プロファイルシート [売上, 業界, 地域, 規模, 成長率, …]
競合比較マトリクス 各競合 = [価格, 品質, シェア, ブランド力, …]
候補人材の評価表 各候補 = [年齢, 経験年数, スキル, 給与, …]
案件パイプライン 各案件 = [確度, 規模, 期間, リソース, …]

「行が1つの対象、列が複数の属性」のシートはすべてベクトルの集まり。エクセルで毎日触っているアレは、数学的にはベクトル群として整理できる。

逆に言えば、機械学習にとっての「ベクトル」は、コンサルにとっての「多軸スコアシート」とほぼ同じ概念。次元が 12,288 と多いだけ。

演算ができる: ベクトル同士で足し引きできる

ベクトルの真価は、演算ができる ことにある。これがただの「数のリスト」を超えて、AI の主役になった理由だ。

足し算と引き算

同じ次元のベクトル同士なら、要素ごとに足したり引いたりできる

v1 = [1, 2, 3]
v2 = [4, 5, 6]

v1 + v2 = [1+4, 2+5, 3+6] = [5, 7, 9]
v1 - v2 = [1-4, 2-5, 3-6] = [-3, -3, -3]

これが「意味の演算」(king – man + woman ≈ queen)の土台になっている。ベクトル空間内では、意味の合成や分解が、ただの足し算と引き算で表現できる

スカラー倍

ベクトル全体に1つの数を掛けると、全要素がその倍数になる。

2 × [1, 2, 3] = [2, 4, 6]

内積(Dot Product)

これが特に強力。2つのベクトルがどれだけ「同じ方向を向いているか」を1つの数値で測れる。詳細は別記事に譲るが、「類似度」を計算する最も基本的な道具 として、検索・推薦・分類のあちこちで使われる。

登場人物の反応 ①
凡田(チームリーダー・38, 主人公)

あー、これ俺、筋トレマニアだった頃に毎日やってたやつだ。自分の体を [体重, 体脂肪率, 除脂肪体重, BCAA摂取量, クレアチン量, タンパク質g, 睡眠時間] みたいに毎朝記録してたんですよ。今思えば、あれが自分ベクトルだったんだな…(遠い目)

赤崎(部長 / AI戦略推進室室長・42)

スーツも同じだよ、凡田くん。私のジャケットは [生地番手, 着丈, ラペル幅, ボタン数, ベント仕様, 裏地カラー] の6次元ベクトルで管理してる。ジーパンと合わせる日はラペル幅が1.5cm狭めじゃないとバランス崩れるんだ、これが。

御託(シニアコンサル・39)

フッ、それは凡庸な多変量解析の話だ。日本酒の世界では [香り強度, 米由来旨味, 酸度, 後味の長さ, 色彩の深み] の5軸で銘柄を空間に布置するのが基本でな。私は銘酒会で常に主成分分析の話を…

大蔵(アシスタントマネージャー・35)

あら、男性陣は趣味のお話で盛り上がってますわね。私の場合は [脱毛サロン月3, エステ月2, 美容院月1, ネイル隔週, サウナ週1-2, 銀座カフェ巡り月8] の6次元で人生を回しておりますの。一次元でも欠けると整いません。

川口(アナリスト・22)

あの、ゲームのキャラステータスって本当にベクトルそのもので…[HP, MP, 攻撃, 防御, 素早さ, 運] の6軸とか普通で、最近のRPGだと20軸超えるんですよ。だから、ぼくにとってベクトルって、AI の話というより…(遠い目)

5人がそれぞれ自分の人生ベクトル(GYM/SUIT/SAKE/BEAUTY/GAME)を頭上に掲げる

トークンとベクトルの関係(LLM 文脈での主役)

LLM の中で起きていることに引き戻すと、トークン1つひとつがベクトルに変換されてから、すべての処理が始まる

トークン 「king」  →  ベクトル [0.21, -0.43, 0.67, 0.05, ..., 0.13]
                                         ↑ 12,288 個の数

この対応関係は 埋め込み(Embedding) と呼ばれ、別記事で深掘りする。

ここで覚えておきたいのは2点だけ。

  1. LLM は文字列を直接扱わない。必ず一度ベクトルに変換してから処理する
  2. ベクトル化されたあとは、足し算・引き算・内積 などの数学的演算がすべて可能になる

つまりベクトルは、「テキスト」という人間的なものと、「数値計算」という機械的なもの の橋渡し をしている。ここが現代 AI の最大の発明と言ってもいい。

登場人物の反応 ②
南雲(社長・60-62)

ふむ、人を数値で表現するというのは、私の都銀時代に近いな。融資審査のときに、貸出先の会社を [自己資本比率, 流動比率, 利益率, 業歴, 経営者の学歴, ……] と並べて評価した。…銀行の与信モデルは、要するにベクトルだったのか。

赤崎(部長 / AI戦略推進室室長・42)

社長、おっしゃる通りで、ふわっとした方向感としては、今のAI もその与信モデルを大規模に拡張したものでして…

凡田(チームリーダー・38, 主人公)

部長、社長、ちょっと怖いんですけど、転職市場でぼくが今ベクトル化されたら [年齢38, 広告→コンサル経験, 専門なし, 事業立ち上げ経験ゼロ] とかで、評価がガタガタ落ちる気がするんですが…

御託(シニアコンサル・39)

フッ、お前は心配することがないだろう。私のベクトルは [外資系経験あり, MBA志望, ロン毛, 哲学書多読, 銘酒会会員] で、転職市場では…(突然黙る)

大蔵(アシスタントマネージャー・35)

あら、御託さん、その「MBA志望」は3年連続で未達成じゃないですの?ベクトルに「未達」フラグが追加されますわよ?

川口(アナリスト・22)

あの、ぼく、転職サイトの「あなたへのおすすめ求人」って、たぶん候補者ベクトルと求人ベクトルの内積で推薦されてるんですよ…(無言で自分のキャリアダッシュボードを開く)

南雲(社長・60-62)

…川口くん、君は自分のキャリアダッシュボードを持っているのか?

社長室で各人のキャリアベクトルがダッシュボードに並び、6人が反応する