この Excel、13年分の接客データですのよ。セル1個 はただの数字。横一列 にすると「お客様1人の記録」。縦横の表 にすると「1ヶ月分」。それを 月ごとのシートで重ねれば「1年分」。…こうして、どんどん次元が増えていきますの。
大蔵さん、それ まさに 「テンソル」 の話 ですよ。AI が扱うデータって、全部その「数を多次元に並べた箱」なんです。次元の数で呼び名が変わるだけで。
あら、私の Excel が 最先端のAI と同じ仕組み?
構造は本当にそうです。数字1個が スカラー、1列が ベクトル、表が 行列、それを重ねた箱が テンソル。写真だって 「縦 × 横 × 色」 の3次元テンソルですし。AI の計算は、結局この箱を変形して掛け合わせてるだけなんです。

- テンソル = 数を多次元に並べた「箱」の総称。次元の数で呼び名が変わるだけ ── 0次元=スカラー(ただの数)/ 1次元=ベクトル(数の並び)/ 2次元=行列(表)/ 3次元以上=テンソル。
- AI が扱うデータは 全部テンソル。文章 = トークン × 意味の次元(2次元)、画像 = 縦 × 横 × 色(3次元)、それらをまとめて処理する バッチ でもう1次元増える(4次元)。
- AI の計算の正体は、このテンソルを変形・掛け合わせる作業。実装で最初につまずくのは 「形(shape)を合わせる」 こと。GPU や PyTorch 等のライブラリは全部テンソル演算で動く。
ベクトル (#004)、行列、テンソル ── 名前は違うが、正体はどれも「数を並べた箱」で、違うのは 並べる 「方向(次元)」 がいくつあるか だけだ。AI のデータも計算も、すべてこの箱の上で動いている。
定義 — 次元の数で名前が変わる「数の箱」
テンソルは、難しい新概念ではない。「数をいくつの方向に並べるか」で名前が変わる、それだけだ:
| 次元(方向の数) | 名前 | イメージ | 例 |
|---|---|---|---|
| 0次元 | スカラー | ただの数1個 | 7(点) |
| 1次元 | ベクトル | 数を1列に並べる | [7, 3, 5](線) |
| 2次元 | 行列 | 縦×横の表 | Excel の1シート(面) |
| 3次元以上 | テンソル | 表をさらに重ねた箱 | シートを重ねたブック(立体) |
厳密には スカラーもベクトルも行列も、すべて 「テンソル」 の仲間(それぞれ0階・1階・2階のテンソル)。日常では「3次元以上の箱」を指してテンソルと呼ぶことが多い、というだけだ。大蔵の Excel で言えば、セル → 行 → シート → 複数シートのブック と 「方向」 を足していくのが、次元を1つずつ増やすこと。
AI のデータは全部テンソル
なぜ AI でテンソルがそんなに大事なのか。理由は単純で、AI が食べるデータも、吐き出す結果も、途中の計算も、全部テンソルの形をしている からだ。代表例:
- 文章 = 2次元テンソル。各トークン (#003) が意味のベクトル (#002) になり、それがトークンの数だけ並ぶ。「トークン数 × 意味の次元数」の表。
- 画像 = 3次元テンソル。「縦の画素 × 横の画素 × 色(赤・緑・青)」。1枚の写真が、数のぎっしり詰まった立方体になる。
- バッチ = さらに +1次元。AI は効率のため、データを 何枚もまとめて(バッチで) 一気に処理する。文章を32本まとめれば「32 × トークン数 × 意味の次元数」の3次元、画像を32枚なら4次元テンソルになる。
そして アテンション(#030) も MLP(#037) も、中でやっているのは テンソルどうしの掛け算と変形。AI の計算の正体は、巨大なテンソルを次々に変形していく流れ作業 だと言ってしまっていい。
実装の肝は「形(shape)を合わせる」こと
テンソルには 「形(shape)」 がある。「32 × 128 × 768」のように、各方向に何個あるか を並べたものだ。AI の実装でいちばん最初につまずくのが、この 形の不一致 ── 掛け合わせたい2つのテンソルの形が噛み合わず、エラーになる。
逆に言えば、「データの形を正しく揃える」ことが、AI を動かす作業の半分 を占める。PyTorch / TensorFlow といった主要ライブラリも、GPU も、このテンソルの形を高速に変形・計算するために作られている。「AI エンジニアの仕事の多くは、テンソルの形と格闘すること」と言われるほどだ。
コンサル感覚 — データは 「形」 で持つと強い
本記事の核心メッセージは 「データは 「数の集まり」 ではなく 「形を持った箱」 として捉えると、扱いが一気に楽になる」。大蔵の多シート Excel と同じで、実務でもこの感覚は効く:
① 「次元を足す」 発想でデータを設計する: 1顧客の記録(行)→ 全顧客の表(シート)→ 月ごとに重ねる(ブック)。後から 「店舗ごと」「年ごと」 と次元を足せる形 で持っておくと、集計も比較も崩れない。最初から平らに潰したデータは、後で詰む。
② AI 案件で最初に効くのは 「データの形」 を揃えること: クライアントの業務 AI が動かない原因の多くは、モデルではなく 入力データの形がバラバラ(列の数・順序・欠損)なこと。「まず形を揃える」だけで動き出す案件は多い。地味だが、ここが土台。
③ クライアント説明の一言: 「テンソルって何ですか?」と聞かれたら、「Excel の多次元版です。数字 → 1行 → 表 → 重ねたブック、と次元を増やしていった箱のこと。AI のデータも計算も、全部この箱の上で動いてます」 と返せる。大蔵の Excel が、そのまま最良の説明になる。
フッ、テンソルか。私のオーディオで言えば、左右2chの音の波形が時間方向に並ぶ ── あれも立派な 2次元テンソル だ。STAX で聴く推しの配信音声も、突き詰めれば数を並べた箱に過ぎん。…まあ、箱の中身の 「音の良さ」 は、Mark Levinson でないと出ないがね。
そうなんです、音声も 「時間 × チャンネル」 のテンソルです。AI から見れば、文章も画像も音声も 「形の違うテンソル」 でしかなくて、だから1つのモデルで全部扱えるんですよね(マルチモーダル (#034))。
(つまり私の13年分の Excel も、写真も、御託さんのレコードも、AI から見れば 同じ 「箱」 …。なんだか、自分の地道な表計算が、急に最先端っぽく思えてきましたわ。)
