昼下がりの執務室、大蔵が13年分の巨大な Excel ブックを開いている…
大蔵(アシスタントマネージャー・35)

この Excel、13年分の接客データですのよ。セル1個 はただの数字。横一列 にすると「お客様1人の記録」。縦横の表 にすると「1ヶ月分」。それを 月ごとのシートで重ねれば「1年分」。…こうして、どんどん次元が増えていきますの。

川口(アナリスト・22)

大蔵さん、それ まさに 「テンソル」 の話 ですよ。AI が扱うデータって、全部その「数を多次元に並べた箱」なんです。次元の数で呼び名が変わるだけで。

大蔵

あら、私の Excel が 最先端のAI と同じ仕組み?

川口

構造は本当にそうです。数字1個が スカラー、1列が ベクトル、表が 行列、それを重ねた箱が テンソル。写真だって 「縦 × 横 × 色」 の3次元テンソルですし。AI の計算は、結局この箱を変形して掛け合わせてるだけなんです。

執務室で大蔵が巨大な多シートのExcelブックをノートPCで開き、セル→行→表→重ねたシートと次元が増えていく様子を指し示し、川口が『それがテンソル』と説明している図
この記事の要約(3行)
  • テンソル = 数を多次元に並べた「箱」の総称。次元の数で呼び名が変わるだけ ── 0次元=スカラー(ただの数)/ 1次元=ベクトル(数の並び)/ 2次元=行列(表)/ 3次元以上=テンソル
  • AI が扱うデータは 全部テンソル。文章 = トークン × 意味の次元(2次元)、画像 = 縦 × 横 × 色(3次元)、それらをまとめて処理する バッチ でもう1次元増える(4次元)。
  • AI の計算の正体は、このテンソルを変形・掛け合わせる作業。実装で最初につまずくのは 「形(shape)を合わせる」 こと。GPU や PyTorch 等のライブラリは全部テンソル演算で動く。

ベクトル (#004)、行列、テンソル ── 名前は違うが、正体はどれも「数を並べた箱」で、違うのは 並べる 「方向(次元)」 がいくつあるか だけだ。AI のデータも計算も、すべてこの箱の上で動いている。

定義 — 次元の数で名前が変わる「数の箱」

テンソルは、難しい新概念ではない。「数をいくつの方向に並べるか」で名前が変わる、それだけだ:

次元(方向の数) 名前 イメージ
0次元 スカラー ただの数1個 7(点)
1次元 ベクトル 数を1列に並べる [7, 3, 5](線)
2次元 行列 縦×横の表 Excel の1シート(面)
3次元以上 テンソル 表をさらに重ねた箱 シートを重ねたブック(立体)

厳密には スカラーもベクトルも行列も、すべて 「テンソル」 の仲間(それぞれ0階・1階・2階のテンソル)。日常では「3次元以上の箱」を指してテンソルと呼ぶことが多い、というだけだ。大蔵の Excel で言えば、セル → 行 → シート → 複数シートのブック と 「方向」 を足していくのが、次元を1つずつ増やすこと。

スカラー(0次元・点)→ベクトル(1次元・数の並び)→行列(2次元・表)→テンソル(3次元・立方体)と、次元が1つずつ増えていく様子を、点・線・面・立体の図で段階的に示す

図1: 数を並べる 「方向」 を1つずつ足していくと、スカラー → ベクトル → 行列 → テンソル。どれも「数を並べた箱」で、違いは次元の数だけ

AI のデータは全部テンソル

なぜ AI でテンソルがそんなに大事なのか。理由は単純で、AI が食べるデータも、吐き出す結果も、途中の計算も、全部テンソルの形をしている からだ。代表例:

AIのデータがテンソルである例の図解。文章=トークン×意味次元の2次元テンソル、画像=縦×横×色の3次元テンソル、バッチ=それらを複数まとめて+1次元、の3つを並べて図示

図2: AI のデータは全部テンソル。文章(2次元)・画像(3次元)・それらをまとめたバッチ(+1次元)。「形」 は違っても、すべて数を並べた箱

そして アテンション(#030)MLP(#037) も、中でやっているのは テンソルどうしの掛け算と変形。AI の計算の正体は、巨大なテンソルを次々に変形していく流れ作業 だと言ってしまっていい。

実装の肝は「形(shape)を合わせる」こと

テンソルには 「形(shape)」 がある。「32 × 128 × 768」のように、各方向に何個あるか を並べたものだ。AI の実装でいちばん最初につまずくのが、この 形の不一致 ── 掛け合わせたい2つのテンソルの形が噛み合わず、エラーになる。

逆に言えば、「データの形を正しく揃える」ことが、AI を動かす作業の半分 を占める。PyTorch / TensorFlow といった主要ライブラリも、GPU も、このテンソルの形を高速に変形・計算するために作られている。「AI エンジニアの仕事の多くは、テンソルの形と格闘すること」と言われるほどだ。

コンサル感覚 — データは 「形」 で持つと強い

本記事の核心メッセージは 「データは 「数の集まり」 ではなく 「形を持った箱」 として捉えると、扱いが一気に楽になる」。大蔵の多シート Excel と同じで、実務でもこの感覚は効く:

① 「次元を足す」 発想でデータを設計する: 1顧客の記録(行)→ 全顧客の表(シート)→ 月ごとに重ねる(ブック)。後から 「店舗ごと」「年ごと」 と次元を足せる形 で持っておくと、集計も比較も崩れない。最初から平らに潰したデータは、後で詰む。

② AI 案件で最初に効くのは 「データの形」 を揃えること: クライアントの業務 AI が動かない原因の多くは、モデルではなく 入力データの形がバラバラ(列の数・順序・欠損)なこと。「まず形を揃える」だけで動き出す案件は多い。地味だが、ここが土台。

③ クライアント説明の一言: 「テンソルって何ですか?」と聞かれたら、「Excel の多次元版です。数字 → 1行 → 表 → 重ねたブック、と次元を増やしていった箱のこと。AI のデータも計算も、全部この箱の上で動いてます」 と返せる。大蔵の Excel が、そのまま最良の説明になる。

夕方の給湯室、「次元」 の話が広がって…
御託(シニアコンサル・39)

フッ、テンソルか。私のオーディオで言えば、左右2chの音の波形が時間方向に並ぶ ── あれも立派な 2次元テンソル だ。STAX で聴く推しの配信音声も、突き詰めれば数を並べた箱に過ぎん。…まあ、箱の中身の 「音の良さ」 は、Mark Levinson でないと出ないがね。

川口

そうなんです、音声も 「時間 × チャンネル」 のテンソルです。AI から見れば、文章も画像も音声も 「形の違うテンソル」 でしかなくて、だから1つのモデルで全部扱えるんですよね(マルチモーダル (#034))。

大蔵

(つまり私の13年分の Excel も、写真も、御託さんのレコードも、AI から見れば 同じ 「箱」 …。なんだか、自分の地道な表計算が、急に最先端っぽく思えてきましたわ。)

夕方の給湯室で、御託が両手で波形のような形を作って音声テンソルを語り、川口がタブレットで文章・画像・音声が同じ箱だと示し、大蔵がノートPCのExcelを見て妙に誇らしげな表情をしている3人の図