昼下がりの店頭、大蔵が後輩に接客の機微を教えている…
大蔵(アシスタントマネージャー・35)

接客でね、お客様の「結構です」は要注意ですのよ。試着をお勧めして「結構です」なら 「要らない」。お会計でお釣りをお渡しして「結構です」なら 「これで充分・満足」。同じ三文字が、前後と状況で まるで正反対。私たちはそれを 文脈で読み分けて いますの。

川口(アナリスト・22)

大蔵さん、それ AIの 「文脈吸収」 とそっくり です。AIも単語の意味を 固定では持っていなくて、前後の文脈を吸って意味を変えるんです。「あつい」がコーヒーなら熱い、天気なら暑い、本なら厚い、みたいに。

大蔵

あら、AIも 「空気を読む」 んですの?

川口

「読む」 というより、前後の単語を混ぜて、その語のベクトルを更新 してるんです。気持ちを汲むわけではなくて、あくまで計算で。…で、その「混ぜる」仕組みこそが、アテンション (#030) なんですよ。

店頭で大蔵が後輩に接客を教えながら、お客様の『結構です』が文脈で正反対の意味になることを指で示し、川口が『それがAIの文脈吸収です』と説明している図
この記事の要約(3行)
  • 単語の意味は 固定ではない。「あつい」は、コーヒーなら熱い・天気なら暑い・本なら厚い ── 前後の文脈を 「吸って」 はじめて、意味が決まる。これが文脈吸収。
  • 辞書を引いただけの 静的な埋め込み では、一語多義を扱えない。文脈吸収は、その語のベクトルを 周りの語を混ぜて更新 することで、これを解決する。
  • その「混ぜる」役こそ アテンション。同じ単語のベクトルが、層を通るたびに周りの文脈を吸って 意味を更新していく ── これが、現代のLLMが文脈を理解できる核心。

埋め込み (#002) では、単語が空間の 「点」 になった。だが、ここまでの話には 大きな穴 がある。「あつい」のように、同じ単語でも文脈でまるで意味が違う語 を、固定の1点で表せるはずがない。本記事は、その穴を埋める仕組み ── 文脈吸収 を扱う。

定義 — 単語の意味は「固定」ではない

「あつい」という単語を、ひとつ思い浮かべてほしい。これだけでは、意味が 決まらない。前後にどんな言葉が来るかで、意味が割れる:

同じ「あつい」が、前後の文脈に 引っぱられて、別の意味に着地している。大蔵の「結構です」と、まったく同じ構造だ。意味は単語そのものに固定されているのではなく、文脈と合わさってはじめて決まる ── これが文脈吸収の出発点だ。

中央の単語『あつい』から3本の矢印が伸び、文脈『コーヒーが』→熱い、『今日は〜から上着を脱ぐ』→暑い、『〜辞書をめくる』→厚い、と同じ単語が前後の文脈で別の意味に寄せられる様子を示す図

図1: 「あつい」単体では意味があいまい。前後の文脈が、同じ単語を別の意味へ 「寄せる」。単語の意味は固定ではない

仕組み — アテンションが「周りの語」を混ぜる

では、AIはどうやって文脈を吸うのか。鍵は 「単語のベクトルは、固定の辞書値のままではない」 という点だ。

最初、「あつい」は辞書を引いただけの 静的なベクトル(意味あいまい)として入ってくる。それが アテンション(#030) の層を通るたびに、周りの単語(「コーヒー」「が」「湯気」…)の情報を混ぜ込まれ、ベクトルが更新される。「コーヒー」や「湯気」を吸った「あつい」は、「熱い(温度)」 の方向へ寄った ベクトルに化ける。これが、文脈を吸収するということだ。

文脈吸収の仕組みの図。①辞書を引いただけの静的な『あつい』(意味あいまい)→②アテンション層で周りの語(コーヒー・が・湯気)を混ぜる→③文脈を吸収した『あつい=熱い』に意味が確定、という3段階の流れを示す

図2: 静的なベクトル → アテンションが周りの語を混ぜる → 文脈を吸収して意味が確定。単語ベクトルは固定ではなく、層ごとに更新されていく

これが、いわゆる 「静的な埋め込み」から「文脈に応じた表現」への進化 だ。昔の方式は、単語ごとに1つの固定ベクトルしか持てなかった(「あつい」は常に同じ点)。いまのLLMは、同じ単語でも、文ごとに違うベクトル を持てる。だから一語多義を、文脈で正しく捌ける。

だから何が嬉しいのか

文脈吸収ができると、AIは 「言葉の表面」ではなく「その場での意味」 を扱えるようになる:

ここで 前回の 「方向=意味」 (#049) とつながる。静的な埋め込みは「単語の住所」を固定で持つ地図だった。文脈吸収は、その住所を、文脈に応じて少しずつ動かす 仕組みだと言える。地図は同じでも、立つ位置が文ごとに変わる

コンサル感覚 — 「言葉だけ見ても、意味は分からない」

本記事の核心メッセージは 「意味は、単語そのものではなく 「文脈とセット」 で決まる」。大蔵の接客がそうだったように、この視点は実務でも効く:

① クライアントの言葉は、文脈ごと拾う: 議事録で「検討します」の一語だけ切り出しても、前向きか先送りか分からない。その前後・場の空気・力関係まで含めて はじめて意味が取れる。AIの文脈吸収は、この当たり前を計算で再現したものだ。

② AIへの指示も 「文脈ごと」 与える: 同じ単語でも文脈で意味が変わる以上、AIに曖昧な一語だけ投げると、想定と違う方向に 「吸って」 しまう。背景・前提・例をセットで渡す(プロンプト (#043) 設計)ほど、狙った意味に着地する。

③ ただし「空気を読んでいる」わけではない: AIは前後の語を 計算で混ぜている だけで、人間のように相手の気持ちや事情を汲んでいるのではない。クライアントに説明するときは、「文脈を計算で取り込む」=便利だが万能ではない と添えると、過度な期待を避けられる。

夕方の給湯室、文脈の話が広がって…
凡田(チームリーダー・38)

分かるなあ。うちのチームの「大丈夫です」も、文脈次第でね。締め切り前の「大丈夫」は、だいたい大丈夫じゃない(笑)。前後の様子で読むしかないんだ。

大蔵

あら、リーダーも立派に文脈を吸ってらっしゃる。言葉そのものより、その場の流れですわよね。

川口

そこは似てるんですけど、AIがやってるのは 「計算で前後を混ぜてる」 だけ で、人間みたいに相手の気持ちや事情を汲んでるわけじゃないんです。似て非なる、っていうのが大事なところで。

夕方の給湯室で、凡田が苦笑いしながら部下の『大丈夫です』の話をし、大蔵が共感し、川口が『AIは計算で混ぜてるだけ』と補足している3人の図