文脈吸収 — 同じ単語の意味が、前後の文脈で変わる仕組み

昼下がりの店頭、大蔵が後輩に接客の機微を教えている…

大蔵(アシスタントマネージャー・35)

接客でね、お客様の「結構です」は要注意ですのよ。試着をお勧めして「結構です」なら 「要らない」。お会計でお釣りをお渡しして「結構です」なら 「これで充分・満足」。同じ三文字が、前後と状況で まるで正反対。私たちはそれを 文脈で読み分けて いますの。

川口(アナリスト・22)

大蔵さん、それ AIの「文脈吸収」とそっくり です。AIも単語の意味を 固定では持っていなくて、前後の文脈を吸って意味を変えるんです。「あつい」がコーヒーなら熱い、天気なら暑い、本なら厚い、みたいに。

大蔵

あら、AIも「空気を読む」んですの?

川口

「読む」というより、前後の単語を混ぜて、その語のベクトルを更新 してるんです。気持ちを汲むわけではなくて、あくまで計算で。…で、その「混ぜる」仕組みこそが、アテンション (#030) なんですよ。

この記事の要約(3行)

単語の意味は 固定ではない。「あつい」は、コーヒーなら熱い・天気なら暑い・本なら厚い ── 前後の文脈を「吸って」はじめて、意味が決まる。これが文脈吸収。
辞書を引いただけの 静的な埋め込み では、一語多義を扱えない。文脈吸収は、その語のベクトルを 周りの語を混ぜて更新 することで、これを解決する。
その「混ぜる」役こそ アテンション。同じ単語のベクトルが、層を通るたびに周りの文脈を吸って 意味を更新していく ── これが、現代のLLMが文脈を理解できる核心。

埋め込み (#002) では、単語が空間の「点」になった。だが、ここまでの話には 大きな穴 がある。「あつい」のように、同じ単語でも文脈でまるで意味が違う語 を、固定の1点で表せるはずがない。本記事は、その穴を埋める仕組み ── 文脈吸収 を扱う。

定義 — 単語の意味は「固定」ではない

「あつい」という単語を、ひとつ思い浮かべてほしい。これだけでは、意味が 決まらない。前後にどんな言葉が来るかで、意味が割れる:

「コーヒーが あつい」→ 熱い(温度)
「今日は あつい から上着を脱ぐ」→ 暑い(気温)
「あつい 辞書をめくる」→ 厚い(分厚い)

同じ「あつい」が、前後の文脈に 引っぱられて、別の意味に着地している。大蔵の「結構です」と、まったく同じ構造だ。意味は単語そのものに固定されているのではなく、文脈と合わさってはじめて決まる ── これが文脈吸収の出発点だ。

中央の単語『あつい』から3本の矢印が伸び、文脈『コーヒーが』→熱い、『今日は〜から上着を脱ぐ』→暑い、『〜辞書をめくる』→厚い、と同じ単語が前後の文脈で別の意味に寄せられる様子を示す図

図1: 「あつい」単体では意味があいまい。前後の文脈が、同じ単語を別の意味へ「寄せる」。単語の意味は固定ではない

仕組み — アテンションが「周りの語」を混ぜる

では、AIはどうやって文脈を吸うのか。鍵は 「単語のベクトルは、固定の辞書値のままではない」 という点だ。

最初、「あつい」は辞書を引いただけの 静的なベクトル(意味あいまい)として入ってくる。それがアテンション(#030) の層を通るたびに、周りの単語(「コーヒー」「が」「湯気」…)の情報を混ぜ込まれ、ベクトルが更新される。「コーヒー」や「湯気」を吸った「あつい」は、「熱い(温度)」の方向へ寄った ベクトルに化ける。これが、文脈を吸収するということだ。

文脈吸収の仕組みの図。①辞書を引いただけの静的な『あつい』(意味あいまい)→②アテンション層で周りの語(コーヒー・が・湯気)を混ぜる→③文脈を吸収した『あつい=熱い』に意味が確定、という3段階の流れを示す

図2: 静的なベクトル → アテンションが周りの語を混ぜる → 文脈を吸収して意味が確定。単語ベクトルは固定ではなく、層ごとに更新されていく

これが、いわゆる 「静的な埋め込み」から「文脈に応じた表現」への進化 だ。昔の方式は、単語ごとに1つの固定ベクトルしか持てなかった(「あつい」は常に同じ点)。いまのLLMは、同じ単語でも、文ごとに違うベクトル を持てる。だから一語多義を、文脈で正しく捌ける。

だから何が嬉しいのか

文脈吸収ができると、AIは 「言葉の表面」ではなく「その場での意味」 を扱えるようになる:

一語多義を解ける: 「あつい」「結構です」「やばい」のような、文脈で意味が割れる語を、取り違えずに処理できる。
指す相手を追える: 「課長がそれを承認した。彼は…」の「彼」が誰か、文脈を吸って結びつける(照応の解決)。
同じ問いでも場面で答えを変えられる: 前の会話を文脈として吸うから、続きの一言の意味を取り違えない。

ここで 前回の「方向=意味」 (#049) とつながる。静的な埋め込みは「単語の住所」を固定で持つ地図だった。文脈吸収は、その住所を、文脈に応じて少しずつ動かす 仕組みだと言える。地図は同じでも、立つ位置が文ごとに変わる。

コンサル感覚 — 「言葉だけ見ても、意味は分からない」

本記事の核心メッセージは 「意味は、単語そのものではなく「文脈とセット」で決まる」。大蔵の接客がそうだったように、この視点は実務でも効く:

① クライアントの言葉は、文脈ごと拾う: 議事録で「検討します」の一語だけ切り出しても、前向きか先送りか分からない。その前後・場の空気・力関係まで含めて はじめて意味が取れる。AIの文脈吸収は、この当たり前を計算で再現したものだ。

② AIへの指示も「文脈ごと」与える: 同じ単語でも文脈で意味が変わる以上、AIに曖昧な一語だけ投げると、想定と違う方向に「吸って」しまう。背景・前提・例をセットで渡す(プロンプト (#043) 設計)ほど、狙った意味に着地する。

③ ただし「空気を読んでいる」わけではない: AIは前後の語を 計算で混ぜている だけで、人間のように相手の気持ちや事情を汲んでいるのではない。クライアントに説明するときは、「文脈を計算で取り込む」=便利だが万能ではない と添えると、過度な期待を避けられる。

夕方の給湯室、文脈の話が広がって…

凡田(チームリーダー・38)

分かるなあ。うちのチームの「大丈夫です」も、文脈次第でね。締め切り前の「大丈夫」は、だいたい大丈夫じゃない(笑)。前後の様子で読むしかないんだ。

大蔵

あら、リーダーも立派に文脈を吸ってらっしゃる。言葉そのものより、その場の流れですわよね。

川口

そこは似てるんですけど、AIがやってるのは 「計算で前後を混ぜてる」だけ で、人間みたいに相手の気持ちや事情を汲んでるわけじゃないんです。似て非なる、っていうのが大事なところで。

Takeaways

4行で整理

単語の意味は固定ではない。「あつい」=コーヒーなら熱い/天気なら暑い/本なら厚い。前後の文脈を吸ってはじめて意味が決まる=文脈吸収。
静的な埋め込み(辞書引き)は一語多義を扱えない。文脈吸収は、その語のベクトルを周りの語を混ぜて更新することで解決する。
混ぜる役はアテンション。同じ単語のベクトルが層ごとに周りの文脈を吸って更新され、文ごとに違うベクトルを持てる ── これが現代LLMの核心。
コンサル感覚: 意味は「文脈とセット」で決まる。AIへの指示も背景ごと渡すほど狙い通りに。ただしAIは計算で混ぜるだけで、気持ちを汲んでいるわけではない。