山田さん、今日のあなたの動きを 1分で。午前はA社パワポの体裁整え、12時にB部長へ挨拶メール、12:30から銀座でランチ同行、午後は私の隣で待機。質問は 3分以内に1問 ですわよ。…はじめて。
(…あれ、これ完璧な ChatGPT プロンプト じゃないか?タスク・制約・期待形式 の3要素が全部揃ってる。)
あら凡田さん、おはようございます。…ChatGPT?新人への指示 と AI への指示が同じ構造?まあ、曖昧に頼めば曖昧に返ってくる、というのは 指示の出し方の話 ですわね、ホホ。
(大蔵さん、20年の接客で 最強のプロンプトエンジニアリング を体得してたのか…。)

- プロンプトとは、ひとことで言えば AI に毎回ゼロから手渡す 「1回限りの指示文」。イメージは、新人にその場で渡す1回分の指示書。
- これが AI の出力を支配する最大の武器。曖昧な指示なら曖昧な答え、具体的な指示なら具体的な答えが返る — 指示の質がそのまま結果の質になる。
- 良い指示の 本質は3要素。タスク(何をするか)・制約(やってはいけないこと)・期待する形式(どう返してほしいか) を渡せば、ぶれない答えに近づく。
ChatGPT や Claude を触ったことがある人は、すでにプロンプトを書いている。「質問の本文」、「指示文」、「アシスタントへのメッセージ」 — 名前は色々あるが、全部同じもの。プロンプトという用語は LLM がそれを受け取って次の応答を生成する直前までの 「入力全部」 を指す。
本記事の主張: 「プロンプトの良し悪し = AI 出力の良し悪しの8割を決める」。モデル選択やパラメータ調整より、まずプロンプトを整える方が遥かにレバレッジが効く。大蔵の 「新人への1分指示書」 がそれを直感的に示している。
定義 — LLM に毎回ゼロから渡す 「1回限りの指示文」
言葉の定義をシンプルに:
- プロンプト(Prompt) = LLM に渡す テキスト入力の全体。ユーザーが書く本文、添付した文書、過去の会話履歴(チャット形式の場合)、システムプロンプト(後述)、全部含む。
- 「1回限り」 がポイント: プロンプトを変えても モデル自体は変わらない。次の質問でも、また最初から指示を書き直す必要がある(チャット履歴がコンテキストに残っている間は別)。
- 「ゼロから」: LLM は前回の会話を覚えていない(別セッション or コンテキスト切り捨て後は)。だから 「今日の指示書を朝に1分で渡す」 イメージが正確。
良いプロンプトの本質3要素 — 大蔵の 「1分指示書」 を分解する
大蔵が山田さんに渡した1分の指示書を、プロンプト構造に当てはめて分解すると次のようになる:
| 要素 | 大蔵の指示 | LLM プロンプトでの対応 |
|---|---|---|
| ① タスク(何をする) | 「午前A社パワポ整え / 昼メール / ランチ同行 / 午後待機」 | 「以下の事業計画を読み、3つの観点で評価してください」 |
| ② 制約(やってはいけない) | 「本文は触らない / 件名は固定 / 注文は私が決めるまで待つ」 | 「500字以内で / 専門用語は使わず / 個人名は伏せて」 |
| ③ 期待形式(どう返す) | 「質問は各タスク終わり3分以内に1問だけ」 | 「箇条書きで3項目 / 表形式で / JSON で返してください」 |
この3要素のうち どれかが抜けると、出力の質が一段落ちる。指示の構造の問題 として、人への依頼でも AI への依頼でも変わらない原則。
+α 役割設定(任意・トーン調整目的) — 「都市伝説寄り」 のテクニック
4つ目に 「役割」(あなたは○○として) を入れるテンプレートが世間で広まっているが、精度向上効果は近年の研究で限定的 と判明しつつある。「あなたは経験10年のベンチャー投資家です」と書いても、ベンチマークで有意な精度向上は出にくい。
| +α 任意要素 | 大蔵の指示 | LLM プロンプトでの対応 |
|---|---|---|
| 役割(誰として) ※精度向上効果は限定的、主に トーン調整 用途 |
「あなたは私の直属の補佐役として」 | 「あなたは経験豊富なマーケティングコンサルタントです」 |
とはいえ役割設定が無意味なわけではない: (a) 出力の文体・口調が 「それっぽく」 変わる(専門家風、教師風、フランク風)、(b) 専門分野の関連語彙が引かれやすくなる、(c) 出力の長さや構造が暗黙に揃う、という間接的な恩恵がある。なので、トーンや文体を整える 「微調整つまみ」 として使う のが正確な位置付け。
「曖昧に指示すると曖昧に動く」 — 悪いプロンプトの例
悪いプロンプトの典型:
「事業計画について教えて。」
これだと LLM は「何の事業計画?」「どの観点?」「誰向けの答え?」「どんな形式で?」と 無数の解釈の余地 を持ったまま、適当な平均値を出力する。大蔵が新人に「今日、適当によろしく」と言ったら、結果も適当になるのと同じ。
ただし2026年現在は事情が少し変わってきた。Claude Opus 4.7 / GPT-5 / Gemini 1.5 Pro 等の最新世代は 推論能力(明示的な指示なしでも内部で段階推論する Chain-of-Thought) が大きく進んでおり、曖昧な質問でも ユーザーの意図を推察 して複数の解釈で答えたり、不明点を聞き返して くる挙動が一般化している。「事業計画について教えて」に対しても、「どの業界の?」 「どの段階の?」 「誰に説明する想定?」 と LLM 側から先回りで聞いてくる場合がある。「とりあえず投げてみる」 戦略も以前より遥かに有効。
とはいえ、本質3要素を最初から揃える方が 対話の往復が減って高速 & 高精度 に着地する、という効率の差は依然として残る。「良いプロンプト」 の位置付けは 「正解を引き出すための呪文」から「時短のための型」 に変わってきた、と捉えると現実的。
良いプロンプトに書き直すと:
以下の事業計画を読み、3つの観点(市場性 / 競合優位 / 収益性)で評価してください。(①タスク)
専門用語は避け、各観点 200字以内で。(②制約)
最後に総合スコア 0〜100 を1つ添えてください。形式は表で。(③期待形式)
(お好みで:あなたは経験10年のベンチャー投資家です。(+α 役割・任意のトーン調整))[事業計画書本文を貼り付け]”
これだけで 同じモデル、同じパラメータ でも出力の質が劇的に変わる。プロンプトエンジニアリングが 「8割のレバレッジ」 と言われる根拠。役割設定はあってもなくても精度はほぼ同じ、ただし 文体は明確に変わる。
ファインチューニングとの違い — 永続OJTか、1分指示書か
プロンプトと混同されやすいのが ファインチューニング (#027)。両者は 「AI を狙った動作にカスタマイズする」 という目的 は同じだが、仕組みがまったく違う。
| 軸 | プロンプト | ファインチューニング |
|---|---|---|
| 大蔵の例で言うと | 朝1分の 「今日の指示書」 | 3週間の OJT、身体で覚えさせる |
| モデルへの影響 | 変えない(毎回入力のみで動作変更) | モデル自体の重みを書き換える |
| 持続性 | その1回のみ、次回は再入力 | 永続的(訓練済みになる) |
| コスト | API1回分(数円〜数十円) | 数万円〜数百万円(GPU 訓練) |
| 速度 | 即時(数秒) | 数時間〜数日 |
| 柔軟性 | 毎回違う指示OK | 固定された傾向に染まる |
実務での使い分け: 9割はプロンプトで解決する。ファインチューニングが必要なのは、(a) プロンプトで再現性が出ない、(b) 大量の独自データを反映したい、(c) コストを下げるため固定動作にしたい、の3パターンくらい。「とりあえず fine-tuning」 は90%の場合過剰投資。
システムプロンプト — メッセージに 「役割タグ」 が付いている
LLM に渡されるプロンプトは、技術的には1つの長いテキストではなく 「メッセージのリスト」。各メッセージに 「誰の発言か」を示すタグ(role) が付いている。LLM はこのリスト全体を読んでから次の応答を生成する。
| role タグ | 意味 | 具体例 |
|---|---|---|
system |
AI への前提・永続ルール = システムプロンプト |
「常に日本語、丁寧語で、200字以内で答えてください。個人名は伏せて。」 |
user |
ユーザーからの質問・依頼 = ユーザープロンプト |
「この契約書の第3条をチェックしてください。」 |
assistant |
AI 自身の過去の応答 (会話履歴) |
(前回 AI が返した答え) |
system タグのメッセージは、AI が 訓練段階で「優先的に従うべき指示」として学習 されているため、後続の user 指示より強く効く。これが「設定したルールが会話全体で効き続ける」感覚の正体。
「ずっと効いている」 の実装は意外と単純で、チャット UI は 毎回の LLM 呼び出しの先頭に同じ system メッセージを再挿入 しているだけ。会話が続いても、内部ではリストの一番上に同じシステムプロンプトが入った状態で LLM を呼んでいる。長い会話で履歴の古い user / assistant メッセージは切り捨てられても、先頭の system は残り続ける。
業務での使い分け: 変えたくないルール(「常に日本語で / 個人名は伏せて / 200字以内で要約」など)は system 側に、毎回違う具体の依頼(「この契約書をチェックして」)は user 側に分ける。これで毎回同じ前提を書き直す手間が消え、出力も安定する。ChatGPT の 「Custom Instructions」、Claude の 「Project の指示」 が、利用者向けに system 設定を提供している UI。
ただし system は 「絶対の壁」 ではない: 巧妙なユーザー入力で system 指示を上書きさせる プロンプトインジェクション という攻撃手法があり、業務利用ではセキュリティ設計の論点になる。詳しくは別記事(A34 システムプロンプト、プロンプトインジェクション、いずれも別記事予定)で深掘り。
コンサル感覚 — プロンプトに投資する3つの理由
本記事の核心メッセージは 「AI を導入するなら、まずプロンプトに投資せよ」。3つの理由:
① コスト効率が極端に良い: プロンプトを1日かけて磨くと、その後の出力品質が継続的に上がる。ファインチューニング1回(数十万円)より プロンプトの作り込み(数時間) のほうが高 ROI なケースが大半。
② 「プロンプト資産」 が会社の競争力になる: 業務別に磨かれたプロンプトテンプレートは、社内ノウハウそのもの。大蔵の 「1分指示書フレームワーク」 を会社で資産化するなら、それは 「プロンプトライブラリ」 として整備するのが筋。
③ プロンプトは 「ドキュメント」 にもなる: 良いプロンプトは 業務手順そのものの記述。社員教育にも、外注指示にも、AI への指示にも同じものが使える。「プロンプトを書く」 = 「業務を言語化する」。これができる組織は、AI 時代に強い。
大蔵さんの新人への朝の 1分指示書、見事だったよ。タスク・制約・期待形式 の本質3要素が完璧に揃ってて、これそのまま ChatGPT に投げたら最高の出力出るやつだった。
俺、部下に何か頼む時 「いい感じでよろしく」 しか言ったことないなぁ。これが俺のプロンプトだとしたら、AI も部下も曖昧な出力を返してくるのは当然 か…ベランダのトマトに肥料あげる時は「葉が黄色いから窒素多めで」って具体的に言うのに、人には適当に丸投げしてる。これは反省。
(赤崎部長の「いい感じでよろしく」、ある意味 高温度プロンプト ですね。同じ指示でも毎回違うアウトプット を私たちから引き出している。たまに当たりが出ますし、外れも出ます。…私の場合、JR時刻表の 「特急列車に2回乗り換えで最短ルート」 みたいな指示は具体的に書きますけど、それ以外は…って、これも乗り鉄ファセットしかなくて恥ずかしい。)
フッ、私は 推し配信のスパチャ文面 で毎週プロンプトを練り上げている。「推しの今日の朗読は ヴィトゲンシュタイン論理哲学論考 第3節 の解釈について、具体的な日常例で200字以内 でお願いします、御礼は箇条書きで」みたいに。これが私の プロンプトエンジニアリングの修行場 だ。…ちなみに大蔵の 「1分指示書」 は典型的に 低温度プロンプト で、私のスパチャは 中温度、赤崎の 「いい感じ」 は 高温度 だな。
(御託さん、スパチャを 「プロンプトエンジニアリングの修行」 って言い切ったの、もはや尊敬する。…まあ、確かに 「具体的に / 短く / 期待形式を明示」 ってルールが守れてれば、対象が AI でも部下でも推しでも、出力の質は上がるってことだな。)

応用 — Few-shot / Chain-of-Thought / Role-play
本記事の余談として、本質3要素を超えた 「プロンプトエンジニアリング」 の主要テクニック:
- Few-shot Prompting: 期待する入出力の例を 2〜5個 プロンプトに含める。「こういう質問にはこう答える」のサンプルを見せることで、出力フォーマットや論調を強く誘導できる。
- Chain-of-Thought(CoT): 「ステップバイステップで考えてください」「まず前提を整理し、次に…」と推論プロセスを明示させる。複雑な問題で精度が大幅に上がる、Anthropic / OpenAI 公式推奨。
- Role-play / Persona: 「あなたは経験30年のベテラン税理士です」のように人格を設定する。役割設定が明確だと、専門性のある回答に振れる。
- Constraint Injection: 「絶対に X しないでください」「Y の場合は出力を停止してください」と禁止事項を明示。セキュリティ・コンプラ用途で必須。
- Output Formatting: 「JSON で / Markdown 表で / XML タグで囲んで」と機械可読な形式を指定。API でプログラム連携する時の常套手段。
コンサル感覚: クライアント先で「AI 導入したけど思うように動かない」と聞いたら、まず プロンプトを見せてもらう。8割は本質3要素のどれかが抜けている(役割は付けても付けなくても精度は変わらない)。1日かけて整えるだけで、別モデルに乗り換えるより高い改善幅が出る。