ディープラーニング
コンテキストウィンドウ
読み方:こんてきすとうぃんどう
コンテキストウィンドウとは
コンテキストウィンドウ(Context Window)は、LLM が一度の処理で受け取れる情報量の上限のことです。トークン 数で表され、この範囲内に収まる情報だけがAIの「短期記憶」として文脈を理解する材料になります。
なぜ重要なのか
コンテキストウィンドウが狭いと、長い文書の冒頭部分を忘れたり、過去の会話を参照できなくなります。GPT-4oは約128Kトークン、Geminiは最大200万トークンに対応するなど、2026年現在は急速に拡大が進んでいます。RAG や CAG はコンテキストウィンドウの制約を効率的に活用するための手法です。
長文脈処理の破壊的インパクトとコスト最適化
数十万トークン(本数百冊分に匹敵する文章や、長時間の会議録動画など)を一括で読み取れる超巨大コンテキストウィンドウのモデルの登場により、これまで人間が何日も徹夜して行っていた「分厚い決算資料と競合のプレスリリースの突き合わせ」や「何万行にも及ぶログから原因を特定するバグの修正」などの検証作業がわずか数十秒で完結するようになりました。一方で、枠(ウィンドウ)いっぱいまで無駄に入力すると1回あたりの利用料が跳ね上がるため、「必要なコンテキストだけをRAGやCAGを駆使して切り出し、適量でスマートに渡す」運用設計が、クラウド破産を防ぐためのキーファクターです。