AI-кодинг · технический гайд

Контекстное окно:
заполнение и оптимизация

Контекстное окно - это рабочая память модели на одну сессию. Её заполняют не только твои сообщения: ещё системный промпт, определения инструментов, правила, skills и описания субагентов. Когда окно подходит к потолку, старое начинает теряться, качество падает, а каждый запрос становится дороже. Этот гайд показывает, из чего складывается заполнение, как за ним следить и как держать окно в узде.

Индикатор заполнения контекстного окна AI-агента

Пример с реального экрана Cursor: 27% заполнено, около 53.4K из 200K токенов - и большую часть заняли служебные вещи, а не диалог.

что разберём

Что заполняет окно
System prompt, инструменты, правила, skills, субагенты и диалог. Видно на цифрах с реального экрана.
Как за этим следить
Индикатор Context Usage в Cursor, команда /context в Claude Code, счётчики токенов.
Как держать в узде
Меньше занимать, вовремя сжимать историю, сохранять важное наружу и переносить контекст в чистый чат.

главы гайда

00

Что такое заполнение контекста

Контекстное окно как рабочая память на одну сессию. Что значит процент заполнения и почему переполнение бьёт по качеству и цене.

01

Из чего состоит контекст

Разбор на примере экрана Cursor: system prompt, определения инструментов, правила, skills, субагенты и сам диалог. Что съедает окно ещё до твоих сообщений.

02

Как наблюдать заполнение

Где смотреть: индикатор Context Usage в Cursor, команда /context в Claude Code, счётчики токенов. На что обращать внимание.

03

Оптимизация: меньше занимать

Убрать лишние инструменты, правила и файлы из контекста, не тащить всю историю, короче формулировки, выбрать модель с большим окном под большую задачу.

04

Сжатие, сохранение, перенос

Сжать историю в саммари, сохранить важное наружу в заметки и память, перенести контекст в новый чистый чат без потери сути.

05

Шпаргалка

Что ест контекст таблицей, чек-лист держать окно в узде, команды и глоссарий на одной странице.