Контекстное окно:
заполнение и оптимизация
Контекстное окно - это рабочая память модели на одну сессию. Её заполняют не только твои сообщения: ещё системный промпт, определения инструментов, правила, skills и описания субагентов. Когда окно подходит к потолку, старое начинает теряться, качество падает, а каждый запрос становится дороже. Этот гайд показывает, из чего складывается заполнение, как за ним следить и как держать окно в узде.

Пример с реального экрана Cursor: 27% заполнено, около 53.4K из 200K токенов - и большую часть заняли служебные вещи, а не диалог.
что разберём
главы гайда
Что такое заполнение контекста
Контекстное окно как рабочая память на одну сессию. Что значит процент заполнения и почему переполнение бьёт по качеству и цене.
Из чего состоит контекст
Разбор на примере экрана Cursor: system prompt, определения инструментов, правила, skills, субагенты и сам диалог. Что съедает окно ещё до твоих сообщений.
Как наблюдать заполнение
Где смотреть: индикатор Context Usage в Cursor, команда /context в Claude Code, счётчики токенов. На что обращать внимание.
Оптимизация: меньше занимать
Убрать лишние инструменты, правила и файлы из контекста, не тащить всю историю, короче формулировки, выбрать модель с большим окном под большую задачу.
Сжатие, сохранение, перенос
Сжать историю в саммари, сохранить важное наружу в заметки и память, перенести контекст в новый чистый чат без потери сути.
Шпаргалка
Что ест контекст таблицей, чек-лист держать окно в узде, команды и глоссарий на одной странице.