раздел 00

Что делать, когда контекст заполняется

У модели есть рабочая память на один разговор - контекстное окно. В неё помещается ограниченное число токенов: ваши сообщения, ответы модели, приложенные файлы, инструкции. Окно не бесконечное. Чем дольше идёт чат и чем крупнее проект, тем быстрее оно забивается.

Когда места не остаётся, начинается самое неприятное: модель будто перестаёт понимать, о чём вы договаривались десять сообщений назад.

Контекст - это не «чем больше, тем умнее». Это ограниченный стол. Завалите его всем подряд - и нужное окажется погребено под лишним.

Что забивает окно

Длинный чат
Каждое сообщение остаётся в истории. Через сотню реплик окно почти заполнено только перепиской.
Большой проект
Прикреплённые файлы, код, логи, выводы инструментов - всё это весит и съедает место.

Признаки переполнения

Понять, что контекст на пределе, можно по поведению модели:

  • Забывает сказанное. Вы давали инструкцию или факт раньше - модель отвечает так, будто его не было.
  • Начинает тупить. Ответы становятся беднее, теряется качество, упускаются детали.
  • Путается. Смешивает разные части разговора, противоречит сама себе.
  • Повторяется. Заново предлагает то, что уже обсудили или отвергли.

Про что этот гайд

Тут не про теорию. Что такое контекстное окно, из чего оно складывается и почему именно так устроено - подробно разобрано в гайде Контекстное окно. Здесь - только практика: что нажать и что написать, когда окно заполнилось.

Дальше по разделам: автокомпрессия и сжатие, саммари для нового чата, чистый чат с изучением старого, привычки, которые экономят контекст, и шпаргалка на один экран.