раздел 00
Что делать, когда контекст заполняется
У модели есть рабочая память на один разговор - контекстное окно. В неё помещается ограниченное число токенов: ваши сообщения, ответы модели, приложенные файлы, инструкции. Окно не бесконечное. Чем дольше идёт чат и чем крупнее проект, тем быстрее оно забивается.
Когда места не остаётся, начинается самое неприятное: модель будто перестаёт понимать, о чём вы договаривались десять сообщений назад.
Контекст - это не «чем больше, тем умнее». Это ограниченный стол. Завалите его всем подряд - и нужное окажется погребено под лишним.
Что забивает окно
Признаки переполнения
Понять, что контекст на пределе, можно по поведению модели:
- Забывает сказанное. Вы давали инструкцию или факт раньше - модель отвечает так, будто его не было.
- Начинает тупить. Ответы становятся беднее, теряется качество, упускаются детали.
- Путается. Смешивает разные части разговора, противоречит сама себе.
- Повторяется. Заново предлагает то, что уже обсудили или отвергли.
Про что этот гайд
Тут не про теорию. Что такое контекстное окно, из чего оно складывается и почему именно так устроено - подробно разобрано в гайде Контекстное окно. Здесь - только практика: что нажать и что написать, когда окно заполнилось.
Дальше по разделам: автокомпрессия и сжатие, саммари для нового чата, чистый чат с изучением старого, привычки, которые экономят контекст, и шпаргалка на один экран.