раздел 03

Как управлять лимитом

Лимит нельзя «обойти», но им можно управлять - так, чтобы окна хватало на реальную работу, а не на лишний расход. Вот рабочая практика.

1
Следи за индикатором
Держи экран лимитов под рукой. Видишь, что сессионное окно подходит к концу - притормози или переключись, а не лети в стену вслепую.
2
Не жги окно впустую
Тяжёлые задачи на пустом контексте и с тяжёлой моделью съедают окно быстро. Не гоняй большие задачи туда-сюда без нужды.
3
Чисти контекст между задачами
Новая задача - новый чат. Старая переписка тащится в каждый ответ как токены и зря тратит лимит. Подробнее - в курсе про контекстное окно.
4
Бери модель полегче на простое
Для несложных шагов тяжёлая модель не нужна. Лёгкая решит то же самое и потратит меньше окна.
5
Разноси тяжёлое во времени
Если работа большая, не пытайся сделать всё в один заход. Распределяй по сессиям, чтобы не выжечь окно разом.
6
Учитывай сброс окна
Знаешь, что через час сброс - тяжёлую часть можно отложить на после. Планируй вокруг сброса, а не вопреки ему.

Почему чистка контекста так важна

Модель на каждый ответ перечитывает весь контекст - всю переписку и приложенные файлы. Чем он длиннее, тем больше токенов уходит на один и тот же ответ, и тем быстрее наполняется окно.

Поэтому самый дешёвый приём - не таскать лишнее. Закончил задачу, начинаешь новую - открой свежий чат. Чем меньше контекст, тем меньше расход. Подробно про это - в разделе Контекстное окно.

Модель под задачу

Не каждый шаг требует самой мощной модели. Переименовать переменные, поправить текст, ответить на простой вопрос - с этим справится лёгкая модель и потратит заметно меньше окна. Тяжёлую модель береги под действительно сложное: архитектура, разбор хитрого бага, длинные рассуждения.