раздел 00
Зачем нужны лимиты
Лимит - это потолок, сколько модели можно использовать за единицу времени. Звучит как ограничение «чтобы ты платил больше», но причины глубже, и если их понять, лимит перестаёт прилетать неожиданно.
Почему лимиты вообще есть
Где встречаешь лимиты
Лимиты бывают двух родов, и это важно не путать.
- В подписке-чате (ChatGPT, Claude и тому подобное). Платишь фиксированную сумму в месяц, а внутри действуют окна по времени со сбросом: использовал много за период - упёрся, дождался сброса - снова можешь. Чем выше план (Free, Pro, Max), тем шире окно.
- В API (когда обращаешься к модели программно). Здесь лимиты называются rate limits и измеряются в запросах в минуту (RPM) и токенах в минуту (TPM). Платишь по факту использования, а потолок зависит от истории твоих платежей - так называемого tier.
Подробно разницу разберём в разделе «Подписка против API».
Что бесит новичков
Чаще всего раздражает, что лимит прилетает внезапно: пишешь агенту, увлёкся, и вдруг «лимит исчерпан, попробуйте позже». Кажется, что обманули.
На деле почти всегда есть индикатор - экран, где видно, сколько окна осталось и когда сброс. Если за ним приглядывать, сюрпризов нет: ты заранее видишь, что окно подходит к концу, и либо притормаживаешь, либо переключаешься на запасной доступ.
Дальше разберём всё на живом примере - экране лимитов Claude.