раздел 00

Зачем нужны лимиты

Лимит - это потолок, сколько модели можно использовать за единицу времени. Звучит как ограничение «чтобы ты платил больше», но причины глубже, и если их понять, лимит перестаёт прилетать неожиданно.

Почему лимиты вообще есть

Вычисления дорогие
Каждый ответ модели - это работа дорогих видеокарт. Чем больше текста и чем тяжелее модель, тем дороже один запрос.
Честное распределение
Мощностей конечное число. Лимиты не дают одному пользователю занять всё и оставить остальных без ответа.
Защита от злоупотреблений
Без потолка легко запустить бота, который молотит запросы нон-стоп. Лимиты ограничивают автоматический абьюз.

Где встречаешь лимиты

Лимиты бывают двух родов, и это важно не путать.

  1. В подписке-чате (ChatGPT, Claude и тому подобное). Платишь фиксированную сумму в месяц, а внутри действуют окна по времени со сбросом: использовал много за период - упёрся, дождался сброса - снова можешь. Чем выше план (Free, Pro, Max), тем шире окно.
  2. В API (когда обращаешься к модели программно). Здесь лимиты называются rate limits и измеряются в запросах в минуту (RPM) и токенах в минуту (TPM). Платишь по факту использования, а потолок зависит от истории твоих платежей - так называемого tier.

Подробно разницу разберём в разделе «Подписка против API».

Что бесит новичков

Чаще всего раздражает, что лимит прилетает внезапно: пишешь агенту, увлёкся, и вдруг «лимит исчерпан, попробуйте позже». Кажется, что обманули.

На деле почти всегда есть индикатор - экран, где видно, сколько окна осталось и когда сброс. Если за ним приглядывать, сюрпризов нет: ты заранее видишь, что окно подходит к концу, и либо притормаживаешь, либо переключаешься на запасной доступ.

Дальше разберём всё на живом примере - экране лимитов Claude.