раздел 02

Подписка против API

Один и тот же Claude или GPT можно использовать двумя способами, и лимиты у них устроены по-разному. Понимать разницу полезно: когда упрёшься в подписку, у тебя будет запасной путь.

Два способа доступа

Чат-подписка
ChatGPT, Claude через сайт или приложение. Платишь фикс-сумму в месяц. Лимиты - окна по времени со сбросом (сессия, неделя). Удобно, предсказуемая цена, ничего не настраивать.
API
Обращаешься к модели программно из своего кода или агента. Платишь по факту - за токены. Лимиты - rate limits: RPM (запросов в минуту) и TPM (токенов в минуту). Потолок зависит от tier (истории платежей).

Чем отличаются лимиты

В подписке счётчик - это объём использования за окно. Окно сбрасывается по времени. Упёрся - ждёшь сброса или апгрейдишь план. Цена фиксированная: сколько ни используй внутри окна, в конце месяца сумма та же.

В API счётчик - это интенсивность прямо сейчас. RPM ограничивает, сколько запросов в минуту ты шлёшь, TPM - сколько токенов в минуту прокачиваешь. Упёрся в rate limit - ответ приходит с ошибкой «слишком часто», нужно притормозить или распределить нагрузку. Платишь при этом за каждый реально использованный токен, а не фикс-сумму.

Tier в API

В API потолок не одинаковый для всех. Чем больше ты уже оплатил за время использования, тем выше твой tier и тем выше RPM/TPM. Новый аккаунт стартует с низкого потолка, дальше он растёт по мере истории платежей. Это защита от абьюза: свежесозданные аккаунты не могут сразу молотить на полную.

Когда уходить в API

Если в чат-подписке регулярно упираешься в окно и работа встаёт - это сигнал посмотреть в сторону API. Там нет недельных окон со сбросом: платишь по факту и масштабируешься потолком tier, а не тарифом.

  • Подробно про работу с API - в разделе LLM API.
  • Если нужен доступ к разным моделям через один ключ и с гибкими лимитами - смотри OpenRouter.