раздел 02
Подписка против API
Один и тот же Claude или GPT можно использовать двумя способами, и лимиты у них устроены по-разному. Понимать разницу полезно: когда упрёшься в подписку, у тебя будет запасной путь.
Два способа доступа
Чем отличаются лимиты
В подписке счётчик - это объём использования за окно. Окно сбрасывается по времени. Упёрся - ждёшь сброса или апгрейдишь план. Цена фиксированная: сколько ни используй внутри окна, в конце месяца сумма та же.
В API счётчик - это интенсивность прямо сейчас. RPM ограничивает, сколько запросов в минуту ты шлёшь, TPM - сколько токенов в минуту прокачиваешь. Упёрся в rate limit - ответ приходит с ошибкой «слишком часто», нужно притормозить или распределить нагрузку. Платишь при этом за каждый реально использованный токен, а не фикс-сумму.
Tier в API
В API потолок не одинаковый для всех. Чем больше ты уже оплатил за время использования, тем выше твой tier и тем выше RPM/TPM. Новый аккаунт стартует с низкого потолка, дальше он растёт по мере истории платежей. Это защита от абьюза: свежесозданные аккаунты не могут сразу молотить на полную.
Когда уходить в API
Если в чат-подписке регулярно упираешься в окно и работа встаёт - это сигнал посмотреть в сторону API. Там нет недельных окон со сбросом: платишь по факту и масштабируешься потолком tier, а не тарифом.
- Подробно про работу с API - в разделе LLM API.
- Если нужен доступ к разным моделям через один ключ и с гибкими лимитами - смотри OpenRouter.