раздел 05

Когда это оправдано против облачного API

Что это

Главный вопрос: стоит ли вообще городить self-host или проще платить за облачный API. Ответ сводится к двум вещам - деньгам (точка окупаемости) и неденежным причинам (приватность, контроль).

Логика денег

  • Облачный API: платите за каждый токен. Нулевые вложения, цена растёт строго с объёмом. Мало запросов - почти бесплатно. Много - счёт большой.
  • Self-host: платите за железо или аренду GPU - постоянная сумма независимо от числа запросов. Один запрос в день - дорого за штуку. Миллион запросов - дёшево за штуку.

Где-то эти линии пересекаются. До точки пересечения дешевле API, после - свой хостинг.

Точка окупаемости на пальцах

Прикидка такая:

  1. Возьмите ваш реальный месячный объём токенов.
  2. Посчитайте, во что он обойдётся через API (объём × цена за токен).
  3. Посчитайте стоимость self-host в месяц (аренда GPU или амортизация своей карты + обслуживание).
  4. Сравните. Если API в месяц выходит заметно дороже self-host - точка окупаемости пройдена.

Когда self-host оправдан без всякой арифметики

Эти причины перевешивают деньги:

  • Приватность. Данные нельзя отдавать наружу - и точка.
  • Контроль версии. Поведение модели должно быть стабильным и предсказуемым.
  • Независимость. Не хотите зависеть от доступности и политики провайдера.
  • Офлайн. Работа без интернета или в закрытом контуре.

Пример

Стартап обрабатывает 50 000 запросов в день - стабильно и помногу. Через API счёт большой и растёт. Считают: аренда подходящего GPU в месяц выходит заметно дешевле, чем API на этом объёме. Плюс часть данных чувствительна. Решение очевидно: self-host. А вот их же соседи с парой сотен запросов в день остаются на API - городить сервер ради этого незачем.

Антипаттерны

  • Разворачивать у себя «чтобы сэкономить» на малом объёме. Чаще выходит дороже и сложнее.
  • Считать только цену токенов, забыв про обслуживание. Время на поддержку сервера тоже стоит денег.
  • Игнорировать неденежные причины. Иногда приватность важнее любой арифметики - и наоборот, без неё на малом объёме self-host не нужен.

Подразделы