раздел 06

Шпаргалка

Весь курс на одной странице.

Задача -> модель

| Задача | Что брать обычно | | --- | --- | | Сложный код, агенты | Флагман (Claude, GPT) или топовый опенсорс | | Ответственные тексты | Флагман или сильный опенсорс, проверка на русском | | Большие документы | Модель с большим контекстным окном | | Извлечение по чёткой инструкции | Средняя модель, дешевле флагмана | | Массовая классификация и разметка | Самый дешёвый компакт / опенсорс | | Чувствительные данные | Опенсорс на своём сервере |

Это стартовые гипотезы, а не приговор - финал решает тест на ваших данных.

Оси сравнения

  1. Качество - на вашей задаче, а не по общему рейтингу.
  2. Скорость - задержка и токенов в секунду.
  3. Цена - за 1M токенов, вход и выход отдельно, выход дороже.
  4. Контекст - влезет ли ваш документ.
  5. Приватность - куда уходят данные.
  6. Русский - проверяйте именно на нём.
  7. Мультимодальность - нужны ли картинки/аудио.

Правила выбора

  1. Не ищите лучшую модель вообще - ищите достаточную под задачу.
  2. Дешёвая на объёме, дорогая точечно - типовой пайплайн.
  3. Тестируйте на 20-50 своих примерах одним промптом, через агрегатор.
  4. Сравнивайте по качеству + цене + скорости сразу, не по одной оси.
  5. Фиксируйте версию модели - поведение может меняться между версиями.

Подразделы