раздел 06
Шпаргалка
Весь курс на одной странице.
Задача -> модель
| Задача | Что брать обычно | | --- | --- | | Сложный код, агенты | Флагман (Claude, GPT) или топовый опенсорс | | Ответственные тексты | Флагман или сильный опенсорс, проверка на русском | | Большие документы | Модель с большим контекстным окном | | Извлечение по чёткой инструкции | Средняя модель, дешевле флагмана | | Массовая классификация и разметка | Самый дешёвый компакт / опенсорс | | Чувствительные данные | Опенсорс на своём сервере |
Это стартовые гипотезы, а не приговор - финал решает тест на ваших данных.
Оси сравнения
- Качество - на вашей задаче, а не по общему рейтингу.
- Скорость - задержка и токенов в секунду.
- Цена - за 1M токенов, вход и выход отдельно, выход дороже.
- Контекст - влезет ли ваш документ.
- Приватность - куда уходят данные.
- Русский - проверяйте именно на нём.
- Мультимодальность - нужны ли картинки/аудио.
Правила выбора
- Не ищите лучшую модель вообще - ищите достаточную под задачу.
- Дешёвая на объёме, дорогая точечно - типовой пайплайн.
- Тестируйте на 20-50 своих примерах одним промптом, через агрегатор.
- Сравнивайте по качеству + цене + скорости сразу, не по одной оси.
- Фиксируйте версию модели - поведение может меняться между версиями.