раздел 01
Что такое опенсорс-модели
Что это
Опенсорс-модель - это модель, у которой опубликованы веса. Веса - это и есть «мозг» модели: огромный набор чисел, полученных при обучении. Если веса доступны, модель можно скачать (обычно с площадки вроде Hugging Face), запустить у себя, дообучить и зафиксировать.
У закрытых моделей (GPT, Claude, Gemini) весов нет в открытом доступе. Вы пользуетесь ими только через чужой API и не контролируете, что под капотом.
Зачем это вам
Открытые веса дают то, чего не даёт API: запуск офлайн, полный контроль над версией, возможность дообучить под свою предметную область и гарантию, что данные не уходят наружу.
Основные семейства
- Llama (Meta) - самое большое сообщество, множество дообученных вариантов под разные задачи.
- Qwen (Alibaba) - сильная линейка разных размеров, прилично знает русский, есть мультимодальные версии.
- DeepSeek - заметны в рассуждении и коде, при этом эффективны по ресурсам.
- Mistral - компактные быстрые модели, удобны там, где важна скорость.
- Gemma (Google) - небольшие модели, хорошо подходят для локального запуска.
Версии меняются часто - держитесь семейства и размера, свежий рейтинг проверяйте перед выбором.
Чем отличаются от закрытых
| | Опенсорс у себя | Закрытый API | | --- | --- | --- | | Веса | у вас | недоступны | | Данные | не уходят наружу | идут провайдеру | | Цена | за железо/аренду | за токены | | Версия | фиксируете вы | меняет провайдер | | Порог входа | нужен GPU и настройка | ключ и запрос | | Потолок качества | высокий, но обычно ниже топ-флагманов | максимальный |
Размер модели
Модели измеряют в миллиардах параметров (B - billion): 7B, 14B, 70B и больше. Больше параметров - умнее, но и тяжелее для железа. Размер модели напрямую определяет, сколько нужно видеопамяти - об этом следующий раздел.
Пример
Компании нужен ассистент по внутренним регламентам, документы секретны. Закрытый API отпадает. Берут опенсорс-модель среднего размера (например, из семейства Qwen или Llama), разворачивают на своём сервере. Данные не покидают периметр, версия под контролем.
Антипаттерны
- Считать опенсорс «бесплатным». Веса бесплатны, но железо и его обслуживание - нет.
- Гнаться за самой большой моделью. Часто средняя решает задачу при кратно меньших требованиях.
- Игнорировать лицензию. У части моделей есть ограничения на коммерческое использование.