раздел 01

Что такое опенсорс-модели

Что это

Опенсорс-модель - это модель, у которой опубликованы веса. Веса - это и есть «мозг» модели: огромный набор чисел, полученных при обучении. Если веса доступны, модель можно скачать (обычно с площадки вроде Hugging Face), запустить у себя, дообучить и зафиксировать.

У закрытых моделей (GPT, Claude, Gemini) весов нет в открытом доступе. Вы пользуетесь ими только через чужой API и не контролируете, что под капотом.

Зачем это вам

Открытые веса дают то, чего не даёт API: запуск офлайн, полный контроль над версией, возможность дообучить под свою предметную область и гарантию, что данные не уходят наружу.

Основные семейства

  • Llama (Meta) - самое большое сообщество, множество дообученных вариантов под разные задачи.
  • Qwen (Alibaba) - сильная линейка разных размеров, прилично знает русский, есть мультимодальные версии.
  • DeepSeek - заметны в рассуждении и коде, при этом эффективны по ресурсам.
  • Mistral - компактные быстрые модели, удобны там, где важна скорость.
  • Gemma (Google) - небольшие модели, хорошо подходят для локального запуска.

Версии меняются часто - держитесь семейства и размера, свежий рейтинг проверяйте перед выбором.

Чем отличаются от закрытых

| | Опенсорс у себя | Закрытый API | | --- | --- | --- | | Веса | у вас | недоступны | | Данные | не уходят наружу | идут провайдеру | | Цена | за железо/аренду | за токены | | Версия | фиксируете вы | меняет провайдер | | Порог входа | нужен GPU и настройка | ключ и запрос | | Потолок качества | высокий, но обычно ниже топ-флагманов | максимальный |

Размер модели

Модели измеряют в миллиардах параметров (B - billion): 7B, 14B, 70B и больше. Больше параметров - умнее, но и тяжелее для железа. Размер модели напрямую определяет, сколько нужно видеопамяти - об этом следующий раздел.

Пример

Компании нужен ассистент по внутренним регламентам, документы секретны. Закрытый API отпадает. Берут опенсорс-модель среднего размера (например, из семейства Qwen или Llama), разворачивают на своём сервере. Данные не покидают периметр, версия под контролем.

Антипаттерны

  • Считать опенсорс «бесплатным». Веса бесплатны, но железо и его обслуживание - нет.
  • Гнаться за самой большой моделью. Часто средняя решает задачу при кратно меньших требованиях.
  • Игнорировать лицензию. У части моделей есть ограничения на коммерческое использование.

Подразделы