раздел 01

Кто есть кто

Имён много, и в них легко запутаться. Разберём главных игроков по одному: кто за моделью стоит и в чём её особенность.

DeepSeek

Лаборатория DeepSeek прославилась двумя линейками: модели V-серии (универсальный чат-помощник) и рассуждающая модель R, которая показывает ход мысли перед ответом. DeepSeek сделала много шума именно сочетанием сильного качества, открытых весов и очень низкой цены. Хороший вариант для кода и задач, где нужны рассуждения.

Qwen (Alibaba)

Qwen - большая семья моделей от Alibaba, и это её сила: моделей много, под разные размеры и задачи. Внутри есть отдельная линейка Qwen Coder, заточенная под программирование. Многие модели Qwen открытые, что делает их популярными для локального запуска.

GLM / z.ai (Zhipu AI)

GLM - линейка моделей от компании Zhipu AI. Свою платформу они продвигают под брендом z.ai. Модели GLM хвалят за код и за агентные задачи - когда модель не просто отвечает, а выполняет цепочку шагов и пользуется инструментами.

Kimi (Moonshot)

Kimi - модель от компании Moonshot AI. Её главная фишка - длинный контекст: можно подать очень большой объём текста за один раз (документы, длинные диалоги, большие фрагменты кода) и работать с ним целиком.

MiniMax и Yi

Это игроки второго ряда, но их стоит знать. MiniMax развивает свои чат- и мультимодальные модели. Yi - линейка моделей, известная открытыми весами. Оба встречаются в агрегаторах, и иногда конкретная их модель оказывается удачной под вашу задачу.

DeepSeek

Модели V-серии и рассуждающая R. Дёшево, открыто, сильна в коде и рассуждениях.

Qwen (Alibaba)

Большая семья моделей, включая Qwen Coder. Многие открытые.

GLM / z.ai (Zhipu)

Модели GLM от Zhipu AI, платформа z.ai. Сильны в коде и агентных задачах.

Kimi (Moonshot)

Длинный контекст: много текста за один раз.

MiniMax

Чат- и мультимодальные модели, второй ряд игроков.

Линейка с открытыми весами, удобна для локального запуска.