раздел 01
Кто есть кто
Имён много, и в них легко запутаться. Разберём главных игроков по одному: кто за моделью стоит и в чём её особенность.
DeepSeek
Лаборатория DeepSeek прославилась двумя линейками: модели V-серии (универсальный чат-помощник) и рассуждающая модель R, которая показывает ход мысли перед ответом. DeepSeek сделала много шума именно сочетанием сильного качества, открытых весов и очень низкой цены. Хороший вариант для кода и задач, где нужны рассуждения.
Qwen (Alibaba)
Qwen - большая семья моделей от Alibaba, и это её сила: моделей много, под разные размеры и задачи. Внутри есть отдельная линейка Qwen Coder, заточенная под программирование. Многие модели Qwen открытые, что делает их популярными для локального запуска.
GLM / z.ai (Zhipu AI)
GLM - линейка моделей от компании Zhipu AI. Свою платформу они продвигают под брендом z.ai. Модели GLM хвалят за код и за агентные задачи - когда модель не просто отвечает, а выполняет цепочку шагов и пользуется инструментами.
Kimi (Moonshot)
Kimi - модель от компании Moonshot AI. Её главная фишка - длинный контекст: можно подать очень большой объём текста за один раз (документы, длинные диалоги, большие фрагменты кода) и работать с ним целиком.
MiniMax и Yi
Это игроки второго ряда, но их стоит знать. MiniMax развивает свои чат- и мультимодальные модели. Yi - линейка моделей, известная открытыми весами. Оба встречаются в агрегаторах, и иногда конкретная их модель оказывается удачной под вашу задачу.