Qwen — это серия языковых моделей (LLM) от Alibaba Cloud которые активно развиваются и используются как внутри Alibaba, так и за её пределами. У них есть несколько версий: от компактных вариантов (типа Qwen-Mini) до полноценных "тяжеловесов" (например, Qwen1, Qwen1.5, Qwen2).
Появилась буквально на пару дней позже DeepSeek. Благодаря использованию серверов Alibaba отвечает гораздо бытрее DeepSeek и у меня пока ни разу не подвисал. Я бы сказал, что находится посередине между ChatGPT и DeepSeek
Основные особенности:
Плюсы:
Минусы и недочёты:
Что такое Hugging Face?
Hugging Face — это платформа приложений, своего рода "GitHub для ИИ". Она предоставляет доступ к тысячам предобученных моделей, включая Qwen, и позволяет легко использовать их через API или скачивать для локальных экспериментов.
В последнее время больше использую именно эту модель. Если кто-то ещё уже работал с Qwen — делимся опытом! Какие задачи решали? Соберём здесь честные отзывы и обсудим её сильные и слабые стороны.
Появилась буквально на пару дней позже DeepSeek. Благодаря использованию серверов Alibaba отвечает гораздо бытрее DeepSeek и у меня пока ни разу не подвисал. Я бы сказал, что находится посередине между ChatGPT и DeepSeek
Основные особенности:
- Модель может работать с текстом, кодом, таблицами и, в зависимости от версии, с изображениями.
- Некоторые версии Qwen доступны через популярную платформу Hugging Face (ссылка ), где можно найти множество готовых моделей и инструментов для их использования. Это даёт возможность попробовать Qwen локально или в своих проектах. Требования к железу надо выяснять отдельно.
- Модель разработана в Китае, но она демонстрирует хорошие результаты и на других датасетах и задачах.
Плюсы:
- Как и для DeepSeek, не требуется vpn.
- В целом, модель работает достаточно надёжно и редко "улетает в космос" (хотя бывают исключения).
- Qwen хорошо справляется с задачами программирования — от написания скриптов до объяснения сложных алгоритмов.
Минусы и недочёты:
- Иногда переусложняет ответы. Бывает, что модель выдаёт слишком длинные или детализированные объяснения, даже если вопрос требует простого ответа. Приходится постоянно ограничивать.
- Как и большинство китайских моделнй, Qwen иногда может показывать некоторую "зашоренность" на китайских реалиях или данных. Но я на политические темы с ним не общался, так что китайщины не замечал.
- Тяжёлые версии Qwen требуют серьёзных вычислительных мощностей, что может быть проблемой для локального использования. Но это характерно для всех
- Qwen предлагает как открытые (open-source), так и закрытые версии. Например, модели вроде Qwen-Mini и Qwen-7B можно свободно скачать и использовать. Однако более мощные версии, такие как Qwen-Max , доступны только через облачные сервисы Alibaba.
Что такое Hugging Face?
Hugging Face — это платформа приложений, своего рода "GitHub для ИИ". Она предоставляет доступ к тысячам предобученных моделей, включая Qwen, и позволяет легко использовать их через API или скачивать для локальных экспериментов.
В последнее время больше использую именно эту модель. Если кто-то ещё уже работал с Qwen — делимся опытом! Какие задачи решали? Соберём здесь честные отзывы и обсудим её сильные и слабые стороны.