Генератор изображений JanusPro7B работает лучше чем OpenAI и Stability AI
Модели, доступные для загрузки с платформы Hugging Face, принадлежат к новому семейству, названному JanusPro. Они имеют размер от 1 до 7 миллиардов параметров, причём модели с большим количеством параметров, демонстрируют высокую производительность.
JanusPro распространяется по лицензии MIT, что позволяет использовать модель в коммерческих целях без ограничений. Компания описывает JanusPro как «новую авторегрессионную структуру», способную как анализировать, так и создавать новые изображения. Самая большая модель в семействе, JanusPro7B, превосходит DALLE 3, а также такие решения, как PixArtalpha, Emu3Gen и Stable Diffusion XL от Stability AI, в двух оценочных тестах — GenEval и DPGBench.
Видеогенератор Sora стал доступен для всех
Хотя большинство моделей JanusPro могут анализировать только изображения с разрешением до 384 x 384, их производительность впечатляет, учитывая компактные размеры. Это делает JanusPro сильным кандидатом на звание одной из самых универсальных мультимодальных моделей. DeepSeek подчёркивает, что простота, высокая гибкость и эффективность новой модели соответствуют или превосходят производительность специализированных моделей.
JanusPro7B является усовершенствованной версией предыдущей модели Janus. Улучшения включают:
Обновлённые процессы обучения: модель обучена на 72 миллионах высококачественных синтетических изображений, сбалансированных с реальными данными. Повышенное качество данных: новые подходы к обработке и увеличению объёма данных способствуют более детализированным результатам. Увеличенный размер модели: это обеспечивает стабильность и высокий уровень генерации изображений.
Новое поколение моделей DeepSeek может применяться в дизайне, рекламе, медиа и сфере развлечений, а возможность создавать высококачественные изображения на основе текстовых запросов делает JanusPro незаменимым инструментом для профессионалов.
С выпуском JanusPro7B компания бросает вызов таким гигантам, как OpenAI и Stability AI, а успех DeepSeek в разработке языковых и визуальных моделей искусственного интеллекта вызывает сомнения о лидерстве США.
Около года назад Google приостанавливал работу Gemini, считая, что она выдает крайне сомнительные результаты в исторических фотографиях. Для подтверждения такой позиции было достаточно лишь взглянуть на изображения американских сенаторов позапрошлого века.