OpenAI улучшила генерацию изображений: текст и детали стали точнее Это не DALL-E, а …

Share

OpenAI улучшила генерацию изображений: текст и детали стали точнее

Это не DALL-E, а новая система, работающая по другому принципу. [Источник]

Разберем по пунктам:
🔘Точность генерации выросла: модель правильно привязывает цвета, формы и другие атрибуты к объектам. Если раньше нейросети путались с 5–8 элементами, теперь GPT‑4o может обрабатывать до 10-20 различных объектов.
🔘Текст в изображениях — проблема всех генераторов, но и здесь сделали рывок. Подписи, схемы, комиксы, меню ресторанов — текст наконец-то стал читаемым и понятным.
🔘Метод генерации отличается: вместо диффузионных моделей используется авторегрессионный подход, который создает изображение поэтапно. Это позволяет улучшить детализацию и рендеринг текста, но увеличивает время генерации.
🔘Можно загружать изображения, дорабатывать их, уточнять детали — модель учитывает контекст чата и предыдущие запросы.

Обновление уже раскатывают пользователям Plus, Pro, Team и Free. API для разработчиков — скоро. Проверяем [тут]

⚠️Видео переведены.

UPD: у кого в ChatGPT не появилась функция — она переехала в [Sora]

#news