OpenAI внедрила новый генератор изображений в GPT‑4o — «самый продвинутый» на сегодня

Компания OpenAI объявила о запуске усовершенствованной функции генерации изображений внутри своей модели GPT‑4o. По словам разработчиков, это «самый продвинутый» генератор, который может создавать как эстетически привлекательные, так и «практичные» изображения — от персонажей до диаграмм и постеров.
Новая функция отличается точной визуализацией текста, стабильностью внешнего вида объектов при внесении правок и способностью учитывать до 10–20 элементов в одном изображении. При этом модель использует не только текстовые запросы, но и весь контекст из чата — включая загруженные изображения и историю диалога.

Как отмечают в OpenAI, при генерации, например, игрового персонажа, его внешность сохраняется неизменной даже при множественных корректировках, что делает модель удобной для креативных и технических задач.

Однако генерация может занимать больше времени — до минуты — из-за повышенной детализации. Модель пока не всегда корректно справляется с изображениями, содержащими большое количество объектов, нестандартные пропорции или нелатинские символы.
Инструмент будет интегрирован в Sora и станет доступен всем пользователям ChatGPT, включая бесплатных. Генерация через DALL-E GPT останется доступна отдельно.