OpenAI запустила функцию генерации четких изображений в ChatGPT на базе GPT-4o
OpenAI добавила новейшую функцию генерации изображений в ChatGPT на базе модели GPT-4o. Функция доступна всем юзерам, в том числе на бесплатных тарифных планах.
Главные индивидуальности новейшей функции – система лучше осознает контекст разговора при разработке изображений, осознает сложные аннотации, может генерировать точный текст на картинах. Благодаря обновлению юзеры сумеют получать наиболее четкие и релевантные изображения.
Генерация изображений при помощи GPT‑4o обеспечивает четкое проигрывание текста, следование промптам, употребляет базу познаний 4o и контекст чата, включая преобразование загруженных изображений либо внедрение их в качестве зрительного источника вдохновения. Эти способности разрешают сделать конкретно то изображение, которое вы для себя представляете, помогают эффективнее вести взаимодействие через визуал и превращают генерацию изображений в практический инструмент, владеющий точностью и мощью.
Юзеры могут заносить правки в генерируемые изображения, к примеру, убирать либо добавлять какие-то элементы.
Так как генерация изображений сейчас встроена в GPT‑4o, вы сможете облагораживать изображения в процессе общения. GPT‑4o может создавать изображения и текст, беря во внимание контекст и обеспечивая согласованность действий. К примеру, если вы разрабатываете персонажа для видеоигры, его наружный вид остается постоянным в протяжении нескольких итераций по мере того, как вы совершенствуете его и экспериментируете.
В компании отмечают, что невзирая на все достоинства, модель все еще несовершенна. К примеру, она может галлюцинировать (другими словами выдавать неверную информацию). Также есть трудности с отображением нелатинских знаков и сохранением последовательности при генерации лиц.
Из-за больших требований к обработке генерация изображений занимает в среднем около одной минутки.
Напомним, ранее Гугл сказал о том, что выпустил экспериментальную версию «рассуждающей» модели Gemini 2.5 Pro.