Нейросеть научилась создавать изображения по текстовому описанию. Результат удивил даже создателей
Исследователи из OpenAI представили новую нейронную сеть DALL-E. Она может создавать изображения, фотографии и рендеры, основываясь на простом текстовом описании.
Название DALL-E — анаграмма из имени художника Сальвадора Дали (Dali) и не менее робота WALL-E из мультика.
Алгоритмы не ищут изображения в открытых источниках, она создает их сама. Чтобы нейросеть обучилась, через нее прогнали 12 млрд изображений из интернета с подписями к ним. Ниже можно посмотреть на примеры галерей, созданных нейросетью по определенным запросам.

Скриншот с openai.com
Пример работы DALL-E: рисунки, созданные нейросетью по ключевым словам «baby daikon radish in a tutu walking a dog» («малышка-дайкон в балетной пачке выгуливает собаку»)

Скриншот с openai.com
Пример работы DALL-E: иллюстрации по запросу «кресло в форме авокадо»
Алгоритм может рисовать не просто по словам, но и находить связи в словосочетаниях. Чем сложнее фраза, тем хуже работает нейросеть. Разработчики пообещали в скором времени показать описание работы DALL-E.
В будущем исследователи планируют проанализировать, как алгоритмы вроде DALL-E связаны с социальными проблемами, потенциальной предвзятостью к результатам работы нейросети и долгосрочными этическими проблемами, связанными с этой технологией.
