Команда Яндекса объявила о выпуске прототипа фирменной нейросети для генерации картинок по текстовым запросам пользователей, запустив публичное бета-тестирование среди простых пользователей. Приложение «Шедеврум» доступно для мобильных платформ Android и iOS.
Бета-версию «Шедеврума» 0.1.4 можно бесплатно загрузить из онлайн-магазинов Google Play и App Store. Cоставлять описания можно как на английском, так и на русском языках.
В пресс-службе пояснили:
Шедеврум понимает русский и английский языки и очень любит конкретику. Чем подробнее описание, тем точнее результат. Нейросеть учитывает особые пожелания (например, «фотореализм» или «высокая детализация»), способна подражать известным живописцам и работать в заданных художественных стилях.
После установки приложения пользователь сможет просматривать изображения и оставлять «лайки». Чтобы генерировать картинки по собственным запросам, нужно оставить заявку и дождаться её подтверждения. В будущем такую возможность получат все зарегистрированные пользователи.
Нейросеть формирует изображения по методу каскадной диффузии: сначала создаёт картинки в соответствии с запросом, а затем поэтапно увеличивает их разрешение, насыщая деталями.
Первую версию генеративной модели для бета-теста разработчики обучили на 240 миллионах примеров картинок с текстовыми описаниями. Обучение продолжается на наборе данных из 500 миллионов примеров — в следующих обновлениях качество будет поэтапно улучшаться.