«Сбер» разработал нейросеть ruDALL-E для создания изображений по словесному описанию
Для создания изображений нет лимита, компьютер обучается одновременно как на картинках, так и на текстах. Как утверждают представители «Сбера», на обучение нейросети потребовалось 23 000 GPU-часов. Этот процесс стал рекордсменом среди самых крупных нейросетевых вычислительных проектов на территории России и СНГ.
Разработка включала в себя три нейросети. Задача первой — обрабатывать текстовую информацию и определять количество возможных изображений. Второй — выбирать лучшие изображения. Роль третьей — увеличивать картинки в размере, при этом сохраняя качество изображения.
Модель ruDALL-E XL с 1,3 миллиарда параметров находится в открытом доступе на GitHub. Важно, что имеется аналог — ruDALL-E 12B. Он обладает 12 миллиардами параметров. Две
Читать на inforeactor.ru
