Tencent выпустила HY3D-Bench — датасет на 22 ТБ для генерации 3D-объектов
Инженеры китайской компании Tencent опубликовали датасет HY3D-Bench. На его основе можно обучить модель для генерации и реконструкции 3D-моделей. Общий размер датасета составляет около 22 ТБ.
Набор данных состоит из трёх больших частей:
Full-level dataset (более 250 тыс. объектов, ~11 ТБ) — набор замкнутых мешей без артефактов, которые обычно появляются при 3D-сканировании. Данные очищены, нормализованы и подготовлены для обучения.
Part-level dataset (более 240 тыс. объектов, ~5 ТБ) — объекты, разделённые на составляющие с рендерами финальной сборки.
Synthetic dataset (более 125 тыс. объектов, ~6,5 ТБ) — синтетические данные, которые охватывают категории объектов, которые редко встречаются в датасетах. Всего в этом наборе 1252 категории предметов.
На базе HY3D-Bench инженеры обучили Hunyuan3D-2.1-Small — облегчённую версию модели Hunyuan3D 2.1 для генерации 3D-объектов по картинкам. Нейросеть можно использовать в качестве основы для более продвинутых решений.
Датасет опубликовали на портале Hugging Fase, а в GitHub-репозитории есть ссылки на модель и документацию. Подробнее о процессе сбора данных и использованных технических решений можно узнать из текста исследования на arXiv.
Читать на habr.com