LL3M — ИИ, который пишет Python-код для создания и редактирования 3D-объектов в Blender
LL3M (Large Language 3D Modeler, Языковая модель для трёхмерного моделирования) использует мощь больших языковых моделей, чтобы автоматически генерировать Python‑код для создания и редактирования 3D‑объектов в программе Blender.
Разработкой LL3M занимается исследовательская группа 3DL при Чикагском университете под руководством профессора Раны Ханоки.
Принцип работы прост: LL3M воспринимает текстовые инструкции от пользователя и превращает их в выразительные формы с нуля. Так удаётся управлять геометрией, добиваться тонкой и сложной проработки модели — и всё это через код. В отличие от классических LLM‑моделей, которые ограничены процедурными скриптами и примитивами, LL3M не накладывает ограничений на геометрию, композицию или внешний вид будущего объекта.
Используя высокоуровневый код как представление трёхмерной сцены, LL3M работает по принципу последовательных улучшений, а также совместного с человеком творчества. Агент генерирует код автоматически, анализирует результат и подвергает его визуальной самокритике. Пользователь, в свою очередь, может вносить высокоуровневые правки на любом этапе. Сгенерированные структуры Blender остаются прозрачными и читаемыми: код снабжён понятными параметрами и легко редактируется.
Алгоритм LL3M разбит на три условные стадии: первичное создание, автоматическая корректировка и корректировка с участием пользователя. В каждой из фаз задействованы разные агенты, отвечающие за свои этапы.
На этапе первичного создания пользователь вводит описание объекта — например, «стул». Агент‑планировщик раскладывает модель на составные элементы: ножки, спинку, подлокотники. Далее поисковый агент с помощью технологии RAG обращается к документации Blender API и подбирает подходящие решения. На основе
Читать на habr.com