Учёные AIRI разработали нейросеть для предсказания оптических свойств молекул с точностью на 30% выше аналогов
Учёные Института AIRI разработали новый подход для предсказания оптических свойств молекул на основе трёхмерных графовых нейронных сетей. Метод позволил снизить ошибку предсказания более чем на 30% по сравнению с лучшими существующими нейросетевыми моделями.
Знание оптических свойств веществ важно для разработки красителей, OLED-материалов, флуорофоров, фотосенсибилизаторов, биомаркеров и УФ-фильтров. Необходимо заранее понимать, свет какого цвета вещество поглощает, какого испускает, и насколько эффективно это происходит. Проверка огромных библиотек веществ экспериментальным путём или с помощью квантово-химических расчётов требует значительных затрат времени и средств. Предложенный подход решает эту задачу за доли секунды на одну молекулу.
Для обучения моделей исследователи собрали специализированный набор данных nablaColors-3D из открытых источников. В него вошли экспериментальные данные об оптических свойствах молекул в разных растворителях вместе с дополнительно рассчитанными пространственными структурами. Записи вручную сверяли с первоисточниками, ошибочные исправляли или удаляли. Это первый крупный набор данных, где для молекул-хромофоров доступны пространственные структуры.
Наличие геометрии в данных позволило применить трёхмерные графовые нейронные сети, которые учитывают пространственное строение молекулы. Такие модели предсказывают оптические свойства точнее, чем предыдущие нейросетевые подходы и методы вычислительной физики.
Учёные сравнили пять современных моделей, работающих с геометрией молекул: PaiNN, DimeNet++, GemNet-OC, eSCN и UniMol+. Каждую модель сначала предобучили на крупных химических датасетах, а затем дообучили на nablaColors-3D для предсказания экспериментальных спектров. Дополнительно в сравнение
Читать на habr.com