
Meta AI разработала конкурента DeepMind AlphaFold
Исследователи Meta AI выпустили «модель белкового языка» ESM-2 с 15 млрд параметров и базу данных ESM Metagenomic Atlas, содержащую более 600 млн прогностических структур метагеномных соединений.
https://twitter.com/MetaAI/status/1587467591068459008 Белки представляют собой сложные молекулы, включающие до 20 типов аминокислот, и выполняют все виды биологических функций в организмах. Они складываются в сложные трехмерные структуры, форма которых напрямую влияет на их работу.
Определение типа соединения позволяет ученым понять принцип функционирования белков. Также данные о форме помогают им найти способы имитировать, менять или противостоять этому поведению.
Нельзя взять формулы аминокислот и сразу же определить конечную структуру, а симуляции и эксперименты отнимают много времени.
В Meta AI заявили, что нейросеть-трансформер ESM-2 представляет собой большую языковую модель, разработанную для «изучения эволюционных паттернов и создания точных прогнозов соединений непосредственно из последовательности белка».
Прогнозирование структур белков языковой моделью. Данные: Meta AI.Система обрабатывает последовательности генов, используя метод самоконтролируемого обучения под названием маскированное языковое моделирование.
По словам ученых, они натренировали алгоритм на массиве последовательностей миллионов природных белков.
«При таком подходе модель должна правильно дописывать слова в отрывке текста, например “Чтобы __ или не __, то есть __”. Мы обучили языковую модель заполнять пропуски в последовательности белков вроде “GL_KKE_AHY_G” среди миллионов различных соединений», — говорится в исследовании.
ESM-2 заполняет пробелы в последовательностях белков. Данные: Meta AI.ESM-2 — самая крупная и эффективная нейросеть в своем
Читать на forklog.com

