



Вышел Evo 2: ИИ генерирующий ДНК
А если быть точным: ДНК/РНК и белковые структуры. И не только генерирующий, но и умеющий анализировать геном, предсказывать мутации, etc.
Это полностью открытая модель, выпущенная совместно NVidia и Arc Institute.
Теперь ученые всего мира могут воспользоваться Evo 2 – новой мощной фундаментальной моделью, понимающей генетический код всех форм жизни (звучит очень громко, но это взято из официального анонса). Представленная сегодня ИИ-модель, которая заявляется как крупнейшая модель в открытом доступе для генетических данных, Evo 2 была разработана на платформе NVIDIA DGX Cloud в сотрудничестве с некоммерческим биомедицинским исследовательским институтом Arc Institute и Стэнфордским университетом. Evo 2 доступна для разработчиков по всему миру через платформу NVIDIA BioNeMo, включая NVIDIA NIM – микросервис для развертывания ИИ.
Обученная на массиве данных объемом почти 9 трлн нуклеотидов (строительных блоков ДНК и РНК), Evo 2 применяется в биомолекулярных исследованиях. Она способна:
предсказывать структуру и функцию белков на основе их генетической последовательности,
идентифицировать новые молекулы для медицины и промышленности,
анализировать влияние мутаций на функции генов.
Модель была обучена на 2 048 NVIDIA H100 GPUs на NVIDIA DGX Cloud.
Основные характеристики:
Данные для обучения: Все домены жизни + бактериофаги (9T нуклеотидов)
Параметры модели: 7B + 40B
Контекстное окно: до 1 048 576 токенов
Модальности: ДНК, РНК, белки
Безопасность: Исключены вирусы эукариот
Применение: Широкие кросс-видовые задачи, продвинутое биологическое моделирование
Прогнозирующие возможности Evo 2 превосходят специализированные модели в различных задачах:
Анализ влияния мутаций: модель достигает передовой точности (SotA) в предсказании функциональных
Читать на habr.com
