DeepMind открыла код AlphaGenome — ИИ, который читает миллион букв ДНК за раз
Google DeepMind опубликовала в Nature модель AlphaGenome — нейросеть, которая анализирует до миллиона пар оснований ДНК и предсказывает функцию некодирующих участков генома. Это те самые 98% ДНК, которые долгое время считались «мусорными», но на деле управляют тем, как и когда работают гены. Вместе со статьей команда выложила на GitHub исходный код и веса модели для некоммерческого использования.
AlphaGenome принимает на вход последовательность длиной до 1 Мб — вдвое больше, чем у предшественников — и одновременно предсказывает тысячи функциональных геномных профилей по 11 типам сигналов: экспрессия генов, доступность хроматина, сплайсинг, связывание транскрипционных факторов и другие. Архитектура построена на U-Net с трансформерами, а входная последовательность разбивается на фрагменты по 131 тысяче пар оснований, которые обрабатываются параллельно на нескольких устройствах. В тестах модель превзошла лучшие специализированные инструменты в 25 из 26 задач по предсказанию эффектов генетических вариантов.
Практическое применение уже есть. В сентябре 2025 года исследователи из клиники Мэйо провели хакатон, где с помощью AlphaGenome пытались найти причины 29 неразгаданных генетических заболеваний. Биоинформатик Эрик Кли, один из организаторов, рассказал, что модель корректно предсказала влияние мутации на экспрессию генов в клетках сердца — результат совпал с экспериментальными данными. Для онкологов инструмент тоже полезен: при сравнении геномов здоровых и раковых клеток обычно всплывают тысячи однобуквенных замен, и AlphaGenome ранжирует их по вероятности функционального эффекта.
С момента выхода препринта в июне 2025 года моделью воспользовались около 3000 ученых из 160 стран, отправляя примерно миллион запросов в день.
Читать на habr.com