Компания Google Deepmind разработала новую модель искусственного интеллекта AlphaGenome. Она предназначена для прогнозирования того, как даже незначительные изменения в ДНК могут влиять на активность генов.
Основное внимание модель уделяет некодирующим областям генома, которые составляют около 98% всей ДНК человека. Эти участки не содержат прямых инструкций для создания белков, но играют ключевую роль в регуляции генов, определяя, когда и как они активируются, передает incrussia.ru со ссылкой на deepmind.google
Проблема заключалась в том, что эти некодирующие области долгое время оставались загадкой для ученых. В них часто скрываются варианты, связанные с различными заболеваниями, но их расшифровка была крайне сложной. AlphaGenome решает эту проблему: алгоритм способен анализировать до миллиона оснований ДНК за один проход. Модель предсказывает множество молекулярных свойств для каждой позиции в последовательности ДНК, включая начало и конец генов, объем производимой РНК и места связывания белков.
Одной из важнейших функций AlphaGenome является идентификация сайтов сплайсинга — точек, где РНК разрезается и снова соединяется в процессе экспрессии генов. Ошибки в этом процессе могут приводить к серьезным заболеваниям. Модель делает свои прогнозы с точностью до одного основания для сотен типов клеток и тканей. Для этого Deepmind объединил несколько техник ИИ: сверточные нейросети использовались для распознавания коротких паттернов ДНК, а трансформеры — для обработки дальних зависимостей.
По данным Deepmind, AlphaGenome превосходит существующие модели в 22 из 24 тестов и специализированные инструменты в 24 из 26 случаев. Например, модель успешно проанализировала мутацию, наблюдаемую при Т-клеточном остром лимфобластном лейкозе, и точно предсказала, что она создаст новый сайт связывания для белка MYB, активировав соседний ген, связанный с развитием рака. Это подтверждает известный механизм развития болезни.