Диссертация
Пензар Дмитрий Дмитриевич
Кандидат наук
Статус диссертации
Вычислительное предсказание эффектов мутаций в регуляторных районах генов
Доктор наук
Доктор наук
Уткин Лев Владимирович
Доктор наук Профессор
Орлов Юрий Львович
Доктор наук
биологические науки
Полногеномная информация об индивидуальных вариантах человека имеет важное значение для ранней диагностики заболеваний и подбора персонализированной терапии. Практическое использование индивидуального генома ограничено уже не столько стоимостью лабораторной работы, сколько доступностью и достоверностью вычислительных методов для аннотации эффектов и приоритезации индивидуальных однонуклеотидных вариантов. Для аннотации замен в белок-кодирующих районах существуют общепринятые и хорошо себя зарекомендовавшие подходы, но инструменты для анализа нуклеотидных замен в некодирующих областях генов, на которые приходится порядка 90% клинически значимых мутаций, требуют активного развития и новых решений. Целью данной работы стала разработка эффективного вычислительного метода для оценки эффектов регуляторных замен через предсказание активности регуляторных районов генома на основе данных современных высокопроизводительных омиксных методов. В работе был предложена и протестирована нейросетевая модель LegNet, построенная на основе современной полносверточной нейросетевой архитектуры. И по авторским оценкам, и по результатам независимого международного соревнования, в задаче предсказания активности регуляторных последовательностей дрожжей, измеренных в ходе массового параллельного репортерного эксперимента, модель LegNet превзошла альтернативные решения. Следующим шагом стала успешная адаптация LegNet для работы с регуляторными последовательностями человека и данным соответствующих репортерных экспериментов. В результате, LegNet был успешно применен для предсказания эффектов однонуклеотидных регуляторных вариантов, в частности, аллель-специфичной доступности хроматина и аллель-специфичного связывания факторов транскрипции . В работе удалось показать, что предсказания модели биологически интерпретируемы и модель способна учитывать сложные нелинейные эффекты взаимодействия различных транскрипционных факторов. Наконец, адаптация LegNet на основе метода "холодной диффузии" позволила разработать методологию дизайна промоторных последовательностей, обеспечивающих заданную экспрессию целевого гена.
# | Название | Размер |
---|---|---|
1 | Сведения о научных руководителях (консультантах) | 264 KB |
2 | Автореферат | 3 MB |
3 | Протокол приема диссертации к защите | 63 KB |
4 | Диссертация | 12 MB |
5 | Отзыв научного руководителя (консультанта) | 539 KB |