Диссертация

Пензар Дмитрий Дмитриевич

Кандидат наук

Статус диссертации

  
Диплом Кандидат наук
  
Решение о выдаче диплома
  
Положительное заключение АК
  
На рассмотрении в АК
  
Положительная защита
31.01.2025 
Объявление опубликовано
20.01.2025 
Принят к защите
17.01.2025 
Заключение комиссии
16.12.2024 
Документы приняты
Тема диссертации

Вычислительное предсказание эффектов мутаций в регуляторных районах генов

ФИО соискателя
Пензар Дмитрий Дмитриевич
Степень на присвоение
Кандидат наук
Дата и время защиты
05.03.2025 17:00
Место проведения защиты
119234, Москва, Ленинские горы, д. 1, стр. 73, Факультет биоинженерии и биоинформатики, ауд. 221
Научный руководитель
Кулаковский Иван Владимирович
Доктор наук
Оппоненты
Храмеева Екатерина Евгеньевна
Доктор наук
Уткин Лев Владимирович
Доктор наук Профессор
Орлов Юрий Львович
Доктор наук
Место выполнения работы
Институт общей генетики им. Н.И. Вавилова, лаборатория системной биологии и вычислительной генетики
Специальность
1.5.8. Математическая биология, биоинформатика
биологические науки
Диссертационный совет
Телефон совета
+7 495 939-13-57

Полногеномная информация об индивидуальных вариантах человека имеет важное значение для ранней диагностики заболеваний и подбора персонализированной терапии. Практическое использование индивидуального генома ограничено уже не столько стоимостью лабораторной работы, сколько доступностью и достоверностью вычислительных методов для аннотации эффектов и приоритезации индивидуальных однонуклеотидных вариантов. Для аннотации замен в белок-кодирующих районах существуют общепринятые и хорошо себя зарекомендовавшие подходы, но инструменты для анализа нуклеотидных замен в некодирующих областях генов, на которые приходится порядка 90% клинически значимых мутаций, требуют активного развития и новых решений. Целью данной работы стала разработка эффективного вычислительного метода для оценки эффектов регуляторных замен через предсказание активности регуляторных районов генома на основе данных современных высокопроизводительных омиксных методов. В работе был предложена и протестирована нейросетевая модель LegNet, построенная на основе современной полносверточной нейросетевой архитектуры. И по авторским оценкам, и по результатам независимого международного соревнования, в задаче предсказания активности регуляторных последовательностей дрожжей, измеренных в ходе массового параллельного репортерного эксперимента, модель LegNet превзошла альтернативные решения. Следующим шагом стала успешная адаптация LegNet для работы с регуляторными последовательностями человека и данным соответствующих репортерных экспериментов. В результате, LegNet был успешно применен для предсказания эффектов однонуклеотидных регуляторных вариантов, в частности, аллель-специфичной доступности хроматина и аллель-специфичного связывания факторов транскрипции . В работе удалось показать, что предсказания модели биологически интерпретируемы и модель способна учитывать сложные нелинейные эффекты взаимодействия различных транскрипционных факторов. Наконец, адаптация LegNet на основе метода "холодной диффузии" позволила разработать методологию дизайна промоторных последовательностей, обеспечивающих заданную экспрессию целевого гена.