Диссертация
Хрисанфов Михаил Дмитриевич
Кандидат наук
Статус диссертации
Кандидат наук
Доктор наук
Кирсанов Дмитрий Олегович
Доктор наук
Канатьева Анастасия Юрьевна
Кандидат наук
химические науки
Работа посвящена усовершенствованию существующих и разработке новых подходов к обработке и предсказанию хроматомасс-спектральных данных, в частности поиску ошибок в базах времен и индексов удерживания, а также предсказанию масс-спектров соединений по их структуре и молекулярных отпечатков пальцев по масс-спектрам электронной ионизации. Предложенный подход к поиску ошибок в хроматографических базах данных был реализован на на языке программирования Python и опубликован в виде открытого исходного кода вместе с пошаговой инструкцией. Эффективность подхода была оценена с использованием двух групп синтетических наборов данных, а также баз данных NIST RI и METLIN SMRT, что позволило найти 2093 и 1544 потенциально ошибочные записи, соответственно. Предложенный алгоритм округления значений m/z масс-спектров низкого разрешения (∆m_50% ~ 0.5) с плавающей запятой до целочисленных позволят минимизировать влияние случайных приборных погрешностей на результаты. Подход был впоследствии включен в пакет OpenChrom для обработки хроматомасс-спектральных данных. Оптимизированные архитектуры и гиперпараметры нейросетевых моделей позволили увеличить точность предсказания масс-спектров электронной ионизации по структуре молекулы, а также ускорить обучение и улучшить правильность, точность и полноту предсказания молекулярных отпечатков по масс-спектрам электронной ионизации. Код и предобученные веса моделей опубликованы в открытом доступе.
| # | Название файла | Размер |
|---|---|---|
| 1 | Диссертация | 4 MB |
| 2 | Отзыв научного руководителя (консультанта) | 791 KB |
| 3 | Сведения о научных руководителях (консультантах) | 17 KB |
| 4 | Сведения об официальных оппонентах, включая публикации | 156 KB |
| 5 | Автореферат | 1,002 KB |
| 6 | Протокол приема диссертации к защите | 60 KB |