Сотрудники Химического факультета имени М.В. Ломоносова разработали аналитическую схему, позволяющую по химическим «отпечаткам пальцев» делать заключения о протекающих в организме процессах.
Схема пригодится и врачам, и фармакологам, и экологам, и даже пищевикам.
Совокупность низкомолекулярных соединений (углеводы, аминокислоты, органические кислоты, нуклеотиды и другие органические молекулы) в организме называют «метаболомом». Определение состава метаболома важно для динамического анализа процессов, происходящих в организме. При нормальных условиях содержание соединений варьируется в некоторых пределах. При развитии заболевания метаболом пораженной ткани может резко измениться, и экстремальные (низкие или высокие) концентрации веществ могут стать биомаркерами патологических процессов.
Десятки биомаркеров уже нашли широкое применение в клинической практике: определение уровня креатинина в крови и моче используют для оценки функции почек, анализ на содержание желчных кислот в крови — функции печени. Междисциплинарная научная область, возникшая на стыке молекулярной биологии, биохимии и медицины - метаболомика, изучает качественный и количественный состав метаболома клетки, ткани или организма и его изменения во времени. Помимо обнаружения заболеваний, метаболомика помогает в поиске новых лекарственных средств, в микробиологии, пищевой химии, а также мониторинге состояния окружающей среды.
В метаболомике до сих пор нет единой процедуры анализа данных. Дело в том, что экспериментальные данные могут быть получены из десятков серий измерений биологических образцов в разных условиях. Для анализа таких данных используют различные статистические методы, которые позволяют подтвердить или опровергнуть гипотезы. В зависимости от принятых в конкретной лаборатории приемов и имеющегося опыта, статистический анализ проводят самыми разнообразными способами, долго выбирая условия и методы. Сотрудники Химического факультета МГУ предложили универсальную рабочую схему анализа метаболома, комбинировав существующие статистические методики. Ученые собрали несколько десятков наборов экспериментальных данных из открытых репозиториев. Экспериментальные данные (анализы 8 добровольцев,20 пациентов с колоректальным раком до операции и 12 пациентов после операции), предоставленных из НМИЦ колопроктологии имени А.Н. Рыжих, ученые использовали для первичной оптимизации схемы анализа данных.
«По формальным признакам, используемый нами подход никто в таком виде до этого не использовал, мы объединили существующие подходы с некоторыми изменениями. Нашу работу выгодно отличает от прочих беспрецедентный объем валидации - 36 наборов данных, тогда как обычно ограничиваются тремя-пятью», - прокомментировал один из авторов работы, младший научный сотрудник кафедры аналитической химии Химического факультета МГУ Иван Плющенко
Метаболом анализируют с помощью мощных методов, позволяющих определять в образце тысячи соединений. В то же время, из-за большого числа компонентов анализатор прибора загрязняется и итоговый сигнал прибора искажается. Поэтому необходимо проводить коррекцию сигнала, особенно в случае объемных исследований.
Ученые использовали методы машинного обучения, характерной чертой которых является не прямое решение задачи, а обучение моделей в процессе решения множества сходных задач. Для этого исходный набор данных многократно разбивают на две части — один набор используют для построения оптимальной модели, а второй - для проверки характеристик модели. Методика включает в себя комбинацию мощных методов машинного обучения, статистического анализа и коррекцию дрейфа сигнала приборов, что позволяет решать задачи классификации и выделять минимально необходимый для правильной классификации набор биомаркеров.
Разработанный сотрудниками МГУ подход призван стандартизировать процедуру анализа данных в метаболомике. Все вычисления выполнены в одной программе, на одном языке программирования и бесплатно распространяется. Процесс вычисления может быть ускорен за счет параллельных вычислений.
Результаты исследования опубликованы в журнале Analytical Methods.
Дмитрий Степнов