Патофизиология метаболического синдрома: новые возможности искусственного интеллекта

Актуальность. По сравнению с лабораторными методами проведения биохимических анализов крови алгоритмы искусственного интеллекта предлагают несколько ключевых преимуществ. Они сравнимы с традиционными методами по точности и эффективности, но значительно превосходят их по экономичности Целью исследования является разработка интерпретируемой модели вычисления липидного профиля пациента с помощью машинного обучения на основе деперсонализированных данных о диспансеризации (возраст, пол, общий анализ крови (ОАК), общий холестерин, глюкоза крови). Материалы и методы. Разработанный алгоритм представляет собой комплекс технологических решений, позволяющий рассчитывать взаимосвязь между различными биохимическими параметрами в организме человека с помощью передовых алгоритмов глубокого обучения, таких как градиентный бустинг на решающих деревьях и полносвязные нейронные сети. База данных включала в себя результаты лабораторных показателей 62 192 пациентов: холестерин (ХС), липопротеины высокой плотности (ЛПВП), триглицериды (ТГ), липопротеины низкой плотности (ЛПНП), ОАК, а также пол и возраст пациентов. Результаты. Была проведена оценка качества моделей на тестовой выборке с использованием метрик, таких как коэффициент детерминации (R2), средняя абсолютная ошибка (MAE), средняя абсолютная ошибка в процентах (MAPE). R2 для корреляции между концентрацией ЛПНП и группы данных о диспансеризации составила 0,94 при MAE 0,20 и MAPE 0,06. Корреляция между ЛПВП и ТГ с данными о диспансеризации была значительно ниже (R2 составил 0,51 и 0,41 соответственно, MAE 0,20 и 0,53 соответственно, а MAPE 0,15 и 0,40 соответственно). Заключение. Разработка алгоритма искусственного интеллекта, способного прогнозировать уровни ЛПНП, ЛПВП и триглицеридов на основе менее дорогостоящих лабораторных тестов, таких как уровень холестерина и глюкозы в крови, имеет огромный потенциал для повышения доступности здравоохранения. Хотя на сегодняшний день достигнута высокая точность (94%) только при прогнозировании ЛПНП, следующий важный шаг заключается в подборе способа обработки и расширении набора данных, используемого для обучения для более точного предсказания уровней ЛПВП и ТГ.

Relevance. Compared to laboratory methods of performing biochemical blood tests, artificial intelligence algorithms offer several key advantages. They are comparable to traditional methods in accuracy and efficiency, but significantly superior to them in cost-effectiveness. The goal of the study is to develop an interpretable model for calculating a patient’s lipid profile using machine learning based on depersonalized medical examination data (age, gender, complete blood count (CBC), total cholesterol, blood glucose). Materials and methods. The developed algorithm is a set of technological solutions that allows one to calculate the relationship between various biochemical parameters in the human body using advanced deep learning algorithms, such as gradient boosting on decision trees and fully connected neural networks. The database included the results of laboratory parameters of 62,192 patients: cholesterol (C), high-density lipoprotein (HDL), triglycerides (TG), low-density lipoprotein (LDL), CBC, as well as the sex and age of the patients. Results. The quality of the models was assessed on the test set using metrics such as the coefficient of determination (R2), mean absolute error (MAE), mean absolute percentage error (MAPE). The R2 for the correlation between LDL concentration and follow-up data group was 0.94 with MAE 0.20 and MAPE 0.06. The correlation between HDL and TG with follow-up data was significantly lower (R2 was 0.51 and 0.41, respectively, MAE 0.20 and 0.53, respectively, and MAPE 0.15 and 0.40, respectively). Conclusion. The development of an artificial intelligence algorithm that can predict LDL, HDL and triglyceride levels based on less expensive laboratory tests such as cholesterol and blood glucose levels have enormous potential to improve access to healthcare. Although high accuracy (94%) has been achieved to date in LDL-C prediction alone, the next important step is to select the processing method and expand the training dataset to more accurately predict HDL and TG levels.

Журнал
Издательство
Научно-исследовательский институт общей патологии и патофизиологии
Номер выпуска
2
Язык
Русский
Страницы
44-47
Статус
Опубликовано
Том
22
Год
2024
Организации
  • 1 Автономная некоммерческая организация дополнительного профессионального образования «Институт лабораторной медицины»
  • 2 Федеральное государственное автономное образовательное учреждение высшего образования «Российский университет дружбы народов имени Патриса Лумумбы»
  • 3 ООО «РТК-элемент»
Ключевые слова
machine learning; artificial intelligence; metabolic syndrome; cbc; cholesterol; Ldl; Hdl; triglycerides; машинное обучение; искусственный интеллект; метаболический синдром; общий анализ крови; холестерин; лпнп; лпвп; триглицериды
Цитировать
Поделиться

Другие записи

Аватков В.А., Апанович М.Ю., Борзова А.Ю., Бордачев Т.В., Винокуров В.И., Волохов В.И., Воробьев С.В., Гуменский А.В., Иванченко В.С., Каширина Т.В., Матвеев О.В., Окунев И.Ю., Поплетеева Г.А., Сапронова М.А., Свешникова Ю.В., Фененко А.В., Феофанов К.А., Цветов П.Ю., Школярская Т.И., Штоль В.В. ...
Общество с ограниченной ответственностью Издательско-торговая корпорация "Дашков и К". 2018. 411 с.