Обоснование. Рак шейки матки (РШМ) продолжает оставаться серьезной проблемой здоровья, занимая четвертое место по распространенности и третье место по смертности среди женщин во всем мире. Puск РШМ увеличивается с возрастом, но основной контингент заболевших приходится на репродуктивный период. Эксперты прогнозируют рост заболеваемости и смертности от РШМ в будущем, особенно среди женщин старше 65 лет, а также в районах с ограниченным доступом к медицинским ресурсам. Это подчеркивает необходимость улучшения методов персонифицированной диагностики и прогнозирования риска развития РШМ. Искусственный интеллект и, в частности, машинное обучение (МО), предлагает многообещающий подход к разработке прогностических моделей на основе рутинных методов обследования, в том числе лабораторных показателей крови, что может помочь ранней диагностике РШМ. Цель. Разработка системы поддержки принятия врачебных решений - СППВР, для выявления пациенток с высоким риском развития РШМ. Методы. Проведено одноцентровое когортное ретроспективное исследование женщин старше 18 лет на базе МНИОИ им. П. А. Герцена в 2000-2024 гг. В исследовании участвовали 452 женщины в возрасте 42,0 (медиана 33,75; 50,0) лет. Для построения прогностической модели предсказания наличия РШМ были использованы следующие алгоритмы машинного обучения: MLR - Lasso, MLR - Ridge, Extra Tree (ET), k-Nearest Neighbors (kNN), Support Vector Machine (SVM), Naive Bayes (NB), Random Forest (RF), Gradient Boosting (XGB), Catboost (CB) и LightGBM (LGMB). Результаты. Лучшие результаты получены при построении прогностической модели на основе алгоритма МО XGB, который на тестовой выборке показал следующие рузультаты: ROC-AUC = 98,2 % (95 % ДИ 96,0; 99,7), точность = 94,5 % (95 % ДИ 91,0; 97,2), чувствительность = 95,0 % (95 % ДИ 91,2; 98,3), специфичность = 91,7 % (95 % ДИ 81,0; 100,0). В качестве основных предикторов использвались: агрегация тромбоцитов с АДФ, СОЭ, Д-димер, трансферин, возраст и ряд других. Заключение. Это исследование представило новый способ выявления РШМ на основе рутинных лабораторных гематологических показателей. Построенная модель может быть использована в системе поддержки принятия врачебных решений (СППВР) для своевременного выявления женщин с подозрением на РШМ.
Background. Cervical cancer (CC) continues to be a major health problem, ranking as the fourth most common cancer among women worldwide and the third leading cause of death. The risk of CC increases with age, but the majority of cases occur during the reproductive period. Experts predict an increase in incidence and mortality from CC in the future, especially among women over 65 years of age, and in areas with limited access to medical care. This emphasizes the need to improve methods for personalized diagnosis and prediction of the risk for developing cervical cancer. Artificial intelligence, and in particular machine learning (ML), offers a promising approach for developing predictive models based on routine examination methods of laboratory blood parameters, which can help in the early diagnosis of cervical cancer. Aim. Development of a medical decision support system MDSS, to identify patients at high risk of developing cervical cancer. Methods. A single-center cohort retrospective study of women over 18 years of age was conducted on data collected in 2000-2024 at the Moscow Research Institute named after P. A. Herzen. The study included 452 women aged 42.0 [median 33.75; 50.0] years. The following machine learning algorithms were used to build a model for predicting the presence of CC: MLR Lasso, MLR Ridge, Extra Tree (ET), k-Nearest Neighbors (kNN), Support Vector Machine (SVM), Naive Bayes (NB), Random Forest (RF), Gradient Boosting (XGB), Catboost (CB) and LightGBM (LGMB). Results. The best predictive results were obtained when building a model based on the XGB MO algorithm, which on the test sample showed the following results: ROC-AUC = 98.2 % [95 % CI 96.0; 99.7], accuracy = 94.5 % [95 % CI 91.0; 97.2], sensitivity = 95.0 % [95 % CI 91.2; 98.3], specificity = 91.7 % [95 % CI 81.0; 100.0]. The major predictive factors were platelet aggregation with ADP, ESR, D-dimer, transferrin and age. Conclusions. This study introduces a new method for predicting the risk of CC based on routine laboratory hematological parameters. The constructed model can be used in a medical decision support system (MDSS) for the timely identification of women with high risk of cervical cancer