О сегментации полипов с использованием модели Segment Anything Model

Полипы толстой кишки являются ключевыми предикторами развития колоректального рака, и их своевременное выявление играет решающую роль в профилактике онкологических осложнений. В работе предложена усовершенствованная модель автоматической сегментации полипов Polyps-SAM2, основанная на фундаментальной архитектуре Segment Anything Model 2 (SAM2). Модель адаптирована для медицинской визуализации путём тонкой настройки с заморозкой параметров кодировщика изображений и внедрением обучаемых слоёв для обработки текстовых инструкций. Эксперименты проведены на двух общепринятых наборах данных - Kvasir-Seg и CVC-ClinicDB. Polyps-SAM2 продемонстрировала высокую точность: значения метрик Dice и IoU составили 0.94 и 0.91 на Kvasir-Seg, а также 0.938 и 0.901 на CVC-ClinicDB, что превосходит или сопоставимо с современными методами сегментации. Несмотря на ограничения при обработке изображений с множественными полипами и зависимость от подсказок (например, ограничивающих рамок), предложенная модель обладает высокой обобщающей способностью и потенциалом для интеграции в клинические системы поддержки принятия решений при проведении колоноскопии.

Colorectal polyps are critical precursors to colorectal cancer, and their early detection is vital for effective prevention. This study introduces Polyps-SAM2 - an enhanced polyp segmentation model built upon the Segment Anything Model 2 (SAM2) foundation. Tailored for medical imaging, Polyps-SAM2 incorporates fine-tuning with a frozen image encoder and integrates trainable layers for processing textual prompts. Evaluated on two benchmark datasets - Kvasir-Seg and CVC- ClinicDB - the model achieves Dice and IoU scores of 0.94/0.91 and 0.938/0.901, respectively, outperforming or matching state-of-the-art segmentation approaches. While limitations remain - particularly in handling images with multiple distinct polyps and reliance on user-provided prompts such as bounding boxes - the model demonstrates strong generalization capabilities and significant potential for clinical deployment in computer-aided colonoscopy systems, thereby improving diagnostic accuracy and workflow efficiency for physicians.

Авторы
Щетинин Е.Ю. 1 , Тютюнник А.А. 2
Издательство
Белгородский государственный национальный исследовательский университет
Номер выпуска
3
Язык
Russian
Страницы
55-63
Статус
Published
Том
10
Год
2025
Организации
  • 1 Севастопольский государственный университет
  • 2 Российский университет дружбы народов им. Патриса Лумумбы
Ключевые слова
colon polyps; segmentation; deep learning; fundamental computer vision models; transformer; полипы толстой кишки; сегментация; глубокое обучение; фундаментальные модели компьютерного зрения; трансформер
Цитировать
Поделиться

Другие записи

Avatkov V.A., Apanovich M.Yu., Borzova A.Yu., Bordachev T.V., Vinokurov V.I., Volokhov V.I., Vorobev S.V., Gumensky A.V., Иванченко В.С., Kashirina T.V., Матвеев О.В., Okunev I.Yu., Popleteeva G.A., Sapronova M.A., Свешникова Ю.В., Fenenko A.V., Feofanov K.A., Tsvetov P.Yu., Shkolyarskaya T.I., Shtol V.V. ...
Общество с ограниченной ответственностью Издательско-торговая корпорация "Дашков и К". 2018. 411 с.