В настоящее время в Российской Федерации происходит интенсивное развитие инструментов ранней медицинской диагностики с использованием методов машинного обучения, в том числе с использованием фотографий и видеозаписей, полученных при помощи медицинского оборудования. Данная работа посвящена разработке модели сверточной нейронной сети классификации заболеваний речевых органов. Используется датасет, полученный методом ларингоскопии. Работа включает этапы разметки датасета, его разделения на обучающую выборку и выборку для тестирования, разработки архитектуры сверточной нейронной сети, обучения модели и ее валидации. Автором использовался фреймворк PyTorch. Результаты работы могут быть использованы в медицинской диагностике при первичном определении состояния гортани человека.
Currently, the Russian Federation is undergoing intensive development of tools for early medical diagnosis using machine learning methods, including the use of photographs and video recordings obtained with the help of medical equipment. This paper is devoted to the development of a convolutional neural network model for classification of speech organ diseases. A dataset obtained by laryngoscopy is used. The work includes the stages of datset partitioning, its division into training and testing samples, development of convolutional neural network architecture, model training and validation. The author used the PyTorch framework. The results of the work can be used in medical diagnostics in the primary determination of the state of the human larynx.