This article is focused on a comparative analysis of linear models, namely the support vector machine and two implementations of logistic regression (multinomial and one-versus) in the traffic classification problem based on the NSL-KDD dataset. In addition, the influence of methods of reducing the dimension of the training sample - principal component analysis and elastic control on the above models was studied. The results of the experiments showed that the logistic model makes it possible to achieve 90% confidence, which is approximately equal to the indicator of the support vector machine. After substantiating the relevance of this issue in the introduction and reviewing the existing methods in the literature, we considered the mathematical description of these methods. After describing the data set and network architecture, allowing them to be obtained, we will carry out a numerical evaluation of the constructed models using the “F1”, “accuracy and accuracy” metrics. The final stage of this article will be conclusions about the work done and a proposal for further research.
В данной статье рассматривается сравнительный анализ линейных моделей, а именно машины опорных векторов и двух реализаций логистической регрессии (мультиномиальной и one-versus) в задаче классификации трафика на основе набора данных NSL-KDD. Также было изучено влияние методов сокращения размерности обучающей выборки - анализа главных компонент и эластичного управления на вышеперечисленные модели. Результаты экспериментов показали, что логистическая модель позволяет достичь 90% уверенности, что примерно равно показателю машины опорных векторов. После обоснования актуальности данного вопроса во введении и обзора существующих методов в литературе, мы рассмотрели математическое описание этих методов. После описания набора данных и архитектуры сети, позволяющих их получить, мы проведем численную оценку построенных моделей с использованием метрик «F1», «точность и достоверность». Заключительным этапом данной статьи будут выводы о проделанной работе и предложение по дальнейшим исследованиям