Разработка системы предиктивной диагностики работы компьютерных систем с помощью методов машинного обучения

Мониторинг и комплексный анализ событий в компьютерных системах, таких как базы данных, файловые системы, серверы, суперкомпьютеры, представляют собой критически важную составляющую обеспечения надежной, безопасной и непрерывной работы современных технологических инфраструктур. Основным источником информации о системных процессах служат лог-файлы - обычные текстовые документы, описывающие всю важную информацию о работе систем в виде своеобразных журналов событий. Анализ вручную таких файлов практически невозможен, т.к. необходимо знать всю специфику компьютерных систем, а размер лог-файлов насчитывает десятки ГБ структурированной текстовой информации. Своевременное обнаружение аномалий и потенциальных рисков отказа помогает снизить вероятность репутационных и финансовых потерь, ведь, к примеру, незапланированный простой баз данных может моментально парализовать работу всей корпоративной системы мониторинга, управленческой аналитики и операционных процессов. При помощи предиктивной диагностики компьютерных систем по журналам событий еще на ранних стадиях можно предупредить наступление отказа, приняв соответствующие меры. Целью данного исследования является разработка компьютерной программы диагностики аномальности компьютерных систем по лог-файлам с помощью методов машинного обучения с частичным привлечением учителя, а также тестирование ее работы на открытых размеченных датасетах с расчетом метрик качества. Программа написана с помощью языка программирования Python и включает в себя несколько последовательных модулей: 1) парсер для препроцессинга логов; 2) векторизатор для построения эмбеддингов слов и событий; 3) детектор аномалий на основе нейронных сетей и классических ML-подходов. Программа также прошла успешную апробацию на двух реальных отказах критически важной системы крупной ИТ-компании - базы данных Vertica.

Авторы
Издательство
Российский университет дружбы народов (РУДН)
Язык
Русский
Страницы
162-167
Статус
Опубликовано
Год
2025
Организации
  • 1 Российский университет дружбы народов
Ключевые слова
машинное обучение; методы обработки естественного языка; анализ логов; детекция аномалий; предиктивная диагностика
Цитировать
Поделиться

Другие записи

Аватков В.А., Апанович М.Ю., Борзова А.Ю., Бордачев Т.В., Винокуров В.И., Волохов В.И., Воробьев С.В., Гуменский А.В., Иванченко В.С., Каширина Т.В., Матвеев О.В., Окунев И.Ю., Поплетеева Г.А., Сапронова М.А., Свешникова Ю.В., Фененко А.В., Феофанов К.А., Цветов П.Ю., Школярская Т.И., Штоль В.В. ...
Общество с ограниченной ответственностью Издательско-торговая корпорация "Дашков и К". 2018. 411 с.
Suveilim M.M.
Информационно-телекоммуникационные технологии и математическое моделирование высокотехнологичных систем. 2025. С. 174-179