Исследование метода классификации новостей на основе дистрибутивной семантики

В статье рассматривается метод классификации новостей с использованием дистрибутивной семантики текста. Показано влияние признаков, полученных с использованием моделей дистрибутивной семантики, на метрики качества классификации. В качестве набора данных взят «The 20 Newsgroups dataset». Представлены результаты сравнительного анализа популярных классификаторов, таких как Random Forest, KNeighbours, Support Vector Machine, Logistic Regression.

Study of the Method of Classification of News Based on Distributive Semantics

This paper is about a method for classifying news using the distributive semantics of the text. The influence of signs, features using models of distributive semantics, on the quality metrics of classification is shown. As a set of data was taken “The 20 Newsgroups dataset”. Presented results of a comparative analysis of popular classifiers, such as a Random Forest, KNeighbours, Support Vector Machine, Logistic Regression.

Издательство
Российский университет дружбы народов (РУДН)
Язык
Русский
Страницы
219-221
Статус
Опубликовано
Год
2018
Организации
  • 1 Российский университет дружбы народов
Ключевые слова
text classification; Svm; Knn; Rf; LR; distributive semantic; классификация текстов; дистрибутивная семантика
Цитировать
Поделиться

Другие записи

Аватков В.А., Апанович М.Ю., Борзова А.Ю., Бордачев Т.В., Винокуров В.И., Волохов В.И., Воробьев С.В., Гуменский А.В., Иванченко В.С., Каширина Т.В., Матвеев О.В., Окунев И.Ю., Поплетеева Г.А., Сапронова М.А., Свешникова Ю.В., Фененко А.В., Феофанов К.А., Цветов П.Ю., Школярская Т.И., Штоль В.В. ...
Общество с ограниченной ответственностью Издательско-торговая корпорация "Дашков и К". 2018. 411 с.