Выявление источников заимствования для документа с использованием моделей дистрибутивной семантики

В статье предложен метод выявления источников заимствований для документа, использующий модель дистрибутивной семантики для формирования множества запросов к поисковой машине. Рассмотрены основные способы выявления заимствований и их источников. Показано, как выделить из документа запросы для поиска источников, используя векторное пространство, построенное на большом корпусе текстов при помощи инструмента Word2Vec. Приведены результаты работы метода.

Source Retrieval for a Document Using Models of Distributive Semantics

This paper is about method for identifying sources of plagiarism for a document, using a model of distributive semantics to form a set of queries to a search engine. The main ways of revealing plagiarisms and their sources are considered. It shows how to select queries from the document to search for sources using a vector space built on a large body of texts using the Word2Vec tool. The results of method's work are presented.

Издательство
Российский университет дружбы народов (РУДН)
Язык
Русский
Страницы
180-182
Статус
Опубликовано
Год
2018
Организации
  • 1 Российский университет дружбы народов
Ключевые слова
word2vec; source retrieval; distributive semantic; plagiarism detection; дистрибутивная семантика; выявление заимствований; антиплагиат
Цитировать
Поделиться

Другие записи

Аватков В.А., Апанович М.Ю., Борзова А.Ю., Бордачев Т.В., Винокуров В.И., Волохов В.И., Воробьев С.В., Гуменский А.В., Иванченко В.С., Каширина Т.В., Матвеев О.В., Окунев И.Ю., Поплетеева Г.А., Сапронова М.А., Свешникова Ю.В., Фененко А.В., Феофанов К.А., Цветов П.Ю., Школярская Т.И., Штоль В.В. ...
Общество с ограниченной ответственностью Издательско-торговая корпорация "Дашков и К". 2018. 411 с.
Лукин А.В.
Информационно-телекоммуникационные технологии и математическое моделирование высокотехнологичных систем. 2018. С. 186-188