Эксплоративный патентный поиск

Предложен эффективный метод поиска тематически похожих документов. Показана его применимость для решения задач эксплоративного патентного поиска. Метод позволяет снизить трудоемкость и повысить качество решения аналитических задач, связанных с патентным поиском и анализом. В качестве признаков для представления текстовых документов используются как отдельные лексемы, так и словосочетания, выделяемые синтаксически. Это позволяет решить проблему экспоненциального роста размерности признакового пространства и дает возможность эффективной индексации больших массивов текстовой информации. Представлены результаты экспериментов по решению одной из задач экспертизы заявок на изобретения и полезные модели. Сделаны выводы о перспективности использования метода при решении других задач.

EXPLORATORY PATENT SEARCH

The paper presents an effective method for topically similar document retrieval. The exploratory patent search based on this method is proposed. The developed method reduces complexity and time of patent expertise providing the computer assistance of patent search and analysis. The phrases extracted by the parser as well as single lexemes are used as descriptors for a document. This approach prevents exponential growth of the feature space and provides effective indexing even for large text collections. The results of experiments show that the proposed method significantly outperforms the basic keyword-based approach. Conclusions are made about the prospects of using the method for solving other problems such as source retrieval for plagiarism detection and full-text clustering.

Издательство
Федеральное государственное учреждение "Федеральный исследовательский центр "Информатика и управление" Российской академии наук
Номер выпуска
1
Язык
Russian
Страницы
89-94
Статус
Published
Том
12
Год
2018
Организации
  • 1 Skolkovo Institute of Science and Technology
  • 2 Institute for Systems Analysis, Federal Research Center “Computer Science and Control”of the Russian Academy of Sciences
  • 3 Российский университет дружбы народов
  • 4 Peoples' Friendship University of Russia
Ключевые слова
patent search; topic modeling; topically similar document retrieval; search and analytical engines; exploratory search; эксплоративный поиск; патентный поиск; тематическое моделирование; поиск тематически похожих документов; поисково-аналитические системы
Цитировать
Поделиться

Другие записи

Avatkov V.A., Apanovich M.Yu., Borzova A.Yu., Bordachev T.V., Vinokurov V.I., Volokhov V.I., Vorobev S.V., Gumensky A.V., Иванченко В.С., Kashirina T.V., Матвеев О.В., Okunev I.Yu., Popleteeva G.A., Sapronova M.A., Свешникова Ю.В., Fenenko A.V., Feofanov K.A., Tsvetov P.Yu., Shkolyarskaya T.I., Shtol V.V. ...
Общество с ограниченной ответственностью Издательско-торговая корпорация "Дашков и К". 2018. 411 с.