АНАЛИЗ МЕТОДОВ ВЫЯВЛЕНИЯ ИСКУССТВЕННО СГЕНЕРИРОВАННЫХ ТЕКСТОВ

Современные модели генерации текстов показывают достаточно хорошие результаты в ряде задач, связанных с написанием небольших текстовых фрагментов. Результаты использования данных моделей могут быть использованы в том числе с целью создания большого количества фейковой информации (новости, рецензии, отзывы, и т. п.). В связи с этим, возникает необходимость разработки алгоритмов, способных отличать тексты, написанные человеком, от автоматически сгенерированных. Данная работа посвящена исследованию методов машинного обучения в решении задач генерации текстов, а также анализу методов, способных выявлять искусственно синтезированные тексты. Рассматриваются существующие подходы к генерации текстов и варианты их практического применения. Приводится разбор существующих наборов данных для анализа эффективности работы методов выявления искусственно синтезированных текстов. Также рассматривается подход к созданию собственного набора данных для решения данной задачи.

Авторы

Волков С.С. ^1, ²

Сборник материалов конференции

Облачные и распределенные вычислительные системы в электронном управлении. ОРВС - 2023

Язык

Русский

Страницы

27-30

Статус

Опубликовано

Год

2024