АНАЛИЗ МЕТОДОВ ВЫЯВЛЕНИЯ ИСКУССТВЕННО СГЕНЕРИРОВАННЫХ ТЕКСТОВ

Современные модели генерации текстов показывают достаточно хорошие результаты в ряде задач, связанных с написанием небольших текстовых фрагментов. Результаты использования данных моделей могут быть использованы в том числе с целью создания большого количества фейковой информации (новости, рецензии, отзывы, и т. п.). В связи с этим, возникает необходимость разработки алгоритмов, способных отличать тексты, написанные человеком, от автоматически сгенерированных. Данная работа посвящена исследованию методов машинного обучения в решении задач генерации текстов, а также анализу методов, способных выявлять искусственно синтезированные тексты. Рассматриваются существующие подходы к генерации текстов и варианты их практического применения. Приводится разбор существующих наборов данных для анализа эффективности работы методов выявления искусственно синтезированных текстов. Также рассматривается подход к созданию собственного набора данных для решения данной задачи.

Авторы
Язык
Русский
Страницы
27-30
Статус
Опубликовано
Год
2024
Организации
  • 1 Российский университет дружбы народов
  • 2 Федеральный исследовательский центр «Информатика и управление» РАН
Ключевые слова
генерация текстов; обработка естественного языка; машинное обучение
Цитировать
Поделиться

Другие записи