Создание открытого междисциплинарного классификатора социогуманитарных ценностей с помощью аннотирования мультифрагментов

Понимание основных ценностных ориентаций, кодов сторон коммуникации способствует налаживанию межкультурного взаимодействия и важно для развития международных отношений. С эволюцией социальных сетей как пространства для общения интернет приобрел большее значение с точки зрения репрезентации ценностного кода и разных культур. Своевременное обнаружение смещения ценностных кодов, признаков навязывания стереотипов в ключевых сферах жизни (морально-нравственные ценности, политика, семья, здоровье и др.) с использованием технологий искусственного интеллекта может способствовать эффективному прогнозированию тенденций состояния общества, существующих в нем когнитивных искажений. Описанная методология выявления культурных кодов на больших текстовых коллекциях с помощью аннотирования мультифрагментов расширяет схему обобщенного контент-анализа и применима для последующей автоматизации процесса с использованием моделей машинного обучения. Данная работа раскрывает критерии классификации для формирования междисциплинарного рубрикатора, созданного на основе научных работ российских и зарубежных ученых, применимого наднационального и отечественного законодательства, а также вопросы организации разметки и контроля ее качества. В статье авторы демонстрируют разработанную методологию на примере разметки контента из нового типа масс-медиа - telegram-каналов. Особенность нашего подхода - аннотирование мультифрагментов, т. е. комбинаций отдельных фрагментов текста, метками культурных концептов и тональности. Открытость рубрикатора, внесенная в аксиоматику методологии, позволила создать междисциплинарный рубрикатор социогуманитарных ценностей из 105 меток культурных концептов, разделенных на семь групп: витальные, морально-нравственные, политические, религиозные, социальные, экзистенциальные и познавательные, эстетические и гедонистические. Авторы применили четыре варианта тональностных меток: положительная, нейтральная, отрицательная и конфликт тональности, что в том числе позволило точнее классифицировать тексты, где тональность мультифрагмента и контекста противоположны.

Understanding fundamental human values and the value orientations of interacting parties is essential for fostering effective intercultural contact. This comprehension is critical for enhancing international relations. By recognizing and respecting the diverse beliefs and principles that shape individuals and cultures, we can bridge gaps and build stronger connections across borders. The methodology for detecting human value concepts in large text collections by means of annotating multi-fragments expands the scheme of a basic content analysis and is applicable for subsequent automation using machine learning models. This paper describes the classification criteria for establishing an open interdisciplinary classifier created on some findings of the Russian and foreign scientific schools as well as applicable supranational and domestic regulations, along with the management and quality control procedures for the labeling process. An example of marking up content from a new type of mass media - Telegram channels is used by the authors to illustrate their approach. A peculiarity of our approach is annotating multi-spans, combinations of individual text fragments, with labels of cultural concepts and tonality. Being an axiom of the method, the openness of the classifier has led to building an interdisciplinary classifier to comprise 105 human values in 7 groups such as vital, moral, political, religious, social, existential and cognitive, aesthetic and hedonistic. The authors used four variants of tonality labels: positive, neutral, negative and the controversial tonality that, among other things, made it possible to more accurately classify texts where the tonality of the multi-fragment and context are opposite.

Авторы
Воронцов К.В. 1 , Гладченко И.А. 2 , Лобачев В.А. , Мамонтова А.В. 2 , Ринк О.Л. 3 , Шабельская Н.К. 4
Издательство
Санкт-Петербургский государственный университет
Номер выпуска
1
Язык
Русский
Страницы
22-46
Статус
Опубликовано
Том
18
Год
2025
Организации
  • 1 Федеральный исследовательский центр «Информатика и управление» РАН
  • 2 Московский государственный университет имени М. В. Ломоносова
  • 3 Московский физико-технический институт (национальный исследовательский университет)
  • 4 Российский университет дружбы народов имени Патриса Лумумбы
Ключевые слова
international relations; artificial intelligence; cultural code; human values detection; social and human values; Semantic Analysis; markup; multi-fragment; value orientations; международные отношения; искусственный интеллект; обнаружение культурного кода; социогуманитарные ценности; семантический анализ; разметка; аннотирование; мультифрагмент; ценностные ориентации
Цитировать
Поделиться

Другие записи

Аватков В.А., Апанович М.Ю., Борзова А.Ю., Бордачев Т.В., Винокуров В.И., Волохов В.И., Воробьев С.В., Гуменский А.В., Иванченко В.С., Каширина Т.В., Матвеев О.В., Окунев И.Ю., Поплетеева Г.А., Сапронова М.А., Свешникова Ю.В., Фененко А.В., Феофанов К.А., Цветов П.Ю., Школярская Т.И., Штоль В.В. ...
Общество с ограниченной ответственностью Издательско-торговая корпорация "Дашков и К". 2018. 411 с.