Цифровые исследования звучащей речи: история, методология, современные инструменты

Цель исследования - установить взаимосвязи между историческими этапами развития технологий обработки речевых данных и формированием современной методологической базы инструментальной фонетики. В статье представлена эволюция становления инструментальных подходов к изучению звучащей речи - от первых механических устройств XVIII века до современных нейросетевых архитектур, проанализированы программно-технические решения современности - от универсальных платформ акустического анализа до специализированных систем автоматического выравнивания речевых данных. Исследование включает систематизацию методологических принципов каждого исторического периода с выявлением их концептуальных ограничений и потенциала для решения актуальных лингвистических задач. Научная новизна заключается в периодизации развития инструментальной фонетики, основанной на взаимодействии технологических возможностей и методологических концепций каждого этапа. В результате были выявлены три типа концептуальных разрывов (технологический, семантический, когнитивный), препятствующих эффективной интеграции современных цифровых технологий с традиционными лингвистическими категориями. Обоснована необходимость создания гибридных аналитических платформ, способных преодолеть фрагментацию между количественными параметрами автоматической обработки и качественными характеристиками фонологического описания.

The aim of the research is to establish the interrelationships between the historical stages of development of speech data processing technologies and the formation of the modern methodological base of instrumental phonetics. The paper presents the evolution of the formation of instrumental approaches to the study of spoken speech - from the first mechanical devices of the 18th century to modern neural network architectures, and analyzes modern software and hardware solutions - from universal platforms for acoustic analysis to specialized systems for automatic alignment of speech data. The study includes a systematization of the methodological principles of each historical period, identifying their conceptual limitations and potential for solving current linguistic problems. The scientific novelty lies in the periodization of the development of instrumental phonetics, based on the interaction of technological capabilities and methodological concepts of each stage. As a result, three types of conceptual gaps (technological, semantic, cognitive) were identified, hindering the effective integration of modern digital technologies with traditional linguistic categories. The necessity of creating hybrid analytical platforms capable of overcoming the fragmentation between quantitative parameters of automatic processing and qualitative characteristics of phonological description is substantiated.

Издательство
Общество с ограниченной ответственностью Издательство Грамота
Номер выпуска
8
Язык
Русский
Страницы
3467-3474
Статус
Опубликовано
Том
18
Год
2025
Организации
  • 1 Российский университет дружбы народов им. П. Лумумбы
Ключевые слова
digital speech signal processing; automatic speech recognition; instrumental methods of phonetics; Deep Neural Networks; speech synthesis and analysis; цифровая обработка речевого сигнала; автоматическое распознавание речи; инструментальные методы фонетики; глубокие нейронные сети; синтез и анализ речи
Цитировать
Поделиться

Другие записи

Аватков В.А., Апанович М.Ю., Борзова А.Ю., Бордачев Т.В., Винокуров В.И., Волохов В.И., Воробьев С.В., Гуменский А.В., Иванченко В.С., Каширина Т.В., Матвеев О.В., Окунев И.Ю., Поплетеева Г.А., Сапронова М.А., Свешникова Ю.В., Фененко А.В., Феофанов К.А., Цветов П.Ю., Школярская Т.И., Штоль В.В. ...
Общество с ограниченной ответственностью Издательско-торговая корпорация "Дашков и К". 2018. 411 с.