Данные из интернета служат основой для решения широкого круга задач, от информационного поиска до аналитической обработки. При стремительном росте объемов данных эффективное извлечение метаданных из динамических веб-ресурсов становится критически важным. Традиционные методы краулинга на основе статических шаблонов малоэффективны при обработке интерактивного контента. В работе предложена архитектура адаптивной системы сбора информации, сочетающая стандартные методы извлечения данных с технологиями машинного обучения. Система имеет модульную структуру, включающую краулер, модуль управления ссылками, парсер и хранилище данных. Краулер обрабатывает как статический, так и динамический контент через эмуляцию браузера. Для извлечения метаданных применяется гибридный подход, совмещающий структурированные правила и машинное обучение. Эксперименты показали успешное извлечение метаданных из различных веб-ресурсов, включая страницы с динамическим контентом и сложными структурами. Система продемонстрировала высокую точность и устойчивость к изменениям форматов данных, включая способность обходить механизмы защиты от автоматического сбора информации. Таким образом, разработанное решение представляет собой значимый шаг в создании универсальных систем сбора и анализа данных для современных информационных сред. Представленные программные средства были использованы при наполнении индексных баз системы Неопоиск.