Аналіз та класифікація потокових алгоритмів машинного навчання для обробки великих обсягів даних у реальному часі

Паньків В. І.; Pankiv Volodymyr I.

Аналіз та класифікація потокових алгоритмів машинного навчання для обробки великих обсягів даних у реальному часі

Files

Pankiv.pdf (439.23 KB)

Date

2025

Authors

Паньків В. І.

Pankiv Volodymyr I.

Abstract

Мета. У роботі здійснено комплексний аналіз підходів потокового машинного навчання, орієнтованих на обробку великих обсягів даних у режимі реального часу, з метою системного окреслення ключових методів, виокремлення їхніх спільних принципів та відмінностей, а також формування узгодженої основи для подальшої класифікації та дослідження цієї галузі. Методика. Аналіз зосереджено на ключових вимогах потокового середовища, серед яких обмеження пам’яті, потреба в одноразовому перегляді даних, динамічність статистичних властивостей і необхідність низької латентності обчислень. Розглянуто специфіку концептуального дрейфу, його типи та вплив на стабільність моделей, а також підходи до адаптації у змінних умовах. Систематизовано класи методів потокового ML: онлайн-алгоритми, моделі адаптації до дрейфу, стрімінгові ансамблі, алгоритми для високошвидкісних часових рядів, а також проаналізовано архітектурні фреймворки Apache Flink, Kafka Streams, Spark Structured Streaming та бібліотеки River і MOA. Результати. Показано, що онлайн-підходи забезпечують інкрементальні оновлення та сталу обчислювальну складність, але є чутливими до шуму. Окреслено сучасні механізми виявлення концептуальних змін і реконфігурації моделей, включно з деревами Hoeffding та їхніми адаптивними модифікаціями. У контексті ансамблевих підходів продемонстровано, як комбінування інкрементальних моделей дозволяє збалансувати точність, стабільність і швидкість реагування. Для високочастотних потоків виявлено ефективність поєднання статистичних моделей онлайн-оновлення з легкими глибокими архітектурами. З’ясовано, що результативність потокових систем визначається поєднанням алгоритмічних рішень та обчислювальних моделей із підтримкою стану, узгодженою семантикою часу й низькою латентністю. Наукова новизна. Узагальнення продемонструвало взаємозв’язок між алгоритмічними механізмами адаптації до дрейфу, ансамблевими стратегіями та архітектурними моделями потокової обробки, що дозволяє розглядати потокові ML-системи не лише як набір моделей, а як інтегровані обчислювально-алгоритмічні екосистеми. Акцентовано перспективи підвищення робастності моделей, удосконалення адаптивних механізмів і стандартизації бенчмарків. Практична значимість. Отримані узагальнення спрямовані на підвищення ефективності проєктування потокових систем, оптимізацію алгоритмів у ресурсно обмежених умовах, удосконалення механізмів адаптації до концептуального дрейфу та формування методичних основ для порівняльного оцінювання потокових методів у реальних застосуваннях високошвидкісної аналітики даних.

Description

Паньків, В. І. Аналіз та класифікація потокових алгоритмів машинного навчання для обробки великих обсягів даних у реальному часі = Analysis and classification of streaming machine learning algorithms for real-time big data processing / В. І. Паньків // Зб. наук. пр. НУК. – Миколаїв : Гельветика, 2025. – № 4 (502). – С. 298–305.

Keywords

дрейф , адаптація , виявлення , телеметрія , прогнозування , drift , adaptation , detection , telemetry , forecasting

URI

https://eir.nuos.edu.ua/handle/123456789/13095

Collections

№ 4 (502) 2025

Full item page

Аналіз та класифікація потокових алгоритмів машинного навчання для обробки великих обсягів даних у реальному часі

Files

Date

Authors

Journal Title

Journal ISSN

Volume Title

Publisher

DOI

Abstract

Description

Keywords

Citation

URI

Collections

Endorsement

Review

Supplemented By

Referenced By