Математична модель для обробки інформації з метрик коду Data Science та machine learning JAVA-застосунків для оцінювання їх розміру

dc.contributor.authorОрєхов О. С.
dc.contributor.authorФаріонова Т. А.
dc.contributor.authorOriekhov Oleksandr S.
dc.contributor.authorFarionova Тetyana A.
dc.date.accessioned2025-09-24T11:44:40Z
dc.date.issued2025
dc.descriptionОрєхов, О. С. Математична модель для обробки інформації з метрик коду Data Science та machine learning JAVA-застосунків для оцінювання їх розміру = A mathematical model for code metrics information processing of Data Science and machine learning JAVA applications to estimate their size / О. С. Орєхов, Т. А. Фаріонова // Зб. наук. пр. НУК. – Миколаїв : Гельветика, 2025. – № 2 (500). – С. 275–285.
dc.description.abstractМетою дослідження є підвищення достовірності обробки інформації з метрик коду для оцінювання розміру Data Science (DS) та Machine Learning (ML) JAVA-застосунків на ранніх стадіях розробки програмних проєктів за метриками діаграми класів, шляхом побудови нелінійної регресійної моделі, для подальшого застосування в параметричних моделях оцінювання трудомісткості розробки. Достовірна оцінка розміру програмного забезпечення необхідна для планування проєкту, розподілу ресурсів і витрат у розробці програмного забезпечення. Методика. Методи дослідження включають аналіз існуючих регресійних рівнянь та моделей для оцінювання KLOC JAVA-застосунків; збір та обробка інформації з метрик коду JAVA-застосунків за напрямком DS та ML з навчального та тестового наборі даних; застосування методики ітеративної побудови нелінійних регресійних моделей, які включають методи теорії ймовірності, математичної статистики, багатовимірного статистичного аналізу, лінійного та нелінійного регресійного аналізу; тощо. Результати. Побудовано пʼятифакторну нелінійну регресійну модель для обробки інформації з метрик коду для ранньої оцінки KLOC DS та ML JAVA-застосунків та її інтервал передбачення. Оцінки критеріїв якості нелінійних регресійних моделей R2, MMRE та PRED (0,25) отримані на основі початкової навчальної та тестової вибірок свідчать про високий рівень точності оцінювання параметру KLOC за допомогою побудованої пʼятифакторної моделі у порівнянні з існуючими моделями. Отриманий інтервал передбачення на 19,2 % вужчий ніч інтервал передбачення чотирьохфакторної регресії. Наукова новизна. Вперше побудовано пʼятифакторну нелінійну регресійну модель для багатовимірних негаусівських даних DS та ML JAVA-застосунків. Вперше загальну метрику кількості класів та інтерфейсів розділено на окремі метрики класів та інтерфейсів. Практична значимість отриманих результатів дозволяє рекомендувати пʼятифакторну модель для використання на практиці для обробки інформації з метрик коду для ранньої оцінки розміру DS та ML JAVA-застосунків.
dc.description.abstract1The aim of the study is to increase the accuracy and reliability of code metrics information processing to estimate the size of Data Science (DS) and Machine Learning (ML) JAVA applications in the early stages of software project planning using class diagram metrics by building a nonlinear regression model for further use in parametric models of software development effort estimation. Accurate software size estimation is necessary for project planning, resource allocation, and costing in software development. Methods. The research methods include analysis of existing regression equations and models for estimating the KLOC of JAVA applications; collection and processing of information from the code metrics of JAVA applications in the DS and ML areas from the training and testing datasets; methods for iterative nonlinear regression models constructing, including methods of probability theory, mathematical statistics, multivariate statistical analysis, linear and nonlinear regression analysis; etc. Results. A five-factor nonlinear regression model for processing information from code metrics for early KLOC estimation of DS and ML JAVA applications and its prediction interval were constructed. The obtained quality criteria assessments of R2, MMRE, and PRED (0,25) for the nonlinear regression models on the basis of the initial training sample and the test sample show a high level of accuracy in estimating the KLOC parameter using the obtained five-factor regression compared to the existing regression models and the constructed four-factor regression. The obtained prediction interval is 19.2 % shorter than the prediction interval of the built four-factor regression. Scientific novelty. Firstly, a five-factor nonlinear regression model was constructed on the basis of multivariate non-Gaussian data from DS and ML JAVA applications. Firstly, the metric of the total quantity of classes and interfaces was decomposed into separate metrics of classes and interfaces. The practical significance of the obtained results allows us to recommend the five-factor model for use in practice to process information from code metrics for early size estimation of DS and ML JAVA applications.
dc.identifier.issn2311-3405 (Print)
dc.identifier.issn2313-0415 (Online)
dc.identifier.urihttps://eir.nuos.edu.ua/handle/123456789/11267
dc.language.isouk
dc.relation.ispartofseriesУДК; 004.412:519.25
dc.subjectJAVA
dc.subjectData Science
dc.subjectMachine Learning
dc.subjectнегаусівські дані
dc.subjectнелінійна регресійна модель
dc.subjectнормалізуюче перетворення
dc.subjectnon-Gaussian data
dc.subjectnonlinear regression model
dc.subjectnormalizing transformation
dc.titleМатематична модель для обробки інформації з метрик коду Data Science та machine learning JAVA-застосунків для оцінювання їх розміру
dc.title.alternativeA mathematical model for code metrics information processing of Data Science and machine learning JAVA applications to estimate their size
dc.typeArticle

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Oriekhov_ Farionova.pdf
Розмір:
509.27 KB
Формат:
Adobe Portable Document Format

Ліцензійна угода

Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
license.txt
Розмір:
4.38 KB
Формат:
Item-specific license agreed upon to submission
Опис:

Зібрання