Пʼятифакторна математична модель для обробки інформації з метрик коду JAVA-застосунків для оцінювання їх розміру

dc.contributor.authorОрєхов О. С.
dc.contributor.authorФаріонова Т. А.
dc.contributor.authorOriekhov O. S.
dc.contributor.authorFarionova T. A.
dc.date.accessioned2026-03-04T09:44:24Z
dc.date.issued2025
dc.descriptionОрєхов, О. С. Пʼятифакторна математична модель для обробки інформації з метрик коду JAVA-застосунків для оцінювання їх розміру = Five-factor mathematical model for processing information from code metrics of JAVA applications for estimating their size / О. С. Орєхов, Т. А. Фаріонова // Вісн. ХНТУ. – Херсон : ХНТУ, 2025. – № 4 (95), ч. 2. – С. 139–146.
dc.description.abstractДостовірна обробка інформації з метрик коду JAVA-застосунків на ранніх стадіях їх проєктування має велике значення, оскільки це безпосередньо впливає на прогнозування трудомісткості розробки. В роботі запропоновано математична модель, а саме пʼятифакторна нелінійна регресійна модель, для раннього оцінювання розміру JAVA-застосунків, а саме кількості рядків коду. Об’єктом дослідження є процес обробки інформації з метрик коду програмних JAVA-застосунків. Предметом дослідження є нелінійна регресійна модель для обробки інформації з метрик коду програмних JAVA-застосунків. Метою роботи є підвищення достовірності обробки інформації з метрик коду, які доступні з UML-діаграми класів, для оцінювання параметру розміру JAVA застосунків на ранніх етапах проєктування програмного забезпечення шляхом побудови математичної моделі нелінійної регресії з пʼятьма факторами. Для досягнення поставленої мети зібрано дані за метриками програмного коду 571 загальних JAVA-застосунків з відкритим кодом, які розташовані на платформі GitHub. Отриманий набір даних випадковим чином розділено на навчальну та тестові вибірки розміром 286 та 285 векторів характеристик. В процесі попередньої обробки даних, для побудови математичної моделі нелінійної регресії з пʼятьма факторами, вперше розділено параметр загальної кількості класів та інтерфейсів на окремі метрики та обрані середні значення видимих методів класів та інтерфейсів, полів класів та звʼязності між класами та інтерфейсами, що дозволило уникнути проблем з мультиколінеарністю для побудови регресійної моделі. Нормалізацію багатовимірних даних проведено за допомогою шестивимірного нормалізуючого перетворення Бокса-Кокса. Отримана математична модель має кращі показники якості, а саме R2, MMRE та PRED(0,25), у порівнянні з існуючими трьохфакторною та чотирьохфакторними нелінійними регресійними моделями для обробки інформації з метрик коду JAVA-застосунків для оцінювання їх розміру.
dc.description.abstract1Reliable information processing from JAVA application code metrics at the early software design stages is crucial, because it directly impacts software development effort estimation. This paper proposes a mathematical model, specifically a five-factor nonlinear regression model, for the early code lines size estimation of JAVA applications. The object of the study is the process of information processing from code metrics of JAVA software applications. The subject of the study is a nonlinear regression model for information processing from code metrics of JAVA applications. The aim of the study is to increase the reliability of information processing from code metrics that are available on the UML class diagram for estimating the size parameter of JAVA applications at the early stages of software design by building a five-factor nonlinear regression mathematical model. To achieve this goal, data on software code metrics of 571 general open-source JAVA applications hosted on the GitHub platform were collected. The obtained dataset was randomly separated into training and test samples of 286 and 285 vectors, respectively. During data preprocessing for building the mathematical model, the parameter of the total number of classes and interfaces was separated into individual metrics for the first time. Additionally, average values of visible methods of classes and interfaces, class fields, and coupling between classes and interfaces were selected, which allowed avoiding multicollinearity during the regression model construction. Normalization of multidimensional data was performed using a six-dimensional normalizing Box-Cox transformation. The obtained mathematical model demonstrates better quality indicators, namely R2 , MMRE, and PRED(0.25), compared to existing three-factor and fourfactor nonlinear regression models for information processing from JAVA application code metrics to estimate their size.
dc.description.provenanceSubmitted by Фаріонова Тетяна Анатоліївна (tetyana.farionova@nuos.edu.ua) on 2026-03-03T11:01:09Z workflow start=Step: reviewstep - action:claimaction No. of bitstreams: 1 20.pdf: 484062 bytes, checksum: 3c0883c4851ea65df47e0a6cb50c5329 (MD5)en
dc.description.provenanceStep: reviewstep - action:reviewaction Approved for entry into archive by Диндеренко Катерина (kateryna.dynderenko@nuos.edu.ua) on 2026-03-04T09:38:27Z (GMT)en
dc.description.provenanceStep: editstep - action:editaction Approved for entry into archive by Диндеренко Катерина (kateryna.dynderenko@nuos.edu.ua) on 2026-03-04T09:44:01Z (GMT)en
dc.description.provenanceStep: finaleditstep - action:finaleditaction Approved for entry into archive by Диндеренко Катерина (kateryna.dynderenko@nuos.edu.ua) on 2026-03-04T09:44:24Z (GMT)en
dc.description.provenanceMade available in DSpace on 2026-03-04T09:44:24Z (GMT). No. of bitstreams: 1 Oriekhov_ Farionova: 484062 bytes, checksum: 3c0883c4851ea65df47e0a6cb50c5329 (MD5) Previous issue date: 2025en
dc.identifier.govdocDOI https://doi.org/10.35546/kntu2078-4481.2025.4.2.18
dc.identifier.issn2078-4481 (Print)
dc.identifier.urihttps://eir.nuos.edu.ua/handle/123456789/12285
dc.language.isouk
dc.relation.ispartofseriesУДК; 004.412:519.25
dc.subjectматематична модель
dc.subjectобробка інформації
dc.subjectметрика програмного коду
dc.subjectJava
dc.subjectнормалізуюче перетворення
dc.subjectнелінійна регресія
dc.subjectнегаусівські дані
dc.subjectmathematical model
dc.subjectіnformation processing
dc.subjectsoftware code metric
dc.subjectnormalizing transformation
dc.subjectnonlinear regression
dc.subjectnon-Gaussian data
dc.titleПʼятифакторна математична модель для обробки інформації з метрик коду JAVA-застосунків для оцінювання їх розміру
dc.title.alternativeFive-factor mathematical model for processing information from code metrics of JAVA applications for estimating their size
dc.typeArticle

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Oriekhov_ Farionova
Розмір:
472.72 KB
Формат:
Adobe Portable Document Format

Ліцензійна угода

Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
license.txt
Розмір:
4.38 KB
Формат:
Item-specific license agreed upon to submission
Опис:

Зібрання