Математичні моделі для обробки інформації з метрик коду JAVA-застосунків для оцінювання їх розміру
Вантажиться...
Дата
Назва журналу
Номер ISSN
Назва тому
Видавець
Анотація
Орєхов О. С. Математичні моделі для обробки інформації з метрик коду JAVA-застосунків для оцінювання їх розміру. – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії (PhD) за спеціальністю 122 «Комп’ютерні науки» (галузь 12 – Інформаційні технології). – Національний університет кораблебудування імені адмірала Макарова, Міністерство освіти і науки України, Миколаїв, 2026. Дисертаційна робота присвячена вирішенню науково-практичного завдання підвищення достовірності обробки інформації з метрик коду JAVA-застосунків для оцінювання їх розміру шляхом побудови відповідних математичних моделей, а саме нелінійних регресійних моделей, та створенню інструментарію інформаційної технології (ІТ) для обробки інформації з метрик коду, необхідних для оцінювання параметра розміру на ранніх стадіях розробки програмних застосунків за метриками UML-діаграми класів на основі загальної вибірки JAVA-застосунків та вибірки Data Science (DS) і Machine Learning (ML) JAVA-застосунків. Актуальність дисертаційної роботи полягає у тому, що достовірна обробка інформації з метрик коду JAVA-застосунків, а саме їх розміру, на ранніх стадіях проєктування безпосередньо впливає на прогнозування трудомісткості розробки програмних продуктів. Це дозволяє ефективно вирішувати завдання планування ресурсів, бюджету, часу на створення програмних проєктів. Однак оцінювання розміру програмного забезпечення (ПЗ) на ранніх стадіях проєктування ускладнюється тим, що на початкових етапах розробки така інформація обмежена та її важко виміряти, наслідком чого є низька достовірність отриманих оцінок. Підвищення достовірності оцінювання розміру ПЗ досягається завдяки використання відповідних математичних моделей, які враховують фактори середовища – мову програмування JAVA та особливості проєкту, зокрема застосування технологій DS та ML із цією мовою програмування. У звʼязку з цим існує потреба у підвищенні достовірності обробки інформації для оцінювання розміру ПЗ на ранніх етапах розробки шляхом використання метрик програмного коду, які доступні з концептуальної моделі проєкту (UML-діаграми класів). Метою дослідження є підвищення достовірності обробки інформації з метрик коду для оцінювання розміру JAVA-застосунків на ранніх стадіях проєктування програмного забезпечення за рахунок побудови нелінійних регресійних моделей на основі наборів метрик коду проєктів з відкритим кодом. Робочою науковою гіпотезою дисертаційного дослідження є твердження, що підвищення достовірності обробки інформації з метрик коду для оцінювання розміру (кількості рядків коду) JAVA-застосунків на ранніх етапах розробки ПЗ досягається шляхом використання негаусівських нелінійних регресійних моделей, які дозволяють описувати зазначений розмір як випадкову величину та врахувати відмінність розподілу даних від нормального. Для побудови нелінійних регресійних моделей пропонується використовувати підхід на основі застосування багатовимірних нормалізуючих перетворень, які дозволяють врахувати кореляцію між факторами та наблизити розподіл до нормального, що підвищує ймовірність достовірності обробки інформації з метрик коду JAVA-застосунків для оцінювання параметра їх розміру. Для досягнення поставленої мети необхідно вирішити такі завдання: - провести аналіз існуючих математичних моделей для обробки інформації з метрик коду для оцінювання розміру загальних та DS і ML JAVA-застосунків, із використанням відповідних вибірок проєктів з відкритим кодом; - сформувати навчальні та тестові вибірки з метрик коду JAVA-застосунків та обґрунтувати вибір незалежних факторів для побудови нелінійних регресійних моделей обробки інформації з метрик коду для оцінювання їх розміру; - дослідити отримані метрики на відсутність мультиколінеарності за критерієм VIFs, з урахуванням ітеративної обробки багатовимірних даних; - обрати перетворення для нормалізації шестивимірних векторів характеристик метрик коду JAVA-застосунків на основі аналізу існуючих нормалізуючих перетворень та методів оцінювання їх параметрів; - удосконалити чотирьохфакторну нелінійну регресійну модель для обробки інформації з метрик коду для оцінювання розміру JAVA-застосунків із використанням пʼятивимірного нормалізуючого перетворення Бокса-Кокса на основі загальної вибірки метрик коду JAVA-застосунків з відкритим кодом, які можна отримати з концептуальної моделі проєкту; - побудувати пʼятифакторну нелінійну регресійну модель для обробки інформації з метрик коду для оцінювання розміру JAVA-застосунків із застосуванням шестивимірного нормалізуючого перетворення Бокса-Кокса на основі загальної вибірки метрик коду JAVA-застосунків з відкритим кодом, які можна отримати з концептуальної моделі проєкту; - побудувати пʼятифакторну нелінійну регресійну модель для обробки інформації з метрик коду для оцінювання розміру JAVA-застосунків із застосуванням шестивимірного нормалізуючого перетворення Бокса-Кокса на основі вибірки метрик коду DS та ML JAVA-проєктів з відкритим кодом, які можна отримати з концептуальної моделі проєкту; - розробити інформаційну технологію (SaaS програмне рішення) та методику для обробки інформації з метрик коду, отриманих з UML-діаграми класів, для оцінювання параметра розміру JAVA-застосунків із використанням побудованих пʼятифакторних нелінійних регресійних моделей. Наукова новизна отриманих результатів полягає у наступному: 1) Удосконалено чотирьохфакторну нелінійну регресійну модель для обробки інформації з метрик коду для оцінювання параметра розміру JAVA-застосунків залежно від загальної кількості класів та інтерфейсів (CLASS), загальної кількості унікальних викликів методів у класах (RFC), середнього значення кількості звʼязків між класами (aCBO) та середнього значення кількості видимих (public та protected) методів на клас (aVMQ) на основі пʼятивимірного перетворення Бокса-Кокса, що дозволило підвищити достовірність оцінювання параметра розміру таких застосунків як негаусівської випадкової величини у порівнянні з існуючими регресійними моделями. Модель, що побудована, у порівнянні з іншими моделями має більший відсоток прогнозованих значень, менше значення середньої величини відносної похибки та менші ширини інтервалу передбачення нелінійної регресії. 2) Вперше побудовано пʼятифакторну нелінійну регресійну модель для обробки інформації з метрик коду для оцінювання параметра розміру JAVA-застосунків на основі шестивимірного перетворення Бокса-Кокса, в якій, на відміну від існуючих моделей, було розділено метрику загальної кількості класів та інтерфейсів (CLASS) на дві окремі метрики, а саме кількість класів (CLS) та кількість інтерфейсів (INFC), що дозволило підвищити достовірність обробки інформації з метрик коду для оцінювання параметра розміру в порівнянні з існуючими математичними моделями. Модель, що побудовано, в порівнянні з іншими регресійними моделями, має кращі показники якості 𝑅 , 2 𝑀𝑀𝑅𝐸 та 𝑃𝑅𝐸𝐷(0, 25) та менші ширини інтервалу передбачення та довірчого інтервалу нелінійної регресії. 3) Вперше побудовано пʼятифакторну нелінійну регресійну модель для обробки інформації з метрик коду для оцінювання параметра розміру DS та ML JAVA-застосунків на основі шестивимірного перетворення Бокса-Кокса, в якій, на відміну від існуючих моделей, було розділено метрику загальної кількості класів та інтерфейсів (CLASS) на дві окремі метрики коду кількості класів (CLS) та інтерфейсів (INFC) та враховано особливості розробки цієї категорії застосунків, що дозволило підвищити достовірність обробки інформації з метрик коду для оцінювання параметра розміру у порівнянні із використанням одновимірного та пʼятивимірного перетворень Бокса-Кокса. Модель, що побудовано, в порівнянні з іншими регресійними моделями, має більший відсоток прогнозованих значень, менше значення середньої величини відносної похибки та менші ширини інтервалу передбачення та довірчого інтервалу нелінійної регресії. 4) Отримали подальший розвиток рівняння для визначення границь інтервалів передбачення пʼятифакторної нелінійної регресії для загальних JAVA-застосунків та DS і ML JAVA-застосунків на основі шестивимірних нормалізуючих перетворень Бокса-Кокса. Це у порівнянні з використанням пʼятивимірних перетворень Бокса-Кокса дозволяє зменшити ширини інтервалів передбачення нелінійних регресій для оцінювання параметра розміру відповідних програмних застосунків і тим самим підвищити достовірність оцінювання зазначеного розміру як залежної випадкової величини. Практичне значення дисертаційної роботи полягає у розробці інструментарію ІТ для обробки інформації з метрик коду для оцінювання параметра розміру JAVA-застосунків, які можна отримати з концептуальної моделі даних на ранніх етапах розробки програмного проєкту, розрахунку довірчих інтервалів та інтервалів передбачення із застосуванням відповідних пʼятифакторних нелінійних регресійних моделей на основі загальної вибірки JAVA-застосунків, вибірки DS та ML JAVA-застосунків. Для цього мовою програмування Kotlin для отриманих нелінійних регресійних математичних моделей створено ПЗ, що розповсюджується за моделлю software-as-a-service (SaaS) та має відповідний програмний інтерфейс на основі протоколу HTTP. У вступі дисертації розкрито сутність та значущість науково-практичного завдання обробки інформації з метрик коду для оцінювання параметра розміру JAVA-застосунків, обґрунтовано необхідність проведення дослідження за обраною темою. Загальну характеристику дисертації подано в такій послідовності: обґрунтування вибору та актуальність теми дослідження; зв’язок роботи з науковими програмами, планами, темами; мета і завдання дослідження; наукова новизна і практична цінність одержаних результатів; особистий внесок здобувача; апробація результатів дисертації та публікації. У першому розділі дисертації проведено аналіз існуючих методів та моделей для обробки інформації з метрик коду для оцінювання розміру JAVA-застосунків та обґрунтовано необхідність проведення дослідження відповідно до поставленої мети. У другому розділі дисертації на основі огляду та аналізу існуючих нормалізуючих перетворень, які використовуються для побудови нелінійних регресійних моделей, було обґрунтовано вибір перетворення для нормалізації шестивимірних векторів метрик програмного коду загальних JAVA-застосунків, DS та ML JAVA-застосунків. У третьому розділі дисертації побудовано чотирьох- та пʼятифакторні нелінійні регресійні моделі, їх довірчі інтервали та інтервали передбачення для обробки інформації з метрик коду для оцінювання розміру JAVA-застосунків із застосуванням багатовимірних нормалізуючих перетворень на основі загальної вибірки JAVA-застосунків, вибірки DS і ML JAVA-застосунків. Проведено порівняння якості обробки інформації з метрик коду для оцінювання розміру (кількості рядків коду) JAVA-застосунків із використанням розроблених нелінійних регресійних моделей. У четвертому розділі дисертації запропоновано інструментарій ІТ для обробки інформації з метрик коду для оцінювання розміру JAVA-застосунків на початкових етапах проєктування програмних застосунків за метриками діаграми класів. Для цього розроблено SaaS-рішення мовою програмування Kotlin та засобами фреймворку Spring Boot, яке пропонує API для обробки інформації з метрик коду для оцінювання KLOC JAVA-застосунків із застосуванням отриманих нелінійних регресійних моделей.
Опис
Орєхов, О. С. Математичні моделі для обробки інформації з метрик коду JAVA-застосунків для оцінювання їх розміру = Mathematical models for information processing of JAVA application code metrics for their size estimation : дис. … д-ра філос. : 122 "Комп’ютерні науки" / О. С. Орєхов ; наук. кер. Т. А. Фаріонова ; НУК. – Миколаїв, 2026. – 223 с.
Ключові слова
трудомісткість розробки ПЗ, вихідний код, LOC-оцінка, Java, machine learning, математична модель, регресійна модель, нелінійна регресія, негаусівські дані, нормалізуюче перетворення, перетворення Бокса-Кокса, довірчий інтервал, інтервал передбачення, інформаційна технологія, програмне забезпечення, 122 "Комп’ютерні науки", software development effort, source code, LOC-estimation, Java, machine learning, mathematical model, regression model, nonlinear regression, non-Gaussian data, normalizing transformation, Box-Cox transformation, confidence interval, prediction interval, information technology, software