Негаусівські ймовірнісні моделі та інформаційні технології для розпізнавання образів
dc.contributor.advisor | Приходько Сергій Борисович | |
dc.contributor.author | Трухов Артем Сергійович | |
dc.contributor.author | Trukhov A. S. | |
dc.date.accessioned | 2025-04-22T10:27:16Z | |
dc.date.available | 2025-04-22T10:27:16Z | |
dc.date.issued | 2024 | |
dc.description | Трухов, А. С. Негаусівські ймовірнісні моделі та інформаційні технології для розпізнавання образів = Non-Gaussian probabilistic models and information technologies for pattern recognition : дис. … д-ра філос. : 122 «Комп’ютерні науки» / А. С. Трухов ; наук. кер. С. Б. Приходько ; НУК. – Миколаїв, 2024. – 161 с. | |
dc.description.abstract | Дисертація на здобуття наукового ступеня доктора філософії (PhD) за спеціальністю 122 "Комп’ютерні науки" (галузь 12 – Інформаційні технології). – Національний університет кораблебудування імені адмірала Макарова, Міністерство освіти і науки України, Миколаїв, 2024. Дисертаційна робота присвячена вирішенню важливого науково-практичного завдання підвищення ймовірності та точності розпізнавання образів шляхом побудови ймовірнісних моделей, зокрема, еліпсоїдів прогнозування для нормалізованих даних та створенню на їх основі інструментарію інформаційної технології (ІТ) обробки інформації для розпізнавання облич та клавіатурного почерку. Актуальність роботи полягає в тому, що розпізнавання образів є важливою складовою багатьох сучасних технологій, таких як біометричні системи, системи відеоспостереження, автоматизовані системи контролю доступу, медичні дослідження та інші. Тому недостатня ймовірність розпізнавання образів може мати серйозні наслідки. У зв'язку з цим на сьогодні існує потреба в розробці та вдосконаленні методів розпізнавання, що забезпечують високу точність та надійність в умовах змінних і багатовимірних даних. Метою дисертаційної роботи є підвищення ймовірності та точності розпізнавання образів, зокрема за рахунок побудови негаусівських ймовірнісних моделей для нормалізованих даних. Робочою науковою гіпотезою дисертаційного дослідження є твердження, що підвищення ймовірності та точності розпізнавання образів досягається за рахунок використання негаусівських ймовірнісних моделей, які дозволяють враховувати відмінність розподілу даних від нормального. Для побудови вказаних негаусівських ймовірнісних моделей пропонується використовувати відповідний метод на основі багатовимірних нормалізуючих перетворень, які дозволяють враховувати кореляцію між змінними та наблизити розподіл до нормального, що підвищує ймовірність та точність розпізнавання образів. Для досягнення поставленої мети необхідно вирішити такі завдання: -проаналізувати існуючі математичні моделі, що використовуються для розпізнавання образів, та оцінити їх точність при роботі з негаусівськими даними; - дослідити існуючі нормалізуючі перетворення та методи для оцінювання їх параметрів; обрати перетворення для нормалізації десятивимірних векторів характеристик облич та дев’ятивимірних векторів характеристик клавіатурного почерку; - побудувати ймовірнісну модель для розпізнавання облич у вигляді еліпсоїда прогнозування з квантилем F-розподілу для нормалізованого вектору характеристик, який побудовано за допомогою десятивимірного нормалізуючого перетворення; - побудувати ймовірнісну модель для розпізнавання клавіатурного почерку у вигляді еліпсоїда прогнозування з квантилем F-розподілу для нормалізованого вектору характеристик, який побудовано за допомогою дев’ятивимірного нормалізуючого перетворення; - удосконалити ймовірнісну модель для розпізнавання облич у вигляді еліпсоїда прогнозування з квантилем Хі-квадрат для нормалізованого вектору характеристик, який побудовано за допомогою десятивимірного нормалізуючого перетворення; - удосконалити ймовірнісну модель для розпізнавання клавіатурного почерку у вигляді еліпсоїда прогнозування з квантилем Хі-квадрат для нормалізованого вектору характеристик, який побудовано за допомогою дев’ятивимірного нормалізуючого перетворення; - створити на основі удосконалених ймовірнісних моделей інформаційні технології для розпізнавання облич і клавіатурного почерку. Наукова новизна одержаних результатів полягає у наступному. 1) Вперше побудована ймовірнісна модель для розпізнавання облич у вигляді еліпсоїда прогнозування з квантилем F-розподілу для нормалізованого вектору характеристик, яка на відміну від існуючих моделей враховує відхилення розподілу даних від гаусівського завдяки застосуванню десятивимірного перетворення Бокса-Кокса та кількість точок даних завдяки використанню квантиля F-розподілу, що дозволяє підвищити точність і ймовірність розпізнавання облич. 2) Вперше побудована ймовірнісна модель для розпізнавання клавіатурного почерку у вигляді еліпсоїда прогнозування з квантилем F-розподілу для нормалізованого вектору характеристик, яка на відміну від існуючих моделей враховує відхилення розподілу даних від гаусівського завдяки застосуванню дев’ятивимірного перетворення Бокса-Кокса та кількість точок даних завдяки використанню квантиля F-розподілу, що дозволяє підвищити точність і ймовірність розпізнавання клавіатурного почерку. 3) Удосконалено ймовірнісну модель для розпізнавання облич у вигляді еліпсоїда прогнозування з квантилем Хі-квадрат для нормалізованого вектору характеристик, яка на відміну від існуючих моделей враховує відхилення розподілу даних від гаусівського завдяки застосуванню десятивимірного перетворення Бокса-Кокса, що дозволяє підвищити точність і ймовірність розпізнавання облич. 4) Удосконалено ймовірнісну модель для розпізнавання клавіатурного почерку у вигляді еліпсоїда прогнозування з квантилем Хі-квадрат для нормалізованого вектору характеристик, яка на відміну від існуючих моделей враховує відхилення розподілу даних від гаусівського завдяки застосуванню дев’ятивимірного перетворення Бокса-Кокса, що дозволяє підвищити точність і ймовірність розпізнавання клавіатурного почерку. Практичне значення одержаних результатів полягає у наступному. Розроблено інструментарій ІТ для розпізнавання облич та клавіатурного почерку на основі вектору характеристик, використовуючи мову програмування Python, що забезпечує її високу гнучкість та можливість інтеграції з сучасними платформами. У вступі дисертації розкрито сутність та значущість науково-практичного завдання, обґрунтовано потребу в проведенні даного дослідження. Наведено загальний опис роботи в такій структурі: актуальність обраної теми, зв’язок дослідження з науковими програмами, планами і темами; мета і завдання дослідження; наукова новизна і практична цінність отриманих результатів; особистий внесок здобувача; апробація результатів дослідження та публікації. У першому розділі дисертації виконано аналіз існуючих методів і моделей для розпізнавання образів та здійснено обґрунтування необхідності проведення досліджень за обраною темою. У другому розділі дисертації розглянуто існуючі взаємо-зворотні нормалізуючі перетворення, здійснено вибір перетворення для нормалізації дев’ятивимірних та десятивимірних векторів ознак клавіатурного почерку та облич відповідно. Проведено аналіз і видалення викидів з даних клавіатурного почерку за допомогою відстані Махаланобіса, використовуючи нормалізовані дані, отримані за допомогою багатовимірного перетворення Бокса-Кокса. У третьому розділі було побудовано негаусівські ймовірнісні моделі у вигляді дев’ятивимірного еліпсоїда прогнозування для нормалізованих векторів характеристик клавіатурного почерку, та десятивимірного еліпсоїда прогнозування для нормалізованих векторів характеристик облич, з використанням багатовимірного перетворення Бокса-Кокса і квантилів Хі квадрат та F-розподілу. У четвертому розділі дисертації запропоновано ІТ для розпізнавання облич та клавіатурного почерку. Розроблено інструментарії ІТ на основі побудованих негаусівських ймовірнісних моделей для розпізнавання облич за десятивимірним вектором ознак та для розпізнавання клавіатурного почерку за дев’ятивимірним вектором ознак. Було розроблено відповідне ПЗ, використовуючи мову програмування Python, та інструкції користувача для розпізнавання облич та клавіатурного почерку, які розраховані на використання зазначеного ПЗ. | |
dc.description.abstract1 | Thesis for the degree of philosophy doctor in specialty 122 "Computer Science" (field 12 – Information Technologies). – Admiral Makarov National University of Shipbuilding, Ministry of Education and Science of Ukraine, Mykolaiv, 2024. The dissertation is dedicated to solving the critical scientific and practical problem of improving the probability and accuracy of pattern recognition by developing probabilistic models, specifically prediction ellipsoids for normalized data, and creating information technology (IT) tools for face recognition and keystroke dynamics recognition based on these models. The relevance of the study lies in the fact that pattern recognition is a vital component of many modern technologies, such as biometric systems, video surveillance systems, automated access control systems, medical research, and others. Therefore, insufficient recognition accuracy can lead to serious consequences. In this regard, there is a growing need to develop and improve recognition methods that ensure high accuracy and reliability under conditions of variable and multivariate data. The dissertation aim is to improve the probability and accuracy of pattern recognition, specifically through the development of non-Gaussian probabilistic models for normalized data. The working scientific hypothesis of the dissertation is that improving the probability and accuracy of pattern recognition can be achieved through the use of non-Gaussian probabilistic models, which account for deviations in data distribution from normality. To construct these non-Gaussian probabilistic models, the proposed approach utilizes multivariate normalizing transformations that account for variable correlation and approximate the data distribution to normality, thereby enhancing the probability and accuracy of pattern recognition. To achieve this aim we need to solve the following tasks: - Analyze existing mathematical models used for pattern recognition and evaluate their accuracy when working with non-Gaussian data. - Investigate existing normalizing transformations and methods for evaluating their parameters; choose a transformation for normalizing ten-variate feature vectors for face recognition and nine-variate feature vectors for keystroke dynamics. - Build a probabilistic model for face recognition in the form of a prediction ellipsoid with a chi-square quantile for a normalized feature vector, constructed using a ten-variate normalizing transformation. - Build a probabilistic model for keystroke dynamics recognition in the form of a prediction ellipsoid with an F-distribution quantile for a normalized feature vector, constructed using a nine-variate normalizing transformation. - Improve the probabilistic model for face recognition in the form of a prediction ellipsoid with a chi-square quantile for a normalized feature vector, constructed using a ten-variate normalizing transformation. - Improve the probabilistic model for keystroke dynamics recognition in the form of a prediction ellipsoid with a chi-square quantile for a normalized feature vector, constructed using a nine-variate normalizing transformation. - Develop information technologies for face and keystroke dynamics recognition based on the improved probabilistic models. The scientific novelty of the obtained results is as follows. 1) For the first time, a probabilistic model for face recognition has been constructed in the form of a prediction ellipsoid with an F-distribution quantile for a normalized feature vector, which, unlike existing models, takes into account the deviation of the data distribution from Gaussian by applying the ten-variate Box-Cox transformation and the number of data points by using the F-distribution quantile, which allows to increase the accuracy and probability of face recognition. 2) For the first time, a probabilistic model for keyboard handwriting recognition has been constructed in the form of a prediction ellipsoid with an F-distribution quantile for a normalized feature vector, which, unlike existing models, takes into account the deviation of the data distribution from Gaussian by applying the nine-variate Box-Cox transformation and the number of data points by using the F-distribution quantile, which allows to increase the accuracy and probability of keyboard handwriting recognition. 3) The probabilistic model for face recognition in the form of a prediction ellipsoid with a Chi-square quantile for a normalized feature vector has been improved, which, unlike existing models, takes into account the deviation of the data distribution from Gaussian by applying the ten-variate Box-Cox transformation, which allows to increase the accuracy and probability of face recognition. 4) The probabilistic model for keyboard handwriting recognition in the form of a prediction ellipsoid with a Chi-square quantile for a normalized feature vector has been improved, which, unlike existing models, takes into account the deviation of the data distribution from Gaussian by applying the nine-variate Box-Cox transformation, which allows to increase the accuracy and probability of keyboard handwriting recognition. The practical significance of the obtained results is as follows. The IT tools developed for face and keystroke dynamics recognition are based on feature vectors and implemented using Python programming language, ensuring high flexibility and integration with modern platforms. The introduction outlines the essence and importance of the scientific and practical problem, substantiates the need for this research, and provides an overview of the study in the following structure: relevance of the topic, connection to scientific programs and plans, research objectives, scientific novelty, practical value of the results, personal contribution of the author, and dissemination of results and publications. In Section 1, the analysis of existing methods and models for pattern recognition is presented. The section identifies key limitations in handling non-Gaussian data distributions and emphasizes the need for further research in developing advanced probabilistic models to address these challenges. In Section 2, existing invertible normalizing transformations are reviewed. The section describes the selection of appropriate transformations for normalizing nine-variate and ten-variate feature vectors for keystroke dynamics and face data, respectively. It also details the analysis and removal of outliers from keystroke dynamics data using the Mahalanobis distance, applied to data normalized via the multivariate Box-Cox transformation. In Section 3, non-Gaussian probabilistic models are constructed. These models include the nine-variate prediction ellipsoid for normalized keystroke dynamics feature vectors and the ten-variate prediction ellipsoid for normalized face feature vectors. The section explains the use of the multivariate Box-Cox transformation and the incorporation of Chi-square and F-distribution quantiles in model construction. In Section 4, information technology (IT) tools for face and keystroke dynamics recognition are proposed. The section discusses the development of IT tools based on the constructed non-Gaussian probabilistic models, tailored for ten-variate feature vectors for face recognition and nine-variate feature vectors for keystroke dynamics recognition. It also outlines the implementation of the corresponding software in Python and provides a methodology for utilizing the software in practical applications. | |
dc.identifier.uri | https://eir.nuos.edu.ua/handle/123456789/10098 | |
dc.language.iso | uk | |
dc.relation.ispartofseries | УДК; 004.93:519.237 | |
dc.subject | розпізнавання образів | |
dc.subject | квадрат відстані Махаланобіса | |
dc.subject | еліпсоїд прогнозування | |
dc.subject | нормалізуюче перетворення | |
dc.subject | негаусівські дані | |
dc.subject | інформаційна технологія | |
dc.subject | машинне навчання | |
dc.subject | нейронні мережі | |
dc.subject | класифікація | |
dc.subject | прийняття рішень | |
dc.subject | людський фактор | |
dc.subject | Python | |
dc.subject | pattern recognition | |
dc.subject | squared Mahalanobis distance | |
dc.subject | prediction ellipsoid | |
dc.subject | normalizing transformation | |
dc.subject | non-Gaussian data | |
dc.subject | information technology | |
dc.subject | machine learning | |
dc.subject | neural networks | |
dc.subject | classification | |
dc.subject | decision making | |
dc.subject | human factor | |
dc.subject | Python | |
dc.title | Негаусівські ймовірнісні моделі та інформаційні технології для розпізнавання образів | |
dc.title.alternative | Non-Gaussian probabilistic models and information technologies for pattern recognition | |
dc.type | Thesis |
Файли
Контейнер файлів
1 - 1 з 1
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 4.38 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: