Негаусівські ймовірнісні моделі та інформаційні технології для розпізнавання образів
Ескіз недоступний
Дата
2024
Назва журналу
Номер ISSN
Назва тому
Видавець
Анотація
Дисертація на здобуття наукового ступеня доктора філософії (PhD) за спеціальністю 122 "Комп’ютерні науки" (галузь 12 – Інформаційні технології). – Національний університет кораблебудування імені адмірала Макарова, Міністерство освіти і науки України, Миколаїв, 2024. Дисертаційна робота присвячена вирішенню важливого науково-практичного завдання підвищення ймовірності та точності розпізнавання образів шляхом побудови ймовірнісних моделей, зокрема, еліпсоїдів прогнозування для нормалізованих даних та створенню на їх основі інструментарію інформаційної технології (ІТ) обробки інформації для розпізнавання облич та клавіатурного почерку. Актуальність роботи полягає в тому, що розпізнавання образів є важливою складовою багатьох сучасних технологій, таких як біометричні системи, системи відеоспостереження, автоматизовані системи контролю доступу, медичні дослідження та інші. Тому недостатня ймовірність розпізнавання образів може мати серйозні наслідки. У зв'язку з цим на сьогодні існує потреба в розробці та вдосконаленні методів розпізнавання, що забезпечують високу точність та надійність в умовах змінних і багатовимірних даних. Метою дисертаційної роботи є підвищення ймовірності та точності розпізнавання образів, зокрема за рахунок побудови негаусівських ймовірнісних моделей для нормалізованих даних. Робочою науковою гіпотезою дисертаційного дослідження є твердження, що підвищення ймовірності та точності розпізнавання образів досягається за рахунок використання негаусівських ймовірнісних моделей, які дозволяють враховувати відмінність розподілу даних від нормального. Для побудови вказаних негаусівських ймовірнісних моделей пропонується використовувати відповідний метод на основі багатовимірних нормалізуючих перетворень, які дозволяють враховувати кореляцію між змінними та наблизити розподіл до нормального, що підвищує ймовірність та точність розпізнавання образів. Для досягнення поставленої мети необхідно вирішити такі завдання: -проаналізувати існуючі математичні моделі, що використовуються для розпізнавання образів, та оцінити їх точність при роботі з негаусівськими даними; - дослідити існуючі нормалізуючі перетворення та методи для оцінювання їх параметрів; обрати перетворення для нормалізації десятивимірних векторів характеристик облич та дев’ятивимірних векторів характеристик клавіатурного почерку; - побудувати ймовірнісну модель для розпізнавання облич у вигляді еліпсоїда прогнозування з квантилем F-розподілу для нормалізованого вектору характеристик, який побудовано за допомогою десятивимірного нормалізуючого перетворення; - побудувати ймовірнісну модель для розпізнавання клавіатурного почерку у вигляді еліпсоїда прогнозування з квантилем F-розподілу для нормалізованого вектору характеристик, який побудовано за допомогою дев’ятивимірного нормалізуючого перетворення; - удосконалити ймовірнісну модель для розпізнавання облич у вигляді еліпсоїда прогнозування з квантилем Хі-квадрат для нормалізованого вектору характеристик, який побудовано за допомогою десятивимірного нормалізуючого перетворення; - удосконалити ймовірнісну модель для розпізнавання клавіатурного почерку у вигляді еліпсоїда прогнозування з квантилем Хі-квадрат для нормалізованого вектору характеристик, який побудовано за допомогою дев’ятивимірного нормалізуючого перетворення; - створити на основі удосконалених ймовірнісних моделей інформаційні технології для розпізнавання облич і клавіатурного почерку. Наукова новизна одержаних результатів полягає у наступному. 1) Вперше побудована ймовірнісна модель для розпізнавання облич у вигляді еліпсоїда прогнозування з квантилем F-розподілу для нормалізованого вектору характеристик, яка на відміну від існуючих моделей враховує відхилення розподілу даних від гаусівського завдяки застосуванню десятивимірного перетворення Бокса-Кокса та кількість точок даних завдяки використанню квантиля F-розподілу, що дозволяє підвищити точність і ймовірність розпізнавання облич. 2) Вперше побудована ймовірнісна модель для розпізнавання клавіатурного почерку у вигляді еліпсоїда прогнозування з квантилем F-розподілу для нормалізованого вектору характеристик, яка на відміну від існуючих моделей враховує відхилення розподілу даних від гаусівського завдяки застосуванню дев’ятивимірного перетворення Бокса-Кокса та кількість точок даних завдяки використанню квантиля F-розподілу, що дозволяє підвищити точність і ймовірність розпізнавання клавіатурного почерку. 3) Удосконалено ймовірнісну модель для розпізнавання облич у вигляді еліпсоїда прогнозування з квантилем Хі-квадрат для нормалізованого вектору характеристик, яка на відміну від існуючих моделей враховує відхилення розподілу даних від гаусівського завдяки застосуванню десятивимірного перетворення Бокса-Кокса, що дозволяє підвищити точність і ймовірність розпізнавання облич. 4) Удосконалено ймовірнісну модель для розпізнавання клавіатурного почерку у вигляді еліпсоїда прогнозування з квантилем Хі-квадрат для нормалізованого вектору характеристик, яка на відміну від існуючих моделей враховує відхилення розподілу даних від гаусівського завдяки застосуванню дев’ятивимірного перетворення Бокса-Кокса, що дозволяє підвищити точність і ймовірність розпізнавання клавіатурного почерку. Практичне значення одержаних результатів полягає у наступному. Розроблено інструментарій ІТ для розпізнавання облич та клавіатурного почерку на основі вектору характеристик, використовуючи мову програмування Python, що забезпечує її високу гнучкість та можливість інтеграції з сучасними платформами. У вступі дисертації розкрито сутність та значущість науково-практичного завдання, обґрунтовано потребу в проведенні даного дослідження. Наведено загальний опис роботи в такій структурі: актуальність обраної теми, зв’язок дослідження з науковими програмами, планами і темами; мета і завдання дослідження; наукова новизна і практична цінність отриманих результатів; особистий внесок здобувача; апробація результатів дослідження та публікації. У першому розділі дисертації виконано аналіз існуючих методів і моделей для розпізнавання образів та здійснено обґрунтування необхідності проведення досліджень за обраною темою. У другому розділі дисертації розглянуто існуючі взаємо-зворотні нормалізуючі перетворення, здійснено вибір перетворення для нормалізації дев’ятивимірних та десятивимірних векторів ознак клавіатурного почерку та облич відповідно. Проведено аналіз і видалення викидів з даних клавіатурного почерку за допомогою відстані Махаланобіса, використовуючи нормалізовані дані, отримані за допомогою багатовимірного перетворення Бокса-Кокса. У третьому розділі було побудовано негаусівські ймовірнісні моделі у вигляді дев’ятивимірного еліпсоїда прогнозування для нормалізованих векторів характеристик клавіатурного почерку, та десятивимірного еліпсоїда прогнозування для нормалізованих векторів характеристик облич, з використанням багатовимірного перетворення Бокса-Кокса і квантилів Хі квадрат та F-розподілу. У четвертому розділі дисертації запропоновано ІТ для розпізнавання облич та клавіатурного почерку. Розроблено інструментарії ІТ на основі побудованих негаусівських ймовірнісних моделей для розпізнавання облич за десятивимірним вектором ознак та для розпізнавання клавіатурного почерку за дев’ятивимірним вектором ознак. Було розроблено відповідне ПЗ, використовуючи мову програмування Python, та інструкції користувача для розпізнавання облич та клавіатурного почерку, які розраховані на використання зазначеного ПЗ.
Опис
Трухов, А. С. Негаусівські ймовірнісні моделі та інформаційні технології для розпізнавання образів = Non-Gaussian probabilistic models and information technologies for pattern recognition : дис. … д-ра філос. : 122 «Комп’ютерні науки» / А. С. Трухов ; наук. кер. С. Б. Приходько ; НУК. – Миколаїв, 2024. – 161 с.
Ключові слова
розпізнавання образів, квадрат відстані Махаланобіса, еліпсоїд прогнозування, нормалізуюче перетворення, негаусівські дані, інформаційна технологія, машинне навчання, нейронні мережі, класифікація, прийняття рішень, людський фактор, Python, pattern recognition, squared Mahalanobis distance, prediction ellipsoid, normalizing transformation, non-Gaussian data, information technology, machine learning, neural networks, classification, decision making, human factor, Python