Прокоп, Ю. В.Трофименко, О. Г.Прокоп, А. С.Prokop, Yuliіa V.Trofymenko, Olena G.Prokop, Artem S.2021-04-092021-04-0920202311–3405 (Print)2313-0415 (Online)https://eir.nuos.edu.ua/handle/123456789/3827Прокоп, Ю. В. Автоматизація підготовки даних для географічного блока архівної бази даних = Automation of data preparation for the geographic block of the archival database / Ю. В. Прокоп, О. Г. Трофименко, А. С. Прокоп // Зб. наук. пр. НУК. – Миколаїв : НУК, 2020. – № 2 (480). – С. 107–114.Анотація. Створення архівних інформаційно-пошукових систем є одним з актуальних напрямів розвитку української архівної галузі. Проте реалізація його потребує внесення до баз даних величезного обсягу інформації, причому цей процес нині не автоматизований, а тому потребує значних людських ресурсів для введення даних вручну. Метою роботи є дослідження автоматизації процесу підготовки даних для географічного блока архівної інформаційно-пошукової системи із джерел різного формату: електронних реєстрів, вебсторінок, паперових друкованих видань, рукописних архівних документів тощо. Пропонується підсистема для підготовки даних, яка складається з модулів пошуку джерел інформації, видобування даних, ідентифікації даних і внесення інформації до бази. Значну частину роботи в підсистемі було автоматизовано, тому вона вже не потребує ручного введення даних. Вибір методу видобування і попереднього опрацювання даних залежить від джерела інформації. З урахуванням специфіки завдання можна припускати, що більшість джерел є або друкованими виданнями, або рукописними архівними документами. Тому першим кроком для їх опрацювання має бути сканування і розпізнавання тексту за допомогою поширених програмних засобів або нейронної мережі. Отриманий із джерел неструктурований текст методом синтаксичного аналізу трансформується у структурований і заноситься в таблиці певного шаблону. Видобуті дані мають бути ідентифіковані, відомості про тотожні адміністративні одиниці – об’єднані та внесені в базу даних. Запропонована підсистема підготовки даних була реалізована на прикладі підготовки географічних відомостей для Миколаївської області. Практична значимість отриманих результатів полягає в тому, що використання запропонованого алгоритму дозволить автоматизувати заповнення географічного блока даними інших регіонів для використання в регіональних тематичних архівних базах даних і загальнодержавній архівній інформаційно-пошуковій системі.ukархівна інформаційно-пошукова системагеографічний блокпідготовка данихвидобування інформаціїавтоматизація підготовки данихсинтаксичний аналіз текстуarchival information retrieval systemgeographic blockdata preparationinformation extractiondata preparation automationsyntactic analysisАвтоматизація підготовки даних для географічного блока ахівної бази данихArticle