Автоматизація підготовки даних для географічного блока ахівної бази даних

Вантажиться...
Ескіз

Дата

2020

Автори

Прокоп, Ю. В.
Трофименко, О. Г.
Прокоп, А. С.
Prokop, Yuliіa V.
Trofymenko, Olena G.
Prokop, Artem S.

Назва журналу

Номер ISSN

Назва тому

Видавець

Анотація

Анотація. Створення архівних інформаційно-пошукових систем є одним з актуальних напрямів розвитку української архівної галузі. Проте реалізація його потребує внесення до баз даних величезного обсягу інформації, причому цей процес нині не автоматизований, а тому потребує значних людських ресурсів для введення даних вручну. Метою роботи є дослідження автоматизації процесу підготовки даних для географічного блока архівної інформаційно-пошукової системи із джерел різного формату: електронних реєстрів, вебсторінок, паперових друкованих видань, рукописних архівних документів тощо. Пропонується підсистема для підготовки даних, яка складається з модулів пошуку джерел інформації, видобування даних, ідентифікації даних і внесення інформації до бази. Значну частину роботи в підсистемі було автоматизовано, тому вона вже не потребує ручного введення даних. Вибір методу видобування і попереднього опрацювання даних залежить від джерела інформації. З урахуванням специфіки завдання можна припускати, що більшість джерел є або друкованими виданнями, або рукописними архівними документами. Тому першим кроком для їх опрацювання має бути сканування і розпізнавання тексту за допомогою поширених програмних засобів або нейронної мережі. Отриманий із джерел неструктурований текст методом синтаксичного аналізу трансформується у структурований і заноситься в таблиці певного шаблону. Видобуті дані мають бути ідентифіковані, відомості про тотожні адміністративні одиниці – об’єднані та внесені в базу даних. Запропонована підсистема підготовки даних була реалізована на прикладі підготовки географічних відомостей для Миколаївської області. Практична значимість отриманих результатів полягає в тому, що використання запропонованого алгоритму дозволить автоматизувати заповнення географічного блока даними інших регіонів для використання в регіональних тематичних архівних базах даних і загальнодержавній архівній інформаційно-пошуковій системі.

Опис

Прокоп, Ю. В. Автоматизація підготовки даних для географічного блока архівної бази даних = Automation of data preparation for the geographic block of the archival database / Ю. В. Прокоп, О. Г. Трофименко, А. С. Прокоп // Зб. наук. пр. НУК. – Миколаїв : НУК, 2020. – № 2 (480). – С. 107–114.

Ключові слова

архівна інформаційно-пошукова система, географічний блок, підготовка даних, видобування інформації, автоматизація підготовки даних, синтаксичний аналіз тексту, archival information retrieval system, geographic block, data preparation, information extraction, data preparation automation, syntactic analysis

Бібліографічний опис

Зібрання