Автоматизація підготовки даних для географічного блока ахівної бази даних

dc.contributor.authorПрокоп, Ю. В.
dc.contributor.authorТрофименко, О. Г.
dc.contributor.authorПрокоп, А. С.
dc.contributor.authorProkop, Yuliіa V.
dc.contributor.authorTrofymenko, Olena G.
dc.contributor.authorProkop, Artem S.
dc.date.accessioned2021-04-09T08:27:10Z
dc.date.available2021-04-09T08:27:10Z
dc.date.issued2020
dc.descriptionПрокоп, Ю. В. Автоматизація підготовки даних для географічного блока архівної бази даних = Automation of data preparation for the geographic block of the archival database / Ю. В. Прокоп, О. Г. Трофименко, А. С. Прокоп // Зб. наук. пр. НУК. – Миколаїв : НУК, 2020. – № 2 (480). – С. 107–114.uk_UA
dc.description.abstractАнотація. Створення архівних інформаційно-пошукових систем є одним з актуальних напрямів розвитку української архівної галузі. Проте реалізація його потребує внесення до баз даних величезного обсягу інформації, причому цей процес нині не автоматизований, а тому потребує значних людських ресурсів для введення даних вручну. Метою роботи є дослідження автоматизації процесу підготовки даних для географічного блока архівної інформаційно-пошукової системи із джерел різного формату: електронних реєстрів, вебсторінок, паперових друкованих видань, рукописних архівних документів тощо. Пропонується підсистема для підготовки даних, яка складається з модулів пошуку джерел інформації, видобування даних, ідентифікації даних і внесення інформації до бази. Значну частину роботи в підсистемі було автоматизовано, тому вона вже не потребує ручного введення даних. Вибір методу видобування і попереднього опрацювання даних залежить від джерела інформації. З урахуванням специфіки завдання можна припускати, що більшість джерел є або друкованими виданнями, або рукописними архівними документами. Тому першим кроком для їх опрацювання має бути сканування і розпізнавання тексту за допомогою поширених програмних засобів або нейронної мережі. Отриманий із джерел неструктурований текст методом синтаксичного аналізу трансформується у структурований і заноситься в таблиці певного шаблону. Видобуті дані мають бути ідентифіковані, відомості про тотожні адміністративні одиниці – об’єднані та внесені в базу даних. Запропонована підсистема підготовки даних була реалізована на прикладі підготовки географічних відомостей для Миколаївської області. Практична значимість отриманих результатів полягає в тому, що використання запропонованого алгоритму дозволить автоматизувати заповнення географічного блока даними інших регіонів для використання в регіональних тематичних архівних базах даних і загальнодержавній архівній інформаційно-пошуковій системі.uk_UA
dc.description.abstract1Abstract. The creation of archival information retrieval systems is one of the actual directions of the development of the Ukrainian archival system. However, its implementation requires entering a huge amount of information into databases. Moreover, this process is not currently automated and therefore requires significant human resources to enter data manually. The work aims to study the automation of the data preparation process for the geographical block of the archival information retrieval system from sources of various formats: electronic registers, web pages, paper books, handwritten archival documents, etc. A subsystem for data preparation is proposed. It consists of modules for searching for information sources, data extraction, data identification, and entering information into the database. Much of the work in the subsystem is automated and does not require manual data entry. The choice of method of data extraction and pre-processing depends on the source of information. Given the specifics of the task, it can be assumed that the vast majority of sources will be either printed publications or handwritten archival documents. Therefore, the first step to their processing should be scanning and text recognition using common software or neural network. Unstructured text obtained from sources is automatically transformed by syntactical analysis into structured text, which is entered in the table of a certain template. The extracted data must be identified, information about identical administrative units must be combined and entered into a database. The proposed subsystem of data preparation was implemented on the example of the preparation of geographical information for the Mykolayiv region. The significance of the obtained results is that the use of the proposed algorithm will automate the filling of the geographical block with data from other regions for use in regional thematic archival databases and the national archival information retrieval system.uk_UA
dc.identifier.issn2311–3405 (Print)
dc.identifier.issn2313-0415 (Online)uk
dc.identifier.urihttps://eir.nuos.edu.ua/handle/123456789/3827
dc.language.isoukuk_UA
dc.relation.ispartofseries004.652.4:930.25uk_UA
dc.subjectархівна інформаційно-пошукова системаuk_UA
dc.subjectгеографічний блокuk_UA
dc.subjectпідготовка данихuk_UA
dc.subjectвидобування інформаціїuk_UA
dc.subjectавтоматизація підготовки данихuk_UA
dc.subjectсинтаксичний аналіз текстуuk_UA
dc.subjectarchival information retrieval systemuk_UA
dc.subjectgeographic blockuk_UA
dc.subjectdata preparationuk_UA
dc.subjectinformation extractionuk_UA
dc.subjectdata preparation automationuk_UA
dc.subjectsyntactic analysisuk_UA
dc.titleАвтоматизація підготовки даних для географічного блока ахівної бази данихuk_UA
dc.title1Automation of data preparation for the geographic block of the archival databaseuk_UA
dc.title22020
dc.typeArticleuk_UA

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Prokop1.pdf
Розмір:
565.59 KB
Формат:
Adobe Portable Document Format
Опис:
стаття
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
7.05 KB
Формат:
Item-specific license agreed upon to submission
Опис:

Зібрання