Автоматизація підготовки даних для географічного блока ахівної бази даних
dc.contributor.author | Прокоп, Ю. В. | |
dc.contributor.author | Трофименко, О. Г. | |
dc.contributor.author | Прокоп, А. С. | |
dc.contributor.author | Prokop, Yuliіa V. | |
dc.contributor.author | Trofymenko, Olena G. | |
dc.contributor.author | Prokop, Artem S. | |
dc.date.accessioned | 2021-04-09T08:27:10Z | |
dc.date.available | 2021-04-09T08:27:10Z | |
dc.date.issued | 2020 | |
dc.description | Прокоп, Ю. В. Автоматизація підготовки даних для географічного блока архівної бази даних = Automation of data preparation for the geographic block of the archival database / Ю. В. Прокоп, О. Г. Трофименко, А. С. Прокоп // Зб. наук. пр. НУК. – Миколаїв : НУК, 2020. – № 2 (480). – С. 107–114. | uk_UA |
dc.description.abstract | Анотація. Створення архівних інформаційно-пошукових систем є одним з актуальних напрямів розвитку української архівної галузі. Проте реалізація його потребує внесення до баз даних величезного обсягу інформації, причому цей процес нині не автоматизований, а тому потребує значних людських ресурсів для введення даних вручну. Метою роботи є дослідження автоматизації процесу підготовки даних для географічного блока архівної інформаційно-пошукової системи із джерел різного формату: електронних реєстрів, вебсторінок, паперових друкованих видань, рукописних архівних документів тощо. Пропонується підсистема для підготовки даних, яка складається з модулів пошуку джерел інформації, видобування даних, ідентифікації даних і внесення інформації до бази. Значну частину роботи в підсистемі було автоматизовано, тому вона вже не потребує ручного введення даних. Вибір методу видобування і попереднього опрацювання даних залежить від джерела інформації. З урахуванням специфіки завдання можна припускати, що більшість джерел є або друкованими виданнями, або рукописними архівними документами. Тому першим кроком для їх опрацювання має бути сканування і розпізнавання тексту за допомогою поширених програмних засобів або нейронної мережі. Отриманий із джерел неструктурований текст методом синтаксичного аналізу трансформується у структурований і заноситься в таблиці певного шаблону. Видобуті дані мають бути ідентифіковані, відомості про тотожні адміністративні одиниці – об’єднані та внесені в базу даних. Запропонована підсистема підготовки даних була реалізована на прикладі підготовки географічних відомостей для Миколаївської області. Практична значимість отриманих результатів полягає в тому, що використання запропонованого алгоритму дозволить автоматизувати заповнення географічного блока даними інших регіонів для використання в регіональних тематичних архівних базах даних і загальнодержавній архівній інформаційно-пошуковій системі. | uk_UA |
dc.description.abstract1 | Abstract. The creation of archival information retrieval systems is one of the actual directions of the development of the Ukrainian archival system. However, its implementation requires entering a huge amount of information into databases. Moreover, this process is not currently automated and therefore requires significant human resources to enter data manually. The work aims to study the automation of the data preparation process for the geographical block of the archival information retrieval system from sources of various formats: electronic registers, web pages, paper books, handwritten archival documents, etc. A subsystem for data preparation is proposed. It consists of modules for searching for information sources, data extraction, data identification, and entering information into the database. Much of the work in the subsystem is automated and does not require manual data entry. The choice of method of data extraction and pre-processing depends on the source of information. Given the specifics of the task, it can be assumed that the vast majority of sources will be either printed publications or handwritten archival documents. Therefore, the first step to their processing should be scanning and text recognition using common software or neural network. Unstructured text obtained from sources is automatically transformed by syntactical analysis into structured text, which is entered in the table of a certain template. The extracted data must be identified, information about identical administrative units must be combined and entered into a database. The proposed subsystem of data preparation was implemented on the example of the preparation of geographical information for the Mykolayiv region. The significance of the obtained results is that the use of the proposed algorithm will automate the filling of the geographical block with data from other regions for use in regional thematic archival databases and the national archival information retrieval system. | uk_UA |
dc.identifier.issn | 2311–3405 (Print) | |
dc.identifier.issn | 2313-0415 (Online) | uk |
dc.identifier.uri | https://eir.nuos.edu.ua/handle/123456789/3827 | |
dc.language.iso | uk | uk_UA |
dc.relation.ispartofseries | 004.652.4:930.25 | uk_UA |
dc.subject | архівна інформаційно-пошукова система | uk_UA |
dc.subject | географічний блок | uk_UA |
dc.subject | підготовка даних | uk_UA |
dc.subject | видобування інформації | uk_UA |
dc.subject | автоматизація підготовки даних | uk_UA |
dc.subject | синтаксичний аналіз тексту | uk_UA |
dc.subject | archival information retrieval system | uk_UA |
dc.subject | geographic block | uk_UA |
dc.subject | data preparation | uk_UA |
dc.subject | information extraction | uk_UA |
dc.subject | data preparation automation | uk_UA |
dc.subject | syntactic analysis | uk_UA |
dc.title | Автоматизація підготовки даних для географічного блока ахівної бази даних | uk_UA |
dc.title1 | Automation of data preparation for the geographic block of the archival database | uk_UA |
dc.title2 | 2020 | |
dc.type | Article | uk_UA |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Prokop1.pdf
- Розмір:
- 565.59 KB
- Формат:
- Adobe Portable Document Format
- Опис:
- стаття
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 7.05 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: