УДК 519.688
В статье предлагается подход к решению задачи классификации электронных документов (ЭД) и задачи извлечения метаданных, который лег в основу алгоритма автоматического извлечения метаданных из любого электронного документа, с использованием аппарата нейронной сети Кохонена. Подход был реализован в рамках подсистемы автоматического излечения метаданных из слабоструктурированных документов.
In this article presents one method to solving the problem of classification of electronic documents (ED) and problem of metadata extraction, which formed the basis of the algorithm automatically extracting metadata from any electronic document, based on Kohonen neural network,. The method has been implemented in the subsystem automatic metadata extraction from semi-structured documents.