Please use this identifier to cite or link to this item: http://repositorio.uem.br:8080/jspui/handle/1/5361
Authors: Helal, Lucas Georges
Orientador: Gonçalves, Diego Bertolin
Title: Identificação de escritores usando CNN's com abordagem de dissimilaridade
Keywords: Convolutional Neural Network (CNN);Inteligência artificial;Rede neural
Issue Date: 22-Feb-2019
Publisher: Universidade Estadual de Maringá
Citation: HELAL, Lucas Georges. Identificação de escritores usando CNN's com abordagem de dissimilaridade. 2019. 73 f. Dissertação (mestrado em Ciência da Computação)--Universidade Estadual de Maringá, Centro de Tecnologia, Departamento de Informática, 2019, Maringá, PR.
Resumo: A identificação de escritores utilizando manuscritos tornou-se um tema importante de pesquisa para análise de documentos forenses, assim, a escrita pode ser considerada uma característica usada para distinguir uma pessoa. Existem diferentes bases de dados de escritores utilizando manuscritos e contendo diferentes alfabetos. Para atingir os objetivos deste trabalho, foram utilizadas as bases de dados: CVL e a BFL ambas sendo single-script, com documentos escritos no mesmo alfabeto, e a base LAMIS-MSHD que é multi-script, ou seja, escritas em diferentes alfabetos. Além disso, várias técnicas foram aplicadas no processo de identificação de escritores. Portanto, o objetivo deste trabalho é avaliar o desempenho da técnica de inteligência artificial conhecida como Convolutional Neural Network (CNN) na identificação de escritores utilizando manuscritos. Assim, será utilizada uma CNN tanto para a classificação dos escritores, quanto para extração de características que serão submetidas ao classificador SVM e também aplicado a dissimilaridade para novos experimentos. Inicialmente, foram desenvolvidos experimentos utilizando-se a abordagem tradicional de reconhecimento de padrões, baseada na engenharia de características (ou handcraftedfeatures). Nestes experimentos, foi utilizado a geração de textura a partir dos documentos originais e posteriormente, foram extraídas as características com os descritores de textura LBP e LPQ. Assim, avaliado o impacto da classificação no SVM com e sem o uso da abordagem de dissimilaridade, obtendo com regras de combinação de classificadores uma decisão consensual em relação à decisão final. Depois de uma série de experimentos, a abordagem com dissimilaridade nas características obtidas por meio da CNN, apresentou resultados superiores em relação à literatura
Abstract: The writer identification using handwritten documents has become an important research topic in documents forensics analysis. That is because it can be used as an identifying characteristic of a person. There are several databases composed of handwritten documents available for research, using different languages and alphabets. To obtain the objectives of this work, the following databases were utilized: CVL and BFL both used for single-script, for documents written in the same alphabet and the LAMIS-MSHD database which is built for multi-script, that is, documents written with differents alphabets. Besides that, several techniques were applied in writer identification process. The objective of this work is to evaluate the performance of the artificial intelligence technique known as Convolutional Neural Network (CNN) in writer identification utilizing handwritten documents. For this, a CNN will be used for the classification of the writers, also for feature extraction that will be evaluated in the SVM classifier and dissimilarity procedures are to be applied. Initially, experiments were developed using the traditional pattern recognition approach, based on feature engineering (or handcrafted features). In these experiments, the texture generation is done from the original documents and later, the features were extracted with the texture descriptors LBP and LPQ. Furthermore, the impact of the classification in the SVM was evaluated with and without the use of the dissimilarity approach, obtaining through combination rules of classifiers, a consensual decision in relation to the final decision. After a series of experiments, the approach with feature dissimilarity obtained through CNN, presented superior results in relation to the literature
URI: http://repositorio.uem.br:8080/jspui/handle/1/5361
Appears in Collections:2.4 Dissertação - Ciências de Tecnologia (CTC)

Files in This Item:
File Description SizeFormat 
lucas-helal-dissertação-uem.pdf2,8 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.