Use este identificador para citar ou linkar para este item: http://repositorio.uem.br:8080/jspui/handle/1/7594
Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisorGonçalves, Diego Bertolinipt_BR
dc.contributor.authorPignelli, Fabiopt_BR
dc.date.accessioned2024-06-06T15:09:50Z-
dc.date.available2024-06-06T15:09:50Z-
dc.date.issued2021pt_BR
dc.identifier.citationPIGNELLI, Fabio. Aumento de dados inspirado em um modelo cognitivo para a identificação de escritores usando o protocolo Document Filter. 2021. 73 f. Dissertação (mestrado em Ciência da Computação)--Universidade Estadual de Maringá, 2021, Maringá, PR.-
dc.identifier.urihttp://repositorio.uem.br:8080/jspui/handle/1/7594-
dc.descriptionOrientador: Prof. Dr. Diego Bertolini Gonçalvespt_BR
dc.descriptionCoorientador: Prof. Dr. Yandre Maldonado e Gomes da Costapt_BR
dc.descriptionDissertação (mestrado em Ciência da Computação)--Universidade Estadual de Maringá, 2021pt_BR
dc.description.abstractResumo: Textos manuscritos são utilizados na perícia forense, entre outras aplicações, para a identificação de indivíduos. Essa tarefa pode ser realizada com o auxílio de sistemas de identificação automática de escritores, por meio de documentos manuscritos digitalizados. Nesse contexto, o presente trabalho apresenta contribuições em cenários nos quais é pequena a quantidade de imagens de manuscritos por escritor. Ao longo do trabalho, foram utilizadas as bases de dados Institut für Informatik und Angewandte Mathematik (IAM), Brazilian Forensic Letter (BFL) e Computer Vision Lab (CVL), e os descritores Binarized Statistical Image Features (BSIF), Elongated Quinary Pattern (EQP), Local Binary Pattern (LBP), Local Directional Number (LDN), Locally Encoded Transform Feature Histogram (LETRIST), Local Phase Quantization (LPQ), Oriented Basic Image Features (oBIF), Speed Up Robust Features (SURF). Além disso, foi utilizado o classificador Support Vector Machine (SVM). Em um primeiro momento, foi investigado o impacto da utilização de partes de um mesmo documento manuscrito simultaneamente nos conjuntos de treinamento e teste, o que motivou a proposta de um protocolo chamado Document Filter. Posteriormente, foi avaliado o uso de uma técnica de aumento de dados inspirada no processo cognitivo, descrita como Duplicator. Os experimentos foram realizados a nível de blocos, linhas e palavras, e todos eles superaram os respectivos baselines, que consistia do uso de unicamente amostras genuínas. Em destaque, os resultados com a adição de 15 duplicatas de 3 linhas genuínas mostraram melhorias de até 32 pontos percentuais em relação a baseline, e apontam o Duplicator como uma possível solução para cenários com poucas amostras de documentos manuscritos.pt_BR
dc.description.abstractAbstrat: Handwriting samples are used by forensic experts to identify individuals. This task can be performed with the aid of automatic writer identification systems, using digital images of handwritten documents. In this context, this work presents contributions in scenarios in which are few samples per writer. In our experiments, we used the following databases: Institut für Informatik und Angewandte Mathematik (IAM), Brazilian Forensic Letter (BFL) and Computer Vision Lab (CVL), and the descriptors Binarized Statistical Image Features (BSIF), Elongated Quinary Pattern (EQP), Local Binary Pattern (LBP), Local Directional Number (LDN), Locally Encoded Transform Feature Histogram (LETRIST), Local Phase Quantization (LPQ), Oriented Basic Image Features (oBIF), Speed Up Robust Features (SURF). In all experiments, Support Vector Machine (SVM) was used as classifier. At first, we investigated the impact of using non-overlapping parts of the same handwritten document simultaneously on the training and test sets, which motivated the proposal of a protocol called Document Filter. Posteriorly, we evaluated the use of a data augmentation technique inspired by a cognitive model, called Duplicator. Experiments were carried out at the level of blocks, lines, and words, and they all overcome the respective baselines, in which only genuine samples were used. In the best case, the rates obtained by adding 15 duplicates from three genuine lines raised 32 percentage points. In general, the results obtained show that Duplicator can be used as an effective strategy to mitigate the lack of handwritten samples.pt_BR
dc.format.mimetypeapplication/pdfpt_BR
dc.languagePortuguêspt_BR
dc.publisherUniversidade Estadual de Maringá-
dc.rightsopenAccess-
dc.subjectDocument Filter (Protocolo)pt_BR
dc.subjectPadrões (Informática) - Sistema de reconhecimentopt_BR
dc.subjectInteligência artificialpt_BR
dc.subject.ddc006.4pt_BR
dc.titleAumento de dados inspirado em um modelo cognitivo para a identificação de escritores usando o protocolo Document Filterpt_BR
dc.typeDissertaçãopt_BR
dc.contributor.advisor-coCosta, Yandre Maldonado e Gomes da-
dc.contributor.referee1Amaral, Aline Maria Malachini Miotto-
dc.contributor.referee2Foleis, Juliano Henrique-
dc.publisher.departmentDepartamento de Informática-
dc.publisher.programPrograma de Pós-Graduação em Ciência da Computação-
dc.subject.cnpq1Ciências Exatas e da Terra-
dc.publisher.localMaringá, PR-
dc.description.physical73 f. : il.-
dc.subject.cnpq2Ciência da Computação-
dc.publisher.centerCentro de Tecnologia-
Aparece nas coleções:2.4 Dissertação - Ciências de Tecnologia (CTC)

Arquivos associados a este item:
Arquivo TamanhoFormato 
Fabio Pignelli_2021.pdf8,47 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.