Aumento de dados inspirado em um modelo cognitivo para a identificação de escritores usando o protocolo Document Filter

Pignelli, Fabio

Use este identificador para citar ou linkar para este item: http://repositorio.uem.br:8080/jspui/handle/1/7594

Registro completo de metadados

Campo DC	Valor	Idioma
dc.contributor.advisor	Gonçalves, Diego Bertolini	pt_BR
dc.contributor.author	Pignelli, Fabio	pt_BR
dc.date.accessioned	2024-06-06T15:09:50Z	-
dc.date.available	2024-06-06T15:09:50Z	-
dc.date.issued	2021	pt_BR
dc.identifier.citation	PIGNELLI, Fabio. Aumento de dados inspirado em um modelo cognitivo para a identificação de escritores usando o protocolo Document Filter. 2021. 73 f. Dissertação (mestrado em Ciência da Computação)--Universidade Estadual de Maringá, 2021, Maringá, PR.	-
dc.identifier.uri	http://repositorio.uem.br:8080/jspui/handle/1/7594	-
dc.description	Orientador: Prof. Dr. Diego Bertolini Gonçalves	pt_BR
dc.description	Coorientador: Prof. Dr. Yandre Maldonado e Gomes da Costa	pt_BR
dc.description	Dissertação (mestrado em Ciência da Computação)--Universidade Estadual de Maringá, 2021	pt_BR
dc.description.abstract	Resumo: Textos manuscritos são utilizados na perícia forense, entre outras aplicações, para a identificação de indivíduos. Essa tarefa pode ser realizada com o auxílio de sistemas de identificação automática de escritores, por meio de documentos manuscritos digitalizados. Nesse contexto, o presente trabalho apresenta contribuições em cenários nos quais é pequena a quantidade de imagens de manuscritos por escritor. Ao longo do trabalho, foram utilizadas as bases de dados Institut für Informatik und Angewandte Mathematik (IAM), Brazilian Forensic Letter (BFL) e Computer Vision Lab (CVL), e os descritores Binarized Statistical Image Features (BSIF), Elongated Quinary Pattern (EQP), Local Binary Pattern (LBP), Local Directional Number (LDN), Locally Encoded Transform Feature Histogram (LETRIST), Local Phase Quantization (LPQ), Oriented Basic Image Features (oBIF), Speed Up Robust Features (SURF). Além disso, foi utilizado o classificador Support Vector Machine (SVM). Em um primeiro momento, foi investigado o impacto da utilização de partes de um mesmo documento manuscrito simultaneamente nos conjuntos de treinamento e teste, o que motivou a proposta de um protocolo chamado Document Filter. Posteriormente, foi avaliado o uso de uma técnica de aumento de dados inspirada no processo cognitivo, descrita como Duplicator. Os experimentos foram realizados a nível de blocos, linhas e palavras, e todos eles superaram os respectivos baselines, que consistia do uso de unicamente amostras genuínas. Em destaque, os resultados com a adição de 15 duplicatas de 3 linhas genuínas mostraram melhorias de até 32 pontos percentuais em relação a baseline, e apontam o Duplicator como uma possível solução para cenários com poucas amostras de documentos manuscritos.	pt_BR
dc.description.abstract	Abstrat: Handwriting samples are used by forensic experts to identify individuals. This task can be performed with the aid of automatic writer identification systems, using digital images of handwritten documents. In this context, this work presents contributions in scenarios in which are few samples per writer. In our experiments, we used the following databases: Institut für Informatik und Angewandte Mathematik (IAM), Brazilian Forensic Letter (BFL) and Computer Vision Lab (CVL), and the descriptors Binarized Statistical Image Features (BSIF), Elongated Quinary Pattern (EQP), Local Binary Pattern (LBP), Local Directional Number (LDN), Locally Encoded Transform Feature Histogram (LETRIST), Local Phase Quantization (LPQ), Oriented Basic Image Features (oBIF), Speed Up Robust Features (SURF). In all experiments, Support Vector Machine (SVM) was used as classifier. At first, we investigated the impact of using non-overlapping parts of the same handwritten document simultaneously on the training and test sets, which motivated the proposal of a protocol called Document Filter. Posteriorly, we evaluated the use of a data augmentation technique inspired by a cognitive model, called Duplicator. Experiments were carried out at the level of blocks, lines, and words, and they all overcome the respective baselines, in which only genuine samples were used. In the best case, the rates obtained by adding 15 duplicates from three genuine lines raised 32 percentage points. In general, the results obtained show that Duplicator can be used as an effective strategy to mitigate the lack of handwritten samples.	pt_BR
dc.format.mimetype	application/pdf	pt_BR
dc.language	Português	pt_BR
dc.publisher	Universidade Estadual de Maringá	-
dc.rights	openAccess	-
dc.subject	Document Filter (Protocolo)	pt_BR
dc.subject	Padrões (Informática) - Sistema de reconhecimento	pt_BR
dc.subject	Inteligência artificial	pt_BR
dc.subject.ddc	006.4	pt_BR
dc.title	Aumento de dados inspirado em um modelo cognitivo para a identificação de escritores usando o protocolo Document Filter	pt_BR
dc.type	Dissertação	pt_BR
dc.contributor.advisor-co	Costa, Yandre Maldonado e Gomes da	-
dc.contributor.referee1	Amaral, Aline Maria Malachini Miotto	-
dc.contributor.referee2	Foleis, Juliano Henrique	-
dc.publisher.department	Departamento de Informática	-
dc.publisher.program	Programa de Pós-Graduação em Ciência da Computação	-
dc.subject.cnpq1	Ciências Exatas e da Terra	-
dc.publisher.local	Maringá, PR	-
dc.description.physical	73 f. : il.	-
dc.subject.cnpq2	Ciência da Computação	-
dc.publisher.center	Centro de Tecnologia	-
Aparece nas coleções:	2.4 Dissertação - Ciências de Tecnologia (CTC)

Arquivos associados a este item:

Arquivo	Tamanho	Formato
Fabio Pignelli_2021.pdf	8,47 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro simples do item Visualizar estatísticas

REPOSITÓRIO INSTITUCIONAL DA UNIVERSIDADE ESTADUAL DE MARINGÁ (RI-UEM)

A missão do Repositório Institucional da Universidade Estadual de Maringá (RI-UEM) é reunir, preservar e permitir o acesso à memória institucional (científica, técnica, artística e administrativa) da Universidade Estadual de Maringá em formato digital.