Use este identificador para citar ou linkar para este item: http://repositorio.uem.br:8080/jspui/handle/1/7616
Autor(es): Nunes, Rodrigo Mansueli
Orientador: Feltrim, Valéria Delisandra
Título: Explorando stacking na classificação automática de textos multirrótulos
Banca: Costa, Yandre Maldonado e Gomes da
Banca: Cândido Júnior, Arnaldo
Palavras-chave: Ciência da computação - Processamento de textos;Rede neural;Aprendizagem de máquina
Data do documento: 2021
Editor: Universidade Estadual de Maringá
Citação: NUNES, Rodrigo Mansueli. Explorando stacking na classificação automática de textos multirrótulos. 2021. 85 f. Dissertação (mestrado em Ciência da Computação)--Universidade Estadual de Maringá, 2021, Maringá, PR.
Abstract: Resumo: Neste trabalho é apresentada uma exploração sobre a utilização de stacking de classificadores para a classificação textual multirrótulo, em especial com a utilização de uma rede neural profunda no primeiro nível do stacking. Para a avaliação, foram utilizados dois conjuntos de dados em inglês: o The Movie Database (TMDB), que possui 159.416 sinopses de filmes, e o EUR-LEX subject matters, que possui 19.348 textos legais da União Europeia. Os experimentos conduzidos aplicaram os algoritmos de redes neurais recorrentes (RNN), BR, RAkEL e Cadeias de Classificadores (CC) nas duas bases diretamente e os algoritmos SVM e J48 foram utilizados como base para os classificadores BR, RAkEL e CC. Também foram propostos stackings de dois níveis utilizando combinações desses modelos. Comparou-se três grupos de classificadores: baseados em algoritmos multirrótulo, baseados em stacking e baseados em stacking com redes neurais. Os resultados mostram que o uso de stacking se mostrou melhor quando comparado aos modelos sem stacking e o uso de stacking com RNN no primeiro nível obteve melhores resultados que o uso de stacking tradicionais.
Abstrat: Here we present our exploration about using stacked classifiers for multi-label text classification, especially the use of a neural net in the first stage of the stack. We two sets of data in English for evaluation: The Movie Database (TMDB), which has 159,416 synopses of movies, and EUR-LEX subject matters, which has 19,348 legal texts from the European Union. The experiments used Recurrent Neural Networks (RNN), BR, RAkEL and Classifier Chains on the TMDB and EUR-LEX. The algorithms SVM and J48 were used as base classifiers for BR, RAkEL and CC. We also proposed two-stage stacks combining these models. We compared three classifier groups: based on multi-label algorithms, based on stacking, and based on stacking with neural nets. The results show that the use of stacking increases the improvement when compared with the models without stacking and that using RNN in the first stage of the stacking gets better results than traditional stacking models.
Descrição: Orientadora: Profª. Drª. Valéria Delisandra Feltrim
Coorientador: Prof. Dr. Marcos Aurélio Domingues
Dissertação (mestrado em Ciência da Computação)--Universidade Estadual de Maringá, 2021
URI: http://repositorio.uem.br:8080/jspui/handle/1/7616
Aparece nas coleções:2.4 Dissertação - Ciências de Tecnologia (CTC)

Arquivos associados a este item:
Arquivo TamanhoFormato 
Rodrigo Mansueli Nunes_2021.pdf4,03 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.