Use este identificador para citar ou linkar para este item: http://repositorio.uem.br:8080/jspui/handle/1/2521
Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisorAdemir Aparecido Constantinopt_BR
dc.contributor.authorSouza, Murilo Zangari dept_BR
dc.date.accessioned2018-04-10T20:12:20Z-
dc.date.available2018-04-10T20:12:20Z-
dc.date.issued2012pt_BR
dc.identifier.urihttp://repositorio.uem.br:8080/jspui/handle/1/2521-
dc.description.abstractThe classification task in Data Mining uses algorithms called classifiers to find patterns on data bases. Real data bases can have an imbalance in its classes, when there are more cases of one class then the others. Classification algorithms are sensitive of this imbalance and tend to valorize the majority class and ignore de minority class, because the cases of minority class have low representation on the training set. It is a problem when the minority class is the class of interest. In this work we propose two extensions to the Ant-Miner algorithm to find better rules to the minority classes. These extensions modify, mainly, how rules are constructed and evaluated. The Ant-Miner algorithm is based on ACO (Ant Colony Optimization). The original version and others related works showed that the Ant-Miner is competitive with other standard classifiers. Moreover, we analyzed sampling techniques (undersampling and oversampling) and also a study of ROC (Receiver Operating Characteristics) analysis. The sampling techniques aim to make a new sampling of the data sets changing the classes? proportion of the training set. The ROC analysis can evaluate the results with more accurate than other metrics, mainly when the classifiers are applied in data sets with classes imbalance. Experimental results showed that the developed algorithms contribute to the rule discovery of the minority classes and also contribute with the simplicity of the rules.en
dc.languageporpt_BR
dc.publisherUniversidade Estadual de Maringápt_BR
dc.rightsopenAccesspt_BR
dc.subjectMineração de dadospt_BR
dc.subjectOtimização por colonia de formigas artificiais (ACO)pt_BR
dc.subjectTarefa de classificaçãopt_BR
dc.subjectBases de dados desbalanceadaspt_BR
dc.subjectAlgoritmo Ant-Minerpt_BR
dc.subjectAnálise ROCpt_BR
dc.subjectBrasil.pt_BR
dc.subjectData Miningen
dc.subjectClassification tasken
dc.subjectClass imbalanceen
dc.subjectAnt-Mineren
dc.subjectSamplingen
dc.subjectROC analysisen
dc.subjectBrazil.en
dc.titleExtensões do algoritmo Ant-Miner para tratar o problema de bases de dados desbalanceadaspt_BR
dc.title.alternativeExtensions to the Ant-Miner Algorithm to Deal with Imbalanced Data Setsen
dc.typemasterThesispt_BR
dc.contributor.referee1Wesley Romão - UEM-
dc.contributor.referee2Valéria Delisandra Feltrin - UEM-
dc.contributor.referee3Deborah Ribeiro Carvalho - PPGTS/PUC-PR-
dc.description.resumoA tarefa de classificação em Mineração de Dados utiliza algoritmos chamados de classificadores para extrair padrões sobre bases de dados. Bases de dados reais podem apresentar um desbalanceamento em suas classes, contendo mais casos de uma classe do que de outras. Algoritmos classificadores têm dificuldade em encontrar padrões de qualidade para as classes minoritárias, pelo fato dos casos pertencentes à classe minoritária possuírem pouca representatividade no conjunto de treinamento. Isto se torna um problema quando a classe minoritária é a de maior interesse para o usuário. O objetivo deste trabalho é o desenvolvimento de extensões para o algoritmo Ant-Miner (Ant Colony-based Data Miner) para ajudar a encontrar melhores regras para as classes minoritárias. Essas extensões modificam, principalmente, a forma como as regras são construídas e avaliadas. O algoritmo Ant-Miner é baseado na meta heurística ACO (Ant Colony Optimization) e tanto a versão original quanto outros trabalhos relacionados mostram que a técnica é competitiva com outros algoritmos de classificação. Além disso, são analisadas técnicas de balanceamento (undersampling e oversampling) e também um estudo da análise ROC (Receiver Operating Characteristics). As técnicas de balanceamento visam fazer uma nova amostragem dos dados mudando a distribuição do conjunto de treinamento. A análise ROC realiza avaliações mais apuradas que outras métricas (e.g.: taxa de acerto), principalmente quando se trata de bases com classes desbalanceadas. Resultados experimentais mostraram que os algoritmos desenvolvidos contribuíram para a descoberta de melhores regras para as classes minoritárias e também com a simplicidade do modelo de regras.pt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentDepartamento de Informática-
dc.publisher.programPrograma de Pós-Graduação em Ciência da Computaçãopt_BR
dc.publisher.initialsUEMpt_BR
dc.subject.cnpq1Ciências Exatas e da Terrapt_BR
dc.publisher.localMaringá, PRpt_BR
dc.description.physical75 fpt_BR
dc.subject.cnpq2Ciência da Computaçãopt_BR
dc.publisher.centerCentro de Tecnologiapt_BR
Aparece nas coleções:2.4 Dissertação - Ciências de Tecnologia (CTC)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
000199315.pdf2,03 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.