Use este identificador para citar ou linkar para este item: http://repositorio.uem.br:8080/jspui/handle/1/8417
Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisorBalancieri, Renatopt_BR
dc.contributor.authorSantos, Adautopt_BR
dc.date.accessioned2024-12-17T18:52:11Z-
dc.date.available2024-12-17T18:52:11Z-
dc.date.issued2022pt_BR
dc.identifier.citationSANTOS, Adauto. Identificação de beneficiários de alto risco assistencial em uma operadora privada de planos de saúde. 2022. 171 f. Dissertação (mestrado em Ciência da Computação)-Universidade Estadual de Maringá, 2022, Maringá, PR.-
dc.identifier.urihttp://repositorio.uem.br:8080/jspui/handle/1/8417-
dc.descriptionOrientador: Prof. Dr. Renato Balancieript_BR
dc.descriptionCoorientador: Prof.ª Dr.ª Gislaine Camila Lapasini Lealpt_BR
dc.descriptionDissertação (mestrado em Ciência da Computação)-Universidade Estadual de Maringá, 2022pt_BR
dc.description.abstractResumo: No âmbito da saúde os dados têm sido armazenados e acumulados em ritmo acelerado, impulsionando o desenvolvimento de mecanismos para auxiliar na interpretação de padrões e na exploração de repositórios de dados. A proposta deste estudo foi aplicar o processo KDD (descoberta de conhecimento em bases de dados) para classificar os beneficiários pertencentes a uma operadora privada de planos de saúde. A classe-alvo foi definida pela incidência da entrada dos beneficiários nos estratos de custo mais elevados nos próximos 12 meses em relação ao mês analisado. Para a condução do estudo foram estabelecidos conjuntos de dados contendo informações de utilização do plano de saúde e de características dos beneficiários. Para a tarefa de classificação foram utilizados 5 algoritmos de aprendizagem de máquina: Random forest, Extra tree, Xgboost, Naive bayes e K-nearest neighbor. Com a execução dos algoritmos nos conjuntos de dados do período de janeiro/2019 a junho/2020, foi observado que o algoritmo K-nearest neighbor apresentou recall de 81,12%, precisão de 83,77% e AUC de 0,9045 e a classificação ocorre em média 8,11 meses antes da incidência do evento. Considerando os resultados obtidos pelos processos de classificação, foi observado que o algoritmo K-nearest neighbor apresentou os melhores resultados nas métricas recall, acurácia, F1-Score, além de apresentar o maior intervalo de tempo entre a obtenção do resultado e a incidência do evento, o algoritmo Extra tree obteve a melhor precisão e o Random forest apresentou melhor valor AUC. Por outro lado, a execução do Naive bayes obteve o pior resultado em todas as métricas, além de ter apresentado a maior perda de recall durante o período avaliadopt_BR
dc.description.abstractAbstrat: In health, data has been stored and accumulated at an accelerated pace, driving the development of mechanisms to assist in the interpretation of patterns and in the exploration of data repositories. The purpose of this study was to apply KDD process (Knowledge Discovery in Databases) to classify the users of a private healthcare insurance to find out if beneficiaries would belong, at least once, to the ‘very high cost’ and ‘complex cases’ groups throughout the 12 months after the month when the algorithms were applied. Datasets were built containing information on beneficiaries’ effective use of their health plan, as well as their characteristics. Five machine learning algorithms were used for classification, namely Random forest, Extra tree, Xgboost, Naive bayes and K-nearest neighbor. The K-nearest neighbor algorithm had a recall rate of 81.12%, 83.77% of precision and an AUC value of 0.9045. The study also revealed that categorization occurs, on average, 8.11 months before a beneficiary entering, for the first time, a high-risk group, considering the dataset classification from January/2019 to June/2020. The results show that the K-nearest neighbor algorithm presented the best results regarding recall, accuracy, F1-Score metrics, in addition to the best time interval between obtaining results and an event taking place. Extra tree had the best precision rate, whereas Random forest had the best AUC value. On the other hand, Naive bayes had the worst results for all metrics, besides presenting the greatest recall loss during the period covered by evaluationpt_BR
dc.format.mimetypeapplication/pdfpt_BR
dc.languagePortuguêspt_BR
dc.publisherUniversidade Estadual de Maringá-
dc.rightsopenAccess-
dc.subjectKnowledge Discovery in Databases (KDD)pt_BR
dc.subjectMineração de dadospt_BR
dc.subjectMachine learningpt_BR
dc.subjectHealthcarept_BR
dc.subjectPlanos de saúdept_BR
dc.subject.ddc006.331pt_BR
dc.titleIdentificação de beneficiários de alto risco assistencial em uma operadora privada de planos de saúdept_BR
dc.typeDissertaçãopt_BR
dc.contributor.advisor-coLeal, Gislaine Camila Lapasini-
dc.contributor.referee1Souza, Rodrigo Clemente Thom de-
dc.contributor.referee2Lima, Rafael Henrique Palma-
dc.publisher.departmentDepartamento de Informática-
dc.publisher.programPrograma de Pós-Graduação em Ciência da Computação-
dc.subject.cnpq1Ciências Exatas e da Terra-
dc.publisher.localMaringá, PR-
dc.description.physical171 f. : il. (algumas color.).-
dc.subject.cnpq2Ciência da Computação-
dc.publisher.centerCentro de Tecnologia-
Aparece nas coleções:2.4 Dissertação - Ciências de Tecnologia (CTC)

Arquivos associados a este item:
Arquivo TamanhoFormato 
Adauto Santos_2022.pdf16,54 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.