Use este identificador para citar ou linkar para este item: http://repositorio.uem.br:8080/jspui/handle/1/8417
Autor(es): Santos, Adauto
Orientador: Balancieri, Renato
Título: Identificação de beneficiários de alto risco assistencial em uma operadora privada de planos de saúde
Banca: Souza, Rodrigo Clemente Thom de
Banca: Lima, Rafael Henrique Palma
Palavras-chave: Knowledge Discovery in Databases (KDD);Mineração de dados;Machine learning;Healthcare;Planos de saúde
Data do documento: 2022
Editor: Universidade Estadual de Maringá
Citação: SANTOS, Adauto. Identificação de beneficiários de alto risco assistencial em uma operadora privada de planos de saúde. 2022. 171 f. Dissertação (mestrado em Ciência da Computação)-Universidade Estadual de Maringá, 2022, Maringá, PR.
Abstract: Resumo: No âmbito da saúde os dados têm sido armazenados e acumulados em ritmo acelerado, impulsionando o desenvolvimento de mecanismos para auxiliar na interpretação de padrões e na exploração de repositórios de dados. A proposta deste estudo foi aplicar o processo KDD (descoberta de conhecimento em bases de dados) para classificar os beneficiários pertencentes a uma operadora privada de planos de saúde. A classe-alvo foi definida pela incidência da entrada dos beneficiários nos estratos de custo mais elevados nos próximos 12 meses em relação ao mês analisado. Para a condução do estudo foram estabelecidos conjuntos de dados contendo informações de utilização do plano de saúde e de características dos beneficiários. Para a tarefa de classificação foram utilizados 5 algoritmos de aprendizagem de máquina: Random forest, Extra tree, Xgboost, Naive bayes e K-nearest neighbor. Com a execução dos algoritmos nos conjuntos de dados do período de janeiro/2019 a junho/2020, foi observado que o algoritmo K-nearest neighbor apresentou recall de 81,12%, precisão de 83,77% e AUC de 0,9045 e a classificação ocorre em média 8,11 meses antes da incidência do evento. Considerando os resultados obtidos pelos processos de classificação, foi observado que o algoritmo K-nearest neighbor apresentou os melhores resultados nas métricas recall, acurácia, F1-Score, além de apresentar o maior intervalo de tempo entre a obtenção do resultado e a incidência do evento, o algoritmo Extra tree obteve a melhor precisão e o Random forest apresentou melhor valor AUC. Por outro lado, a execução do Naive bayes obteve o pior resultado em todas as métricas, além de ter apresentado a maior perda de recall durante o período avaliado
Abstrat: In health, data has been stored and accumulated at an accelerated pace, driving the development of mechanisms to assist in the interpretation of patterns and in the exploration of data repositories. The purpose of this study was to apply KDD process (Knowledge Discovery in Databases) to classify the users of a private healthcare insurance to find out if beneficiaries would belong, at least once, to the ‘very high cost’ and ‘complex cases’ groups throughout the 12 months after the month when the algorithms were applied. Datasets were built containing information on beneficiaries’ effective use of their health plan, as well as their characteristics. Five machine learning algorithms were used for classification, namely Random forest, Extra tree, Xgboost, Naive bayes and K-nearest neighbor. The K-nearest neighbor algorithm had a recall rate of 81.12%, 83.77% of precision and an AUC value of 0.9045. The study also revealed that categorization occurs, on average, 8.11 months before a beneficiary entering, for the first time, a high-risk group, considering the dataset classification from January/2019 to June/2020. The results show that the K-nearest neighbor algorithm presented the best results regarding recall, accuracy, F1-Score metrics, in addition to the best time interval between obtaining results and an event taking place. Extra tree had the best precision rate, whereas Random forest had the best AUC value. On the other hand, Naive bayes had the worst results for all metrics, besides presenting the greatest recall loss during the period covered by evaluation
Descrição: Orientador: Prof. Dr. Renato Balancieri
Coorientador: Prof.ª Dr.ª Gislaine Camila Lapasini Leal
Dissertação (mestrado em Ciência da Computação)-Universidade Estadual de Maringá, 2022
URI: http://repositorio.uem.br:8080/jspui/handle/1/8417
Aparece nas coleções:2.4 Dissertação - Ciências de Tecnologia (CTC)

Arquivos associados a este item:
Arquivo TamanhoFormato 
Adauto Santos_2022.pdf16,54 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.