Use este identificador para citar ou linkar para este item:
http://repositorio.uem.br:8080/jspui/handle/1/8313
Autor(es): | Zayatz, João Carlos |
Orientador: | Leal, Gislaine Camila Lapasini |
Título: | Análise de correspondência múltipla e modelos de machine learning para notificações de dengue no Paraná |
Banca: | Bonfim-Mendonça, Patrícia de Souza |
Banca: | Lima, Rafael Henrique Palma |
Palavras-chave: | Dengue;Saúde - Sistemas de informação |
Data do documento: | 2022 |
Editor: | Universidade Estadual de Maringá |
Citação: | ZAYATZ, João Carlos. Análise de correspondência múltipla e modelos de machine learning para notificações de dengue no Paraná. 2022. 81 f. Dissertação (mestrado em Engenharia de Produção) - Universidade Estadual de Maringá, 2022, Maringá, PR. |
Abstract: | A dengue é a arbovirose de maior alcance mundial, causando perdas de vidas humanas e impactos econômicos diretos e indiretos, principalmente em regiões de clima tropical. Bancos de dados de registros de notificações contribuem para o monitoramento e pesquisa sobre a dengue. Neste estudo, dados do Sistema de Informações de Agravos de Notificações (SINAN) permitem analisar registros de notificações da doença no estado do Paraná, região Sul do Brasil, no ano de 2019-2020. Com um total de 366.760 notificações, este período represento recorde na série histórica de incidência para o estado. Os registros contam com informações socioeconômicas e clínicas, a partir das quais elabora-se uma pesquisa quantitativa. O estudo é dividido em duas etapas. Na primeira, a análise estatística descritiva é utilizada para oferecer um panorama dos registros de notificações. São apontadas lacunas de preenchimento do SINAN, que representam pontos de atenção, uma vez que a análise dos dados da dengue depende da integridade e confiabilidade dos registros. Para complementar esta fase, optou-se por utilizar a análise de correspondência múltipla, por meio de método gráfico, que permite visualizar relações entre as variáveis do SINAN para notificações de dengue. O objetivo é indicar associações que ficam ocultas na análise estatística descritiva e que, quando evidenciadas, podem ser exploradas em pesquisas da área de saúde. Na segunda etapa, modelos de classificação supervisionada em machine learning são proposto, com o objetivo de contribuir com possibilidades de automatização da tarefa de classificação de notificações de dengue, levando em conta quatro níveis de classificação do agravo: descarte, dengue clássica, dengue com sinais de alarme e dengue grave. A construção é feita a partir do classificador probabilístico Naïve Bayes. Os parâmetros de avaliação dos modelos contam com índice Kappa de concordância estatística. Os resultados evidenciam que a tarefa de classificar notificações em "dengue clássica" ou "descartado" mostrou-se complexa, a partir das variáveis estruturadas do SINAN. Por outro lado, um modelo mais robusto foi obtido para classificação de gravidade de dengue, em casos confirmados. Estes resultados são evidenciados pela análise da distribuição espacial das amostras, a partir de uma técnica projection pursuit com o índice LDA. Dengue fever is the most widespread arbovirus in the world, causing loss of human life and direct and indirect economic impacts, especially in tropical regions. Databases of notification records contribute to dengue monitoring and research. In this study, data from the Information System of Diseases of Notifications (SINAN) allow analyzing records of notifications of the disease in the state of Paraná, southern region of Brazil, in the year 2019-2020. With a total of 366,760 notifications, this period represented a record in the historical series of incidence for the state. The records contain socioeconomic and clinical information, from which a quantitative survey is carried out. The study is divided into two stages. In the first, descriptive statistical analysis is used to provide an overview of notification records. Gaps in filling in the SINAN are pointed out, which represent points of attention, since the analysis of dengue fever data depends on the integrity and reliability of the records. To complement this phase, it was decided to use multiple correspondence analysis, using a graphical method, which allows the visualization of relationships between SINAN variables for dengue notifications. The objective is to indicate associations that are hidden in the descriptive statistical analysis, When evidenced, can be explored in health research. In the second stage, supervised classification models in machine learning are proposed, with the objective of contributing with possibilities of automating the task of classifying dengue fever notifications, considering four levels of disease classification: discard, classic dengue, dengue with warning signs and severe dengue. The construction is made using the Naïve Bayes probabilistic classifier. The evaluation parameters of the models have a Kappa index of statistical agreement. The results show that the task of classifying notifications into "classical" or "discarded" proved to be complex, based on the structured variables of the SINAN. On the other hand, a more robust model was obtained for classifying dengue fever severity in confirmed cases. These results are evidenced by the analysis of the spatial distribution of the samples, from a projection pursuit technique with the LDA index. |
Descrição: | Orientador: Prof. Dr. Gislaine Camila Lapasini Leal. Coorientador: Prof. Dr. Paulo Cesar Ossani. Dissertação (mestrado em Engenharia de Produção) - Universidade Estadual de Maringá, 2022 |
URI: | http://repositorio.uem.br:8080/jspui/handle/1/8313 |
Aparece nas coleções: | 2.4 Dissertação - Ciências de Tecnologia (CTC) |
Arquivos associados a este item:
Arquivo | Tamanho | Formato | |
---|---|---|---|
Joao Carlos Zayatz_2022.pdf | 1,83 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.