Portal de Eventos Científicos da UTFPR (EVIN), XXVI Seminário de Iniciação Científica e Tecnológica da UTFPR

Tamanho da fonte: 
Compreensão e Preparação dos Dados do Censo da Educação Superior para Mineração de Dados
Gabrieli Demenjon Mathias, André Luis Schwerz

Última alteração: 2021-10-18

Resumo


Os dados do Censo da Educação Superior anualmente são disponibilizados de forma aberta pelo governo brasileiro. Entretanto, esses dados ainda são pouco explorados pela comunidade acadêmica. Por outro lado, acredita-se que a aplicação de uma metodologia de mineração de dados a fim de descobrir padrões e regras possam produzir conhecimentos relevantes sobre a educação superior brasileira para a sociedade. Neste sentido, este artigo apresenta as etapas de compreensão e preparação dos dados do Censo da Educação Superior aplicados aos anos de 2010 a 2019 seguindo a metodologia CRISP-DM. Como resultado, apresenta-se uma base de dados relacional e um código usado para converter os dados de um formato semiestruturado para uma estrutura normalizada, livre de redundâncias e inconsistências.

Palavras-chave


Mineração de Dados; Censo da Educação Superior; CRISP; Preparação dos Dados.

Texto completo: PDF