Tamanho da fonte:
Compreensão e Preparação dos Dados do Censo da Educação Superior para Mineração de Dados
Última alteração: 2021-10-18
Resumo
Os dados do Censo da Educação Superior anualmente são disponibilizados de forma aberta pelo governo brasileiro. Entretanto, esses dados ainda são pouco explorados pela comunidade acadêmica. Por outro lado, acredita-se que a aplicação de uma metodologia de mineração de dados a fim de descobrir padrões e regras possam produzir conhecimentos relevantes sobre a educação superior brasileira para a sociedade. Neste sentido, este artigo apresenta as etapas de compreensão e preparação dos dados do Censo da Educação Superior aplicados aos anos de 2010 a 2019 seguindo a metodologia CRISP-DM. Como resultado, apresenta-se uma base de dados relacional e um código usado para converter os dados de um formato semiestruturado para uma estrutura normalizada, livre de redundâncias e inconsistências.
Palavras-chave
Mineração de Dados; Censo da Educação Superior; CRISP; Preparação dos Dados.
Texto completo:
PDF