Com o aumento no volume de dados gerados pelos sistemas de informação educacionais,
a Mineração de Dados se tornou uma abordagem promissora de investigação sobre importantes
causas educacionais, como a evasão nos mais diversos níveis de ensino, em
especial o ensino superior. Segundo Hipolito (2023), mais de 2,3 milhões de alunos aptos a
matricular-se em disciplinas em 2021 abandonaram o ensino superior, de acordo com o
censo mais recente da educação superior, resultando em um prejuízo financeiro superior a
R$ 23 bilhões. Neste estudo de Mineração de Dados Educacionais (MDE), desenvolvemos
modelos de classificação com aprendizado supervisionado e cinco abordagens com métodos
Ensembles aplicadas a dados reais coletados de uma Instituição Federal de Ensino Superior.
No primeiro cenário, criamos modelos do tipo Bagging utilizando a estratégia de Janelas
Semestrais na construção dos conjuntos de dados envolvidos. No segundo cenário, além da
abordagem de Janelas Semestrais (Nível Período), criamos conjuntos de dados em outros
dois níveis adicionais (Curso e Instituição) e combinamos os modelos gerados (cada um
associado a um conjunto de dados de nível distinto) por meio de técnicas de Ensemble
Stacking. A combinação das abordagens formando modelos Stacking com as predições dos
modelos Bagging resultou em um maior nível de robustez e na maximização dos resultados
(mensurados por Acurácia e MCC) mesmo com o uso de um único algoritimo por modelo,
ao explorar a diversidade nos diferentes níveis de dados.