Os cursos superiores na modalidade a distância tiveram um grande crescimento quantitativo na última década. Frente a esse crescimento, surge a preocupação com a qualidade do ensino e consequentemente com a performance acadêmica dos alunos. Com o intuito de descobrir como melhorar o desempenho dos alunos dos cursos desta modalidade educacional, em especial os alunos dos cursos de Licenciatura em Computação e Sistemas de Informação, o presente trabalho exibe um processo de descoberta de conhecimento através de métodos de Aprendizagem de Máquina (AM) supervisionados aplicados ao ensino superior a distância, mais especificamente à base de dados do SIGAA/UFPI, cujos registros foram coletados nas duas últimas entradas do vestibular da Universidade Aberta do Brasil (UAB4 e UAB5). Neste processo de descoberta de conhecimento, procurou-se a identificação de perfis dos alunos, a partir de uma correlação entre o IRA (Índice de Rendimento Acadêmico) e os aspectos sociais desses alunos. Foram utilizados três algoritmos de AM supervisionados com o paradigma simbólico: J48, RandomTree e RandomForest. Observou-se que o J48 obteve a melhor performance dentre os algoritmos aplicados, exibindo regras de produção bastante concisas que melhor representam a correlação do IRA com os demais atributos. Os perfis descobertos tendem a auxiliar os gestores do sistema de educação a distância na tomada de decisões em relação a melhorias no processo de ensino-aprendizagem, já que através da mineração de dados teve-se uma ideia do desempenho do aluno, ao mostrar que a deficiência acadêmica possui correlações com aspectos sociais. A partir dessas informações é possível definir-se estratégias diferenciadas em relação a esses alunos, como por exemplo, um acompanhamento presencial por parte dos tutores nos polos de apoio do sistema de educação a distância ou até mesmo a implantação de novas políticas públicas educacionais.