Frente ao aumento do tráfego de dados em consequência de novas tecnologias, como também
a necessidade de mais equipamentos conectados à rede passíveis de processamento de dados,
cada vez mais algoritmos de aprendizado de máquina estão sendo estudados para extraírem
dados relevantes de grandes volumes de dados. A partir desse problema de interpretação,
em grandes volumes de dados, tem-se um grau de dificuldade diretamente proporcional
ao crescimeto desse volume. É nesse tema onde este trabalho atua, no entendimento dos
grupos que são formados e não na criação dos mesmos. Diante o entendimento desses
grupos esta pesquisa realiza de forma empírica, ou seja, através de experimentos e testes, a
identificação de atributos mais significativos no grupo, junto com faixa de valores que mais
se repetem a ponto de representá-lo (rotulação). Dessa forma para a realização da rotulação
de grupos de dados a proposta desta pesquisa é utilizar dois algoritmos supervisionados,
cada um, com paradigmas diferentes: Naive Bayes (estatístico) e CART (simbólico). E a
partir dos testes demonstrar que a rotulação é capaz de representar o grupo. Nos resultados
obtemos uma acurácia acima de 70% de acerto dos valores representados pelo rótulo
escolhido.