O peixe-boi marinho (Trichechus manatus manatus) é o mamífero aquático mais ameaçado de extinção no Brasil e sua distribuição ao longo da costa marinha tem diminuído com o passar dos anos. Para que se desenvolva propostas de preservação e manejo da espécie e dos ambientes onde vive é necessário informações sobre a interação desses organismos com os recursos naturais disponíveis em seu habitat e as características ambientais que tornam possível a sua sobrevivência. Métodos estatísticos frequentemente são usados para este propósito, porém não se adequam totalmente à necessidade, tendo em vista que os ecossistemas apresentam relações não-lineares entre seus componentes. Dada a existência de um volume de dados coletados sobre a presença de peixe-boi marinho no estuário dos rios Timonha e Ubatuba (PI/CE) foi proposto o uso do processo de Descoberta de Conhecimento em Bases de Dados (DCBD) para manipulação dessas informações para se estimar a presença e a localização de espécimes. A metodologia utilizada engloba o pré- processamento, transformação, mineração dos dados e interpretação dos padrões obtidos. Foi relizado a preparação da base e dados e na fase de Data mining (mineração de dados) do processo de DCBD foram empregados algoritmos classificadores dos paradigmas simbólico (J48, Random Forest e Random Tree), estatístico (Naive Bayes e Tree Augmented Naive Bayes) e conexionista (Multi Layer Perceptron e Radial Basis Function) para definir qual deles têm melhor desempenho em estimar a presença do animal, de acordo com a situação ambiental representada pelos atributos da base de dados, e a região de aparecimento dos espécimes e para a obtenção de padrões significativos e válidos que possam apoiar o planejamento e ações em favor da continuidade da espécie. A rotulação automática de grupos também foi utilizada sobre os clusters gerados pelo algoritmo não-supervisionado K-means para definição e entendimento das características comuns aos elementos agrupados semelhantemente. Os resultados obtidos foram avaliados de acordo com um conjunto de métricas selecionadas (acurácia, índice Kappa, precisão, recall, f-measure e área sob a curva ROC) para que se pudesse verificar a qualidade dos modelos gerados, selecionar os melhores resultados e descobrir informações importantes sobre os atributos estudados. A interpretação dos padrões obtidos foi apoiada pela literatura especializada e os resultados estão de acordo com o que é mostrado pelos levantamentos de distribuição e ocorrências do mamífero no país..