News

Banca de QUALIFICAÇÃO: FÁBIO CORDEIRO

Uma banca de QUALIFICAÇÃO de MESTRADO foi cadastrada pelo programa.
DISCENTE: FÁBIO CORDEIRO
DATA: 29/09/2022
HORA: 14:30
LOCAL: Sala de aula do PPGCC
TÍTULO: Classificação de Comunicados de Irregularidades da Ouvidoria do TCE/PI Utilizando Técnicas de Aprendizado Profundo
PALAVRAS-CHAVES: Aprendizagem de Máquina, Classificação de Texto, Comunicados de Irregularidades, Processamento de Linguagem Natural
PÁGINAS: 46
GRANDE ÁREA: Ciências Exatas e da Terra
ÁREA: Ciência da Computação
SUBÁREA: Metodologia e Técnicas da Computação
ESPECIALIDADE: Sistemas de Informação
RESUMO:

Com o crescimento da participação popular no controle social e gastos públicos, exercido por meio de manifestações, faz-se necessária a adoção de modelos computacionais inteligentes que ajudem a analisar e entender essas manifestações realizadas de forma textual, garantindo assim uma resposta melhor e mais célere à sociedade. Pretende-se, com o uso de Processamento de Linguagem Natural (PLN) e Aprendizado de Máquina (AM), classificar as manifestações feitas por meio da Ouvidoria do Tribunal de Contas do Estado do Piauí (TCE/PI). O objetivo desse trabalho é investigar modelos de AM, utilizando técnicas de PLN, que possam substituir o trabalho manual de classificação de manifestações (Comunicados de Irregularidades), fazendo um comparativo dos resultados obtidos. Devido a pouca quantidade de Comunicados de Irregularidades classificados e o desbalanceamento das classes foram utilizadas técnicas de redimensionamento da amostra para realizar o balanceamento e o aumento artificial das classes com poucos itens. Dentre os modelos tradicionais, o modelo Random Forest obteve o melhor resultado, 88,0% para as métricas de acurácia e F1-Score. O modelo Bidirectional Encoder Representations from Transformers (BERT), obteve 96,0% para as mesmas métricas. Destaca-se que técnicas de redimensionamento de datasets desbalanceados melhoram significativamente os resultados tanto de modelos tradicionais de AM quanto de modelos de Aprendizado Profundo (AP). Por fim, o modelo BERT com redimensionamento do dataset superou o modelo sem redimensionamento em mais de 30% na métrica F1-Score.


MEMBROS DA BANCA:
Presidente - 1226761 - RAIMUNDO SANTOS MOURA
Interno - 1632667 - ANDRE MACEDO SANTANA
Interno - 2061294 - RICARDO DE ANDRADE LIRA RABELO
Interno - 1446435 - VINICIUS PONTE MACHADO
Notícia cadastrada em: 28/09/2022 15:19
SIGAA | Superintendência de Tecnologia da Informação - STI/UFPI - (86) 3215-1124 | © UFRN | jbdocker01.instancia1 07/11/2024 21:10