Um Estudo Comparativo entre Abordagens baseadas em Sistemas Fuzzy e Redes Neurais Artificiais para Estimar a Importância de Comentários Web
Processamento de Linguagem Natural. Mineração de Opinião. Sistemas Fuzzy, Redes Neurais Artificiais. Grau de Importância.
A evolução do e-commerce e das Redes Sociais Online tornaram significativo o crescimento da Web e como consequência, as informações disponíveis aumentam bastante a cada dia, tornando a tarefa de analisar comentários, de forma manual, praticamente impossível para o processo de tomada de decisão. Conhecer a opinião de outros consumidores é de suma importância para este fim. Devido ao volume de informações, a criação de métodos automáticos de extração de conhecimento e mineração de dados tornou-se necessário. Avaliação da opinião é um ponto forte tratado por pesquisadores de Processamento de Linguagem Natural (PLN) no âmbito da Análise de Sentimentos ou Mineração de Opinião. Um dos tópicos que se pode focar é na definição de quais comentários são mais importantes para o consumidor ler e tomar uma decisão. Sousa (2015) propôs uma abordagem para estimar o grau de importância de comentários sobre produtos e serviços utilizando Sistemas Fuzzy, reportando bons resultados. O objetivo central desta qualificação é apresentar um estudo comparativo entre a proposta utilizando Sistema Fuzzy e uma abordagem usando Redes Neurais Artificiais (RNA). A primeira parte do trabalho foi a adaptação das variáveis de entrada definidas na abordagem base: quantidade de tuplas e riqueza do vocabulário. Para a realização dessas adaptações foi utilizado o conceito de ontologia, limitando o domínio de aplicação. Além disso, as adaptações objetivaram a melhoria dos resultados obtidos pelo Sistema Fuzzy e da RNA proposta. Posteriormente, a base de regras e as funções de pertinência foram exaustivamente ajustadas a fim de retornar bons resultados. Experimentos realizados no domínio de hotéis mostraram melhora na detecção dos comentários considerados mais importantes na avaliação manual, incrementando em aproximadamente 30% na detecção dos mais importantes de polaridade positiva e 25% nos de polaridade negativa. Na segunda parte do trabalho serão de fato comparadas as abordagens, a partir da definição, treinamento e teste da RNA para verificar qual delas é mais apropriada para resolver o problema de estimar o grau de importância dos comentários.