Professor do Cefet-MG cria sistema para verificar credibilidade de textos digitais
Quantas vezes você fez uma pesquisa na internet e se deparou com volume de resultados diferentes tão grande que ficou em dúvida sobre quais eram, ou não, verídicos? Para ajudar a verificar a credibilidade de matérias disponíveis na rede, o professor do departamento de computação do Centro Federal de Educação Tecnológica de Minas Gerais (Cefet-MG) Daniel Hasan desenvolveu um sistema que avalia a qualidade e a confiabilidade de um texto on-line.
O projeto – parte da tese de doutorado de Hasan, apresentada na Universidade Federal de Minas Gerais (UFMG) – tem como objetivo avaliar a qualidade de documentos ou itens colaborativos da web, como a Wikipédia e fóruns de perguntas e respostas, utilizando inteligência artificial. A partir de indícios do próprio texto e da interação dos usuários, o sistema memoriza aspectos importantes para usá-los em outras avaliações de forma automática.
“Sendo fórum de perguntas e respostas, geralmente temos uma nota para cada resposta. O sistema tenta aprender com essa nota e com alguns indicadores de qualidade, por exemplo, se esse texto tem erros ortográficos, é grande ou pequeno, mostra referência para outros conteúdos. Tem comunidades que avaliam manualmente os conteúdos. Eu peguei essa avaliação manual e usei como base para o sistema de inteligência artificial”, explica.
De acordo com Daniel, no caso de artigos da Wikipédia, o sistema é capaz de identificar quantas vezes o texto foi editado e se quem alterou tem histórico de edições no mesmo assunto. “Se o artigo foi editado por usuários mais frequentes na Wikipédia, aumenta a confiabilidade e qualidade de um site”, enfatiza.
O sistema proposto, que está em fase de teste, utiliza 67 indicadores para submeter publicações em plataformas colaborativas a fim de verificar os textos. A intenção é que, futuramente, esteja disponível para uso público. Daniel Hasan espera que a tecnologia ajude a melhorar a qualidade da lista de páginas em buscadores da internet.
“O próximo passo é tentar pegar esses indicadores de qualidade e disponibilizar on-line para outros pesquisadores. Às vezes, a pessoa quer usar para fazer um outro estudo ou criar estatísticas sobre a escrita”, comenta. O estudo de Daniel conquistou o prêmio de melhor tese de doutorado no Concurso de Teses e Dissertações em Banco de Dados do Simpósio Brasileiro de Banco de Dados (SBBD 2017).
Atualmente, o professor coordena um projeto de iniciação científica, financiado pelo Cefet e pelo Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq), que dá continuidade ao tema. Daniel realiza pesquisas nas áreas de banco de dados e recuperação de informação e tem experiência em docência nas disciplinas de algoritmos, recuperação de informação e pesquisa operacional.
Assessoria de Comunicação Social