Utilização de Voyant Tools para Compreensão de Documentos Não Estruturados

Autores

  • Eloiza Martins Primo Capeloci
  • Gabriela Alves da Rocha , ,

Resumo

A análise e mineração de dados textuais tem sido importante na interpretação de dados textuais gerados em um cenário cada vez mais informatizado, onde dados são gerados a todo tempo. Estima-se que aproximadamente 2,0 quintilhões de bytes de dados assumem a forma de texto diariamente. A mineração de dados não estruturados representa o processo de extrair informações uteis e conhecimento a partir de uma certa quantidade de dados textuais, constituído por texto em linguagem natural, como por exemplo documentos em formato PDF, emails e postagens em redes sociais. Desde a origem da computação, tanto linguistas quanto especialistas em recuperação da informação têm criado softwares com o intuito de identificar padrões de linguagem que não são identificados em uma leitura convencional. Este estudo aborda a análise de conteúdo textual por meio da utilização da ferramenta web Voyant Tools que explora análise textual e mineração de dados textuais. O objetivo central é explorar como esta ferramenta pode contribuir para a compreensão de documentos não estruturados, que não seguem um padrão definido por conta da sua variedade linguística, contexto e intenção, estilo de escrita e a inclusão de elementos não textuais, como gráficos e tabelas, imagens e vídeos. Para a análise também foram incorporadas algumas técnicas de Processamento de Linguagem Natural (PLN) relevantes para uma análise textual mais precisa e significativa. Dentre as técnicas, destacam-se a remoção das stopwords, contagem de palavras e análise de frequência de cada termo dentro de um corpus textual.

Palavras-chave: Processamento de Linguagem Natural; Análise Textual; Mineração de dados; Dados não Estruturados

 

Downloads

Publicado

25-06-2025