sábado, 29 de janeiro de 2011

MIneração de textos

Capítulo II

Mineração de Textos

A mineração de texto possui 5 etapas:

I - Coleção
II - Conversão
III - Extração
IV - Análise
V - Visualização

Na visão de Araujo Junior (p. 55)

Mineração de Textos pode ser "conceituado como um meio de encontrar padrões interessantes ou úteis em um contexto de informações textuais não estruturadas, combinando alguma tecnologia de extração e de recuperação da informaçãoa, processos de linguagem naturala e de sumarização/indexação de documentos".

A utilização da mineração de textos possibilita o estabelecimento de ligações e compartilhamento do conhecimento entre as pessoas e as organizações.
5 passos da Mineração de Texto:
  • Seleção de dados;
  • Extração de termos e filtragem;
  • Agrupamento de dados;
  • Mapeamento dos agrupamentos ou visualização; e
  • Resultado e interpretação.

Etapas básicas de um processo de mineração de textos:

  • Definição de objetivos;
  • Seleção de um subconjunto de dados;
  • Pré-processamento ou limpeza dos dados, removendo ruídos e preparando dados;
  • Redução ou projeção dos dados
  • Escolha da técnica, método ou tarefa de mineração;
  • Mineração dos textos;
  • Interpretação dos resultados, podendo caso necessário, retornar aos passos anteriores do processo;
  • Consolidação do conhecimento descoberto.

A mineração de dados é diferente da mineração de textos, Araújo Junior estabelece a seguinte definição para o conceito de mineração de dados:

"processo de descoberta de novas correlações, padrões e tendências significativas por meio da análise minuciosa de grandes conjuntos de dados estocados" (p. 58)

Um comentário: