:: Abordagem Cortex Intelligence

Cinco Passos até o Text Mining

O processo de text mining da Cortex Intelligence é composto por cinco etapas que foram minuciosamente elaboradas de forma a obter os melhores resultados frente aos desafios mais frequentes encontrados no mercado de tratamento de textos. O diagrama a seguir mostra como estas etapas são encadeadas:

O primeiro passo (1) é a coleta de informações e, para isso, os robôs da Cortex Intelligence navegam em qualquer ambiente para captar informações não-estruturadas, seja na Internet ou em bases de dados internas nas empresas.

A etapa seguinte (2) consiste no pré-processamento dos textos coletados. Agentes inteligentes processam o texto de modo a extrair e identificar entidades, adicionando meta dados aos documentos e enriquecendo a base de informações.

Ainda nesta segunda etapa, estas entidades são ligadas entre si através de relacionamentos semânticos obedecendo uma ontologia de conhecimento segundo padrões da Web Semântica (Web 3.0).

Esses fatores garantem ao processo uma confiabilidade e qualidade superiores a qualquer abordagem baseada em palavras-chaves ou em métodos puramente estatísticos. O resultado foi comprovado por estudos acadêmicos da Cortex Intelligence em busca da melhor abordagem para estruturação de textos.

O texto estruturado segue para etapa de indexação (3), indispensável para o tratamento de grandes volumes de dados. Finalmente, a mineração (4) propriamente dita aplica métodos estatísticos de alta dimensionalidade para cada funcionalidade específica demandada pelo cliente.

Por fim, temos a participação do usuário, ficando a seu critério efetuar interpretações dos resultados obtidos, gerar relatórios ou acionar novas minerações.

Processo Diferenciado, Melhores Resultados

A abordagem Cortex Intelligence difere dos processos comumente utilizados pois emprega especial atenção à etapa de pré-processamento de textos.

Em geral, sistemas de mineração de textos costumam fazer um pré-processamento simplista que normalmente compromete os resultados das etapas subseqüentes. A Cortex Intelligence, no entanto, coloca uma maior ênfase no conteúdo dos textos pois, como citado anteriormente, usa uma abordagem multidisciplinar.

Outro fator de diferenciação é a utilização de métodos de Dynamic Learning: o aprimoramento do sistema é contínuo, pois o algoritmo acumula o conhecimento obtido em processamentos anteriores.

Uma Abordagem Inteligente

A Cortex Intelligence entende que o text mining deve, além de buscar rapidamente os textos mais relevantes sobre um determinado tema, ajudar na árdua tarefa de análise destes textos. Isso somente seria possível agregando inteligência ao processo.

A inteligência de text mining da Cortex é derivada da essência dos estudos de Inteligência Artificial – a emulação de Reasoning.