O poder de processamento dos computadores permite aos pesquisadores e empresas para analisar os dados de forma mais complexa do que cada antes. A mineração de dados é o processo de tentar encontrar informações úteis em grandes conjuntos de dados. Processo de ETL de mineração de dados refere-se os passos pelos quais os dados são gravados, codificados e gravados em um banco de dados para análise posterior. Definições
mineração de dados é definida como o processo de análise dos dados e agregando -os em informações que podem ser colocados em uma fins úteis. O processo de mineração de dados envolve encontrar padrões em conjuntos de dados que fornecem informações categórico sobre como o conjunto de dados está organizado. A mineração de dados pode ser usado para analisar a relação entre quase qualquer variáveis mensuráveis ; algumas aplicações do mundo real de mineração de dados incluem a análise de estratégias de marketing , processos de produção e tendências de comportamento humanos. O termo ETL é um acrônimo para extração, transformação e carga. Extrair, transformar e carregar referem-se aos três processos pelos quais um sistema de banco de dados é criado para análise.
Extração
O primeiro passo na criação de um armazém de dados que pode ser extraído para análise é extrair os dados de sua fonte original . Procedimentos de extracção variar dependendo do tipo de dados que está a ser extraído . Às vezes a extracção envolve a localização e recuperação de um subconjunto de dados a partir de uma ou mais bases de dados existentes . Em outros casos, o processo de extração requer pesquisa original , como pesquisar na Web para sites que contêm informações relevantes.
Transform
dados Quando apropriado é localizado durante o processo de extracção , em seguida, os dados devem ser manipulados de modo que ela pode ser armazenada numa base de dados para análise posterior . O processo de alterar os dados a partir da sua forma original numa forma regularizado é chamado de transformação . Transformação pode envolver qualquer número de alterações aos dados , incluindo funções relativamente simples, tais como a conversão de letras para minúsculas e remover sinais de pontuação a partir de cadeias de caracteres. O processo de transformação pode também incluir procedimentos mais complexos , como a realização de funções aritméticas em valores de origem , classificação de dados e verificar a validade dos dados de origem. O objetivo da fase de transformação é para pegar os dados de extração não refinados e transformá-lo em dados que é útil para os objetivos do projeto de mineração de dados.
Carga
Uma vez os dados são transformados para o formato adequado , que deve ser armazenada num armazém de dados . A fase de carga refere-se ao processo pelo qual os dados transformados é registrado para um banco de dados de computador. Uma vez que as informações são armazenadas no banco de dados , ele pode ser submetido a análise qualitativa e quantitativa para procurar padrões de interesse .