limpeza de dados é o processo de fixação de dados e remoção de dados desnecessários , a fim de otimizar as operações Datawarehousing diárias. Datawarehousing é o armazenamento de dados em um repositório central para que qualquer pessoa em uma organização pode acessá-lo. Para Datawarehousing para ser bem sucedido , as informações do banco de dados devem ser precisos . No entanto , dada a grande quantidade de dados que as empresas se trabalhar, estes dados não podem sempre ser corrigida manualmente . Portanto, é necessária a limpeza de dados automatizada. Disponibilidade
limpeza de dados deve tornar os dados mais relevantes rapidamente acessível para aqueles que estão procurando por ele . Tempo perdido à procura através de informações irrelevantes pode perder tempo para os funcionários e os recursos da empresa de resíduos. A informação que é redundante pode desperdiçar espaço de armazenamento da empresa.
Integridade
limpeza de dados não deve excluir ou alterar dados para onde os dados se torna impreciso. Dados imprecisos podem levar as empresas a cometer erros como o envio de um projeto de lei para o endereço errado , o que pode irritar os clientes e desperdiçar dinheiro. Os dados também deve ser atualizado ao longo dos bancos de dados. Se um cliente atualiza um endereço de cobrança , esta atualização deve ser distribuído aos bancos de dados em todos os departamentos relevantes.
Organizadora
limpeza de dados deve levar os dados relevantes de diferentes fontes e mover automaticamente os dados para locais apropriados de modo a que os dados podem ser facilmente encontrados , quando necessário . Isso elimina a necessidade de criar novos dados quando os dados já existe.
Correção de erros
erros e inconsistências , tais como um nome digitado incorretamente , deve ser localizada e corrigida pelos dados limpeza processos . Erros devem ser corrigidos , especialmente em programação de software de computador, uma vez que tais erros podem causar sistemas de computador não funcione corretamente .
Automação
ferramentas de limpeza de dados deve minimizar a quantidade de Manual de entrada que é necessária . Em outras palavras , os administradores de banco de dados não deve ter que iniciar continuamente os processos em si, mas esses processos devem ocorrer automaticamente. Também deve haver esforço mínimo de programação necessário. Os programadores não deveriam ter que codificar sempre que uma ação de rotina é realizado.
Simplicidade
ferramentas de limpeza de dados devem simplificar as informações sempre que possível. Resíduos de dados complicados recursos da empresa e também obriga os funcionários a passar mais tempo à procura de determinadas informações.
Análise
análise pós- processo é o exame manual de dados depois que os dados foi purificado. Não importa o quão eficaz os processos de limpeza de dados são , inevitáveis erros podem ocorrer. Os administradores de banco de dados ainda precisa verificar regularmente os dados manualmente , a fim de garantir que os dados são precisos . Ferramentas de limpeza de dados deve permitir que os administradores de visualizar os dados em um formato facilmente compreensível para que correções podem ser feitas rapidamente.
Eficiência
limpeza de dados pode ser demorado e caro. Tudo o que pode acelerar ao longo do processo de limpeza de dados ou reduzir os custos associados à limpeza de dados é necessária , a fim de maximizar a lucratividade da empresa.