Na computação, um data warehouse é um repositório central de dados integrados de uma ou mais fontes díspares. Ele foi projetado para processamento analítico, apoiando atividades de inteligência de negócios (BI), como relatórios, análise e mineração de dados. Ao contrário de um banco de dados operacional típico (como os usados para processamento de transações), um data warehouse se concentra no fornecimento de dados históricos para a tomada de decisão estratégica, em vez de apoiar operações diárias.
Principais características de um data warehouse:
*
Orientado pelo sujeito: Os dados são organizados em torno de assuntos de negócios específicos (por exemplo, clientes, produtos, vendas) em vez de processos operacionais.
*
integrado: Os dados de diferentes fontes são consolidados e padronizados para garantir a consistência. Isso geralmente envolve a resolução de inconsistências nos formatos de dados e nas convenções de nomeação.
*
Time-variant: Os dados são armazenados historicamente, permitindo a análise de tendências ao longo do tempo. Isso inclui a captura de dados em vários momentos no tempo.
*
não volátil: Os dados em um data warehouse são normalmente somente leitura. As atualizações são feitas por meio de processos ETL (Extrair, Transformar, Carregar), em vez de modificações diretas.
Em essência, um data warehouse fornece uma visão única e consistente dos dados comerciais, facilitando para os analistas e tomadores de decisão entender tendências, padrões e desempenho. Isso contrasta com os bancos de dados operacionais que são otimizados para velocidade e eficiência das transações.