Dados de entrada de origem (SID) são os dados que você deseja usar como entrada para seu modelo. Pode ser qualquer tipo de dados, incluindo:
*
Dados estruturados: Esse tipo de dados é armazenado em um formato estruturado, como planilha ou banco de dados.
*
Dados não estruturados: Este tipo de dados não é armazenado em formato estruturado, como texto ou imagens.
O SID pode vir de uma variedade de fontes, incluindo:
*
Dados internos: Esses dados são gerados dentro de sua organização e normalmente armazenados em um banco de dados ou sistema de planejamento de recursos empresariais (ERP).
*
Dados externos: Esses dados são gerados fora da sua organização e podem ser encontrados na web, nas redes sociais ou em bancos de dados governamentais.
A qualidade do seu SID é fundamental para o sucesso do seu modelo. Dados ruins levarão a resultados ruins. Portanto, é importante reservar um tempo para limpar e preparar seu SID antes de usá-lo para modelagem.
Aqui estão algumas dicas para preparar seu SID:
*
Limpe seus dados: Isso envolve a remoção de quaisquer dados duplicados ou incorretos.
*
Padronize seus dados: Isso envolve a conversão de todos os seus dados em um formato consistente.
*
Enriqueça seus dados: Isso envolve adicionar dados adicionais ao seu SID, como informações demográficas ou dados meteorológicos.
Depois de preparar seu SID, você poderá começar a usá-lo para construir seu modelo.