Um conjunto de dados limitado, conforme definido em regulamentos como o HIPAA nos EUA ou o GDPR na Europa, permite apenas dados que foram desidentificados para um determinado nível. Isso significa que as informações identificando diretamente um indivíduo foram removidas ou alteradas. No entanto, as especificidades do que é permitido dependem fortemente dos regulamentos aplicáveis e do contexto específico (por exemplo, pesquisa, análise de negócios). Geralmente, um conjunto de dados limitado pode incluir:
potencialmente permitido (com salvaguardas apropriadas e dependendo do contexto): *
Dados agregados: Dados combinados de vários indivíduos, impedindo a identificação de qualquer pessoa (por exemplo, idade média de pacientes com uma determinada condição).
*
Dados de identificação com identificadores limitados: Dados em que alguns identificadores são mantidos, mas sua ligação a um indivíduo específico é extremamente difícil. Esta é uma área cinzenta e requer consideração cuidadosa. Exemplos podem incluir:
*
datas (mas geralmente limitadas, por exemplo, apenas ano, não data exata): O ano de nascimento pode ser aceitável, mas não uma data de nascimento.
*
Informações geográficas (amplamente definidas): O estado de residência pode ser permitido, o código postal provavelmente não.
*
faixa etária (ampla faixa): "65-74 anos" em vez de "68 anos".
*
dados pseudonimizados: Dados em que identificadores são substituídos por pseudônimos. Geralmente, é mantida uma chave para identificar os indivíduos novamente, mas essa chave é mantida com segurança e o acesso é restrito.
*
dados derivados de outros dados: Informações derivadas estatisticamente dos dados originais, mas não identificam diretamente indivíduos (por exemplo, correlações entre variáveis).
geralmente não é permitido: *
Identificadores diretos: Essas são coisas que identificam diretamente um indivíduo, como:
* Nome completo
* Número da Segurança Social
* Número do registro médico
* Dados precisos de geolocalização
* Endereço de email
* Número de telefone
* Endereço IP (a menos que fortemente anonimizado)
* Identificadores biométricos (impressões digitais, varreduras faciais)
*
quase-identificadores: Informações que, quando combinadas com outras informações, poderiam ser usadas para identificar um indivíduo. Embora individualmente inócuo, uma combinação pode ser um risco (por exemplo, idade, sexo, código postal, condição específica). O risco é avaliado com base no potencial de re-identificação.
Considerações importantes: * Risco de re-identificação: O aspecto mais crucial é o potencial para re-identificar indivíduos dos dados. Os regulamentos geralmente exigem avaliações desse risco.
*
Fatores contextuais: O nível aceitável de desidentificação pode variar com o objetivo do uso de dados e dos regulamentos aplicáveis. A pesquisa pode permitir padrões mais relaxados do que a análise de marketing.
*
Minimização de dados: Somente os dados necessários devem ser incluídos no conjunto de dados limitado.
*
Segurança de dados: Medidas de segurança robustas são essenciais para proteger conjuntos de dados limitados do acesso não autorizado.
É crucial consultar orientações legais e regulatórias relevantes para requisitos específicos antes de criar e usar um conjunto de dados limitado. A má interpretação pode levar a questões legais e éticas significativas.