O tipo de compressão que substitui os caracteres especiais para repetir padrões é chamado de codificação
run-comprimento (rle) .
Aqui está como funciona:
*
Identifique sequências de repetição: O RLE digitaliza os dados que procuram ocorrências consecutivas do mesmo caráter (ou padrão).
*
Substitua por um código: A sequência repetida é então substituída por um código que contém:
* O próprio personagem.
* O número de vezes que ele se repete.
Exemplo: Texto original:"AAABBBBCCCDDDE"
Texto codificado RLE:"3a3b4c3d1e"
Vantagens do RLE: * Simples de implementar.
* Eficaz para dados com muitos padrões de repetição, como imagens, transmissões de fax ou arquivos de texto.
Desvantagens de RLE: * Não é muito eficiente para dados com poucas repetições.
* Pode realmente aumentar o tamanho dos dados com muita aleatoriedade.
Outras técnicas de compactação em que você pode estar interessado: *
Codificação de Huffman: Usa códigos de comprimento variável com base na frequência dos caracteres.
*
algoritmos Lempel-Ziv (LZ): Encontra padrões de repetição e os substitui por códigos mais curtos, geralmente usando um dicionário.
*
codificação aritmética: Representa os dados como uma única fração, usando probabilidades para alcançar taxas de compressão mais altas.