A técnica de compactação de texto que substitui as palavras usadas com frequência por um único caractere é chamado
substituição .
Aqui está como funciona:
1.
Identifique palavras frequentes: O algoritmo analisa o texto e identifica palavras que aparecem com mais frequência.
2.
Atribuir caracteres únicos: Cada palavra frequente recebe um caractere único exclusivo (geralmente não parte do alfabeto original).
3.
Substitua as palavras: O texto original é então digitalizado e cada palavra frequente é substituída por seu caractere único atribuído.
4.
Armazene o mapeamento: O mapeamento de caracteres para as palavras é armazenado separadamente, para que possa ser usado para descomprimir o texto posteriormente.
Exemplo: Digamos que as palavras frequentes em um texto sejam "the", "e" "é" e "para".
*
mapeamento: * "the" -> 'a'
* "e" -> 'b'
* "Is" -> 'C'
* "para" -> 'd'
*
Texto compactado: "Este é um ótimo dia B, ele está ensolarado para fora."
Nota: Essa técnica é simples, mas muitas vezes não é muito eficiente para comprimir grandes quantidades de texto. Pode ser mais eficaz quando combinado com outras técnicas, como a codificação de comprimento de corrida.