Computadores não entendo texto e símbolos de forma nativa. Em vez disso, eles usam uma linguagem de codificação conhecido como Unicode para traduzir algarismos e letras de seu texto e símbolos apropriado , conhecido como um conjunto de caracteres . Os tipos mais comuns de Unicode são UTF-8, UTF-16, ISO-8859 -1 e ASCII. Não é um identificador único para cada letra textual e símbolo em Unicode , que permanece constante em diferentes sistemas operacionais e linguagens de programação. A maioria das linguagens de programação têm built-in funções para converter entre diferentes padrões Unicode. Instruções
1
Traduzir o charset no PHP. Digite " utf8_decode ( $ dados ) ", onde " $ dados " aponta para o código UTF-8. O resultando ISO -8859-1 conjunto de caracteres é mostrada.
2
Traduzir o charset em PERL . Tipo "qw uso Encode ( from_utf8 to_iso88591 );
from_to ( $ data , " utf8 "," iso -8859-1 "); ". Substituir " de -utf8 " com o UTF-8 charset codificado e " to_iso88591 " com o ISO-8859- 1 saída desejado.
3
Traduzir o charset em Python. Digite o seguinte código.
Source_encoding = " UTF-8 "
string = utf8variable
string = string.encode ( source_encoding )
string = unicode ( string, ' iso -8859-1 ')
Substituir " utf8variable " com a variável segurando o UTF-8 charset .