Unicode Transformation Format ( UTF-8) é um formato de codificação de caracteres que utiliza blocos de oito bits para representar um personagem, e é amplamente utilizado em sistemas de computador. Ele inclui a mesma codificação de texto simples compacto como o formato ASCII , mas também permite a codificação de caracteres especiais . Isto dá-lhe uma funcionalidade adicional , mas representa um desafio quando usado em código de programa . As versões posteriores do navio Perl com módulos de codificação e uma função binmode que permitem que a linguagem de programação para lidar com a codificação e decodificação de arquivos UTF-8 . Entrada e de saída para /a partir de um programa Perl pode ser feito para lidar com UTF - 8 caracteres por meio da utilização de um interruptor na linha de comando . Coisas que você precisa
ActiveState Perl
Perl editor
Show Mais instruções
1
Inicie o editor de Perl para iniciar a codificação do programa Perl. Você pode usar um editor de texto simples, como o Bloco de Notas no Windows ou o editor vi em UNIX . Você terá que salvar o arquivo com uma extensão pl . Modo que o sistema será capaz de reconhecê-lo como um programa Perl.
2
Coloque um imperativo de exigir que o módulo " Encode " no topo do programa Perl. Você será capaz de usar as funções de codificação e decodificação no corpo do Programa Perl para codificar /decodificar dados para /de formato UTF-8, conforme necessário. Digite o seguinte no editor de Perl para usar este método :
# /usr /bin /Encode perlrequire ; Alternativamente, você pode chamar o módulo Encode , como segue: uso Encode , para codificar os dados , você deve digitar o seguinte no corpo de seu programa: $ output = Encode :: encode ( " utf8 ", $ string);
3
Especifique o formato de codificação UTF-8 quando você abre um arquivo . Você pode fazer isso digitando um dos seguintes formatos para o editor :
aberto FILE, " <: codificação ( iso-8859- 7) ", $ inputfile ;
abrir fILE, ". <: utf8 ", $ inputfile ;
Isto irá dizer Perl para codificar o arquivo no formato UTF-8, ou para se preparar para codificação UTF-8
4
Especifique o " binmode " ao ler ou escrever arquivos, para garantir que os arquivos são codificados no formato UTF-8.
para definir o binmode para UTF-8 ao ler um arquivo, digite o seguinte para o editor : $ filename = " arquivo.txt "; $ inputfile = IO :: File- > new ($ filename , 'r' ); binmode ( $ inputfile , ': utf8 ');
para definir o binmode para UTF-8 quando se escreve para um arquivo, digite o seguinte no editor : $ filename = " arquivo.txt "; aberto (OUT , "> $ filename "); binmode (OUT " ; : utf8 ");
Você também pode usar binmode para definir o formato de entrada padrão e saída para UTF-8 , como segue: binmode ( STDIN , " : utf8 '); binmode ( STDOUT , ': utf8 ');