Ao trabalhar com Strings que contêm caracteres de vários bytes , é necessário o uso de funções que suportam caracteres de vários bytes e para carregar um conjunto de caracteres apropriado para exibi-los . Codificações multibyte , como UTF-8, são úteis quando você precisa para armazenar caracteres em idiomas diferentes do inglês , tais como japonês e chinês , que o conjunto de caracteres padrão não suporta. O Java String e Classes de caracteres podem conter caracteres de vários bytes , mas não há nenhuma função built-in simples de informá-lo se eles fazem ou não. Para detectar caracteres de vários bytes , você tem um loop manualmente através de cada caractere na string e verificar se quaisquer caracteres conter mais do que um único byte. Instruções
1
Abra o arquivo Java com um editor como o Netbeans , Eclipse ou JBuilder X.
2
Declare as variáveis necessárias para detectar caracteres de vários bytes , adicionando o seguinte código no topo de sua função: resultado
boolean; ;
char [ ] c_array ;
Cordas C_STRING ;
byte [] c_byte_array
string str ;
3
Inicializar a variável " str ", com um valor de texto , adicionando o seguinte código na sua função :
str = "text string de amostra ";
4
loop através de cada personagem e verificar se é multibyte , adicionando o seguinte código na sua função :
c_array = str.toCharArray ();
resultado = false;
para (char c: c_array )
{
C_STRING = Character.toString ( c);
c_byte_array = c_string.getBytes ( " UTF-8 ");
if ( c_byte_array.length > 1) {
System.out.println (" detectado um caractere de vários bytes . " ) ;
resultado = true;
break;
}
}
if ( resultado !)
System.out.println (" não detectar quaisquer caracteres de vários bytes . ");
O loop converte cada caractere em uma String . Em seguida, converte a string em um array de bytes . Finalmente , ele verifica o comprimento da matriz de byte . A duração superior a um indica um caractere multibyte presente na cadeia.
5
Salve o arquivo Java, compilar e executar o programa para procurar uma seqüência de caracteres para caracteres de vários bytes .
< Br >