Entrada e saída para os programas podem vir em uma variedade de formatos, dependendo dos requisitos da aplicação. Os programadores podem utilizar uma representação de baixo nível de dados no byte , que representa os dados como uns e zeros . Se lidar com texto , os programadores podem usar a entrada codificado caracteres. Uma vez que todos os dados é composto de bits e bytes , assim , lidar com bytes em vez de caracteres pode dar aos programadores acesso a uma forma mais "pura" ou transparente de dados para trabalhar. Bytes
Bytes representam uma forma básica de informações do computador. Composta por oito bits , um byte é usado frequentemente para representar uma forma particular de dados. Bytes em si são muitas vezes utilizados como uma base, forma "neutra" de informação que é muito parecido com a informação representada pela linguagem de máquina do computador. Como tal, bytes servir uma variedade de propósitos , dependendo do contexto e da maneira em que são traduzidos .
Personagens
Personagens em linguagens de programação são letras, números e pontuando marcas como espaços e pontuação. Enquanto que são um tipo de dados escalar , o que significa que não pode ser reduzida para um tipo de dados mais fundamental , os caracteres são compostos de uma representação de bit a bit . Cada carácter de um esquema de codificação é composta de pedaços , geralmente um byte . Entrada e saída ( I /O) de caracteres geralmente envolve alguma tradução entre o usuário ea linguagem de máquina subjacente do computador.
Character Encoding
humano diferente idiomas requerem diferentes representações de bytes , a fim de exibir caracteres . Um esquema de codificação simples , ASCII , mapeia uma representação simples de caracteres em um valor de oito bits. Isso cria um máximo de 255 caracteres no esquema de codificação ASCII. ASCII funciona de forma confiável para o idioma Inglês, mas outras linguagens que exigem letras ou caracteres especiais requerem diferentes esquemas de codificação , que requerem grandes valores de bytes ou relacionamentos byte caracteres remapeadas .
Byte I /O e Character I /O
Em termos de codificação de caracteres, as duas variedades de I /O representam diferentes formatos para diferentes usos. Orientada a Byte I /O é mais uso neutro, o que significa que bytes pode conformar-se muitas aplicações diferentes. Muitos designers programa usar byte S córregos /para lidar com as representações não codificados de mídia, como arquivos de texto para fins de criptografia ou de tradução. Character I /O representa bytes que já foram submetidos a codificação , e como tal não pode estar de acordo com aplicações específicas. Um fluxo de caracteres usando a codificação ASCII não pode ler os bytes de um arquivo da mesma forma que um fluxo de caracteres procurando - codificado -32 UTF texto.