Não há resposta única para isso, pois depende de vários fatores:
*
O formato do texto: Um arquivo de texto simples (como `.txt`) será muito menor que um arquivo formatado (como` .doc`, `.docx`,` .pdf` ou um epub). Arquivos formatados incluem dados extras para itens como estilos de fonte, imagens, quebras de página, etc.
*
A codificação: A codificação do caractere (por exemplo, ASCII, UTF-8, UTF-16) afeta o número de bytes por caractere. O UTF-8 é uma codificação de comprimento de variável, o que significa que alguns personagens obtêm mais bytes do que outros.
*
O livro específico: Diferentes edições do mesmo livro podem ter comprimentos ligeiramente diferentes.
Vamos fazer algumas suposições razoáveis:
*
Comprimento: Um livro de Harry Potter tem cerca de 300.000 palavras.
*
Personagens por palavra: Vamos assumir uma média de 5 caracteres por palavra (incluindo espaços).
*
bytes por caractere: Usando o UTF-8, assumiremos uma média de 1 byte por caractere (essa é uma simplificação; alguns caracteres exigem mais).
Cálculo: 1.
caracteres totais: 300.000 palavras * 5 caracteres/palavra =1.500.000 caracteres
2.
bytes totais (texto simples): 1.500.000 caracteres * 1 byte/caractere =1.500.000 bytes (aproximadamente 1,5 MB)
No entanto, essa é uma estimativa * muito * baixa. Um e -book formatado (EPUB, por exemplo) ou um PDF digitalizado de um livro impresso serão significativamente maiores devido à inclusão de informações de formatação, imagens (ilustrações) e fontes potencialmente incorporadas. Um PDF pode ser facilmente 5-10 MB ou ainda mais, enquanto um EPUB pode estar em torno de 2-5 MB.
Portanto, uma estimativa razoável para um livro de Harry Potter em um formato digital comum estaria
entre 2 e 10 Mb .