bibliotecas de reconhecimento de caracteres ópticos Tesseract oferecer aos desenvolvedores um método para escanear documentos e texto a uma imagem. Você usa as bibliotecas Tesseract para armazenar imagens de documentos que você não precisa mais em papel. Você usa bibliotecas Tesseract em Java por um loop através de cada personagem e escrever o personagem para um arquivo. Para usar as bibliotecas , você deve incluir o namespace Java para as funções de OCR. Instruções
1
direito do mouse no arquivo Java que você deseja usar para criar o documento OCR . Clique em " Abrir com" e selecione o seu editor Java preferido.
2
Adicione o namespace biblioteca OCR , na parte superior do arquivo. Copie e cole o seguinte código ao seu arquivo de código fonte :
com.tplan.robot.imagecomparison.tesseractocr
3
Criar o código que verifica caracteres para o arquivo . Por exemplo, o código a seguir percorre cada caractere em um arquivo e escreve-o em um arquivo de imagem :
linhas Var = método 0Compareto = cmparea " tocr " = " x: 33, y: 2 , w : 200, h: 22 " for ( i = 1; {i} < { linhas } 1 ; i = {i} 1 ) { Typeline " { _TOCR_LINE {i} } "}
< br > 4
Clique no botão " Salvar" do editor Java e clique em " Executar" para executar o código em um depurador Java.