Escolar Documentos
Profissional Documentos
Cultura Documentos
Todos os arquivos que voc necessita para usar o tesseract esto nesse arquivo ZIP. A nica coisa que no vem mesmo a PIL que j foi discutida.
Eu precisei alterar uma coisinha no arquivo pytesser.py, pois eu estava tendo problemas com caminho, quando chamava de outra pasta. A alterao pequena, veja abaixo o arquivo original:
Essa linha 14 eu comentei, importei o mdulo os e logo acima da linha que comentei fiz: tesseract_exe_name = os.path.abspath(os.path.dirname(__file__) + '/tesseract.exe' ) O novo arquivo ficou:
Agora iremos testar a classe PyTesser. Para testar, coloquei no mesmo diretrio uma pasta chamada tesseract que onde iro ficar os arquivos que estavam dentro do ZIP pytesser que foi feito o download. Criei tambm uma pasta chamada imagens e um arquivo chamado teste_ocr.py. Dentro da pasta imagens coloquei uma imagem chamada teste.png, veja:
Esse arquivo, basta obter uma instncia de OCR e executar passando o diretrio da imagem. Depois disso basta obter o texto da imagem atravs da funo getTexto(). Por ltimo, temos o arquivo teste_ocr.py, o cdigo segue abaixo:
Veja que na linha 1 foi importado de tesseract (eu havia criado uma pasta tesseract) o mdulo ocr (eu criei um arquivo chamado ocr.py e coloquei dentro da pasta tesseract). Linha 4: obtive uma instncia de OCR(). Linha 5: chamei a funo executar() passando o diretrio da imagem. A imagem teste.png est na pasta imagens. Linha 6: utilizei a funo print() para exibir os dados retornados da funo getTexto().