13. B) OCR com GUI#

Caso sua pesquisa demande o tratamento e análise de centenas de páginas digitalizadas de jornais históricos, o encaminhamento mais acertado é a utilização de interfaces gráficas de usuário (GUIs).

Tais interfaces exigem menos conhecimento de programação, menor tempo de aprendizagem e resultados mais rápidos.

Existem atualmente muitos programas proprietários que realizam OCR em alta qualidade. Entretanto, buscando a valorização e a defesa política de uma ciência aberta, optamos aqui por apresentar uma ferramenta de código aberto: o gImageReader. Ela utiliza como motor de OCR o Tesseract, que também é de código aberto, e foi utilizado, por exemplo, no OCR-D na estratégia A desse framework.

No tópico seguinte, veremos a instalação, uso e avaliação dos resultados obtidos com a aplicação do gImageReader sobre os mesmos exemplo utilizados anteriormente na abordagem A.