12. A) OCR com CLI#
Caso sua pesquisa demande o tratamento e análise de milhares de páginas digitalizadas de jornais históricos, o encaminhamento mais acertado é a utilização de interfaces de linha de comando que reúnam múltiplas ferramentas de tratamento e processamento de imagens, reconhecimento de layouts e caracteres.
Elas permitem a criação de workflows para automatizar o tratamento de imagens em massa e gerar datasets em formatos variados. Ao mesmo tempo, demandam alto investimento de tempo nessa elaboração.
Nessa pesquisa, testamos e apresentamos o OCR-D, na seção 12.1 e o Kraken, na seção 12.2.
Em função do tempo e dos objetivos da pesquisa, realizamos os testes com modelos pré-existentes.
Nos tópicos seguintes, veremos a instalação, uso e avaliação dos resultados de cada uma delas.