Considerações finais#

Essa pesquisa possibilitou um profundo mergulho nos dados de jornais digitalizados de dois dos mais importantes acervos de língua portuguesa, preservados nas bibliotecas Nacionais do brasil e de Portugal. A partir da análise desses acervos foi possível gerar visualizações e organizar dados sobre o conjunto de jornais digitalizados e disponibilizados por essas instituições. Esses resultados abrem a possibilidade para o desenvolvimento de inúmeras outras pesquisas e publicações nos próximos anos.

Ao mesmo tempo, foi possível realizar uma análise bastante ampla das características das interfaces gráficas desses acervos, e gerar também subsídios robustos para reflexões acerca dos impactos epistemológicos e metodológicos que tais escolhas e características técnicas podem ter sobre as pesquisas que se utilizam desses acervos.

Todos esses dados estão organizados, documentados, e disponibilizados em formato aberto, multiplataforma. Podem ser acessados, reutilizados, ampliados e criticados. Acredito que isto possa contribuir para a ampliação de pesquisas sobre o tema.

Em outra frente da pesquisa, realizamos uma série de testes e estudos sobre ferramentas de OCR, gerando dados e subsídios para sua implementação e indicações de possíveis caminhos e estratégias de uso, de acordo com as características da pesquisa.

Ao longo de toda a pesquisa, listamos e indicamos lições publicadas no The Programming historian e também criamos tutoriais para ferramentas específicas como gImageReader, OCR-D, Kraken, além de indicar materiais de apoio para ferramentas como Zotero e Tropy.

Outro produto valioso da pesquisa foi a criação de um conjunto de scripts para extração de dados das interfaces gráficas dos acervos, que podem ser utilizados para a criação de novas visualizações e análises. E a criação de ferramenta de apoio metodológico, para criação de relatórios de pesquisa.

Ao final, todos esses dados, resultados, indicações e reflexões foram organizadas de forma didática e concatenada, formando um framework para pesquisas com jornais históricos digitalizados em língua portuguesa. O Hemdig(pt) framework foi então transformado em um livro com o JupyterBook e publicado on-line de forma gratuita sob licença Creative Commons.

Acredito que essa pesquisa, com todos os resultados já existentes e todas as possibilidades abertas com os dados, ferramentas e visualizações, tem grande potencial para o avanço das reflexões epistemológicas no campo da história sobre a relação cada vez mais inescapável entre humanidades e tecnologia.