Considerações finais#
Essa pesquisa possibilitou um profundo mergulho nos dados de jornais digitalizados de dois dos mais importantes acervos de língua portuguesa, preservados nas bibliotecas Nacionais do brasil e de Portugal. A partir da análise desses acervos foi possível gerar visualizações e organizar dados sobre o conjunto de jornais digitalizados e disponibilizados por essas instituições. Esses resultados abrem a possibilidade para o desenvolvimento de inúmeras outras pesquisas e publicações nos próximos anos.
Ao mesmo tempo, foi possível realizar uma análise bastante ampla das características das interfaces gráficas desses acervos, e gerar também subsídios robustos para reflexões acerca dos impactos epistemológicos e metodológicos que tais escolhas e características técnicas podem ter sobre as pesquisas que se utilizam desses acervos.
Todos esses dados estão organizados, documentados, e disponibilizados em formato aberto, multiplataforma. Podem ser acessados, reutilizados, ampliados e criticados. Acredito que isto possa contribuir para a ampliação de pesquisas sobre o tema.
Em outra frente da pesquisa, realizamos uma série de testes e estudos sobre ferramentas de OCR, gerando dados e subsídios para sua implementação e indicações de possíveis caminhos e estratégias de uso, de acordo com as características da pesquisa.
Ao longo de toda a pesquisa, listamos e indicamos lições publicadas no The Programming historian e também criamos tutoriais para ferramentas específicas como gImageReader, OCR-D, Kraken, além de indicar materiais de apoio para ferramentas como Zotero e Tropy.
Outro produto valioso da pesquisa foi a criação de um conjunto de scripts para extração de dados das interfaces gráficas dos acervos, que podem ser utilizados para a criação de novas visualizações e análises. E a criação de ferramenta de apoio metodológico, para criação de relatórios de pesquisa.
Ao final, todos esses dados, resultados, indicações e reflexões foram organizadas de forma didática e concatenada, formando um framework para pesquisas com jornais históricos digitalizados em língua portuguesa. O Hemdig(pt) framework foi então transformado em um livro com o JupyterBook e publicado on-line de forma gratuita sob licença Creative Commons.
Acredito que essa pesquisa, com todos os resultados já existentes e todas as possibilidades abertas com os dados, ferramentas e visualizações, tem grande potencial para o avanço das reflexões epistemológicas no campo da história sobre a relação cada vez mais inescapável entre humanidades e tecnologia.