8.1 pyHDB - Coleta de metadados e acervos da HDB#

../../_images/pyhdb-banner.png

Fig. 21 Logo da pyHDB, Ferramenta heurística para a Hemeroteca Digital Brasileira#

Para coletar dados da HDB, recomenda-se o uso do pyHDB, uma ferramenta escrita em Python que permite buscar e baixar dados da HDB.

Para uma explicação detalhada de seu uso, indicamos a leitura da documentação disponível em ericbrasiln.github.io/pyHDB e do artigo BRASIL, E. pyHDB - Ferramenta Heurística para a Hemeroteca Digital Brasileira: utilizando técnicas de web scraping para a pesquisa em História. História da Historiografia: International Journal of Theory and History of Historiography, Ouro Preto, v. 15, n. 40, p. 186–217, 2022.

A ferramenta coleta os metadados das buscas e faz download das imagens das páginas com ocorrências dos termos pesquisados (quando permitido pelos direitos autorais).

Abaixo um exemplo de planilha gerada pelo pyHDB:

../../_images/ex_pyhdb.png

Fig. 22 Exemplo de planilha gerada pelo pyHDB#