8.1 pyHDB - Coleta de metadados e acervos da HDB#
Para coletar dados da HDB, recomenda-se o uso do pyHDB, uma ferramenta escrita em Python que permite buscar e baixar dados da HDB.
Para uma explicação detalhada de seu uso, indicamos a leitura da documentação disponível em ericbrasiln.github.io/pyHDB e do artigo BRASIL, E. pyHDB - Ferramenta Heurística para a Hemeroteca Digital Brasileira: utilizando técnicas de web scraping para a pesquisa em História. História da Historiografia: International Journal of Theory and History of Historiography, Ouro Preto, v. 15, n. 40, p. 186–217, 2022.
A ferramenta coleta os metadados das buscas e faz download das imagens das páginas com ocorrências dos termos pesquisados (quando permitido pelos direitos autorais).
Abaixo um exemplo de planilha gerada pelo pyHDB: