Oficina 2 - Prof Eric Brasil
quarta-feira, 17 de setembro de 2025
Eu, robô?
Link: https://instaloader.github.io/
Pré-requisitos
Ao fazer login, o Instaloader mantém uma sessão local (cache) para evitar repetir autenticação.
--load-cookies do Instaloader (carrega cookies do Firefox):--reels → inclui Reels.--comments → baixa comentários.:stories → baixa stories (quando disponíveis).--fast-update → baixa somente itens novos (mais rápido/incremental).yt-dlpFerramenta poderosa para baixar vídeos e metadados de várias plataformas, inclusive o YouTube.
(Pode ser usada para playlists, canais inteiros ou apenas 1 vídeo).
--format bestvideo+bestaudio → pega melhor qualidade disponível.--skip-download → baixa só metadados.--write-comments → baixa comentários (quando suportado).--playlist-items 1,3,5 → escolhe vídeos específicos de uma lista.ferramentas_scielo_v2 → coleta artigos e metadados do SciELO.resumos_anpuh_cli → coleta de resumos de simpósios temáticos da ANPUH.pyHDB → raspagem estruturada da Hemeroteca Digital Brasileira.ferramentas_scielo_v2Ferramenta desenvolvida pelo LABHDUFBA para raspagem sistemática dos periódicos da SciELO.
Permite coletar artigos por área de conhecimento ou por revista(s) específicas.
O programa exibirá as áreas disponíveis.
Digite o número desejado (ex.: 5 para Ciências Humanas) e escolha:
Agora é possível filtrar a coleta por ano mínimo de publicação.
Durante a execução, o script perguntará:
-=- Definição de filtro por ano -=-
Deseja filtrar por ano mínimo? (s/n): s
Filtrar edições a partir de qual ano? [2023]: 2025No exemplo acima, apenas artigos publicados a partir de 2025 serão baixados.
Informe a abreviação da revista, conforme aparece na URL do SciELO. Exemplo: Almanack → https://www.scielo.br/j/alm/ → abreviação: alm.
scielo/{AAAA-MM-DD}/XML/ e .../PDF/.
IM-1256 - Introdução à História Digital | Acesse o material da disciplina