Expandindo a caixa de ferramentas digitais (parte 2)

Oficina 1 - Prof Eric Brasil

quarta-feira, 3 de setembro de 2025

Ferramentas Digitais

2. Controle de versão e ciência aberta

  • Controle de versão: acompanhar mudanças em arquivos e projetos ao longo do tempo.
  • Git + GitHub: colaboração, transparência e rastreabilidade na produção científica.
  • Ciência aberta: disponibilização de dados, códigos e publicações em plataformas acessíveis.
  • Reprodutibilidade: possibilita que outros pesquisadores verifiquem, critiquem e ampliem trabalhos.

2. Controle de versão e ciência aberta

Princípios FAIR

  • Findable → Dados localizáveis
  • Accessible → Dados acessíveis
  • Interoperable → Compatíveis entre sistemas
  • Reusable → Reutilizáveis em novas pesquisas

2.1 Git

  • O que é?
    Sistema de controle de versão distribuído, usado para registrar mudanças em arquivos e permitir colaboração entre vários pesquisadores.

2.1 Git

  • Por que usar?
    • Histórico completo de alterações em projetos.
    • Trabalho colaborativo com branches e merge.
    • Base para ciência aberta e reprodutibilidade.
    • Integra-se ao GitHub, GitLab e outros repositórios.

2.1 Git

  • Leitura recomendada
    Eric Brasil, “Git como ferramenta metodológica em projetos de História (parte 1)”, Programming Historian em português, 3 (2023). https://doi.org/10.46430/phpt0045

2.1 Git

Comandos básicos:

git init          # Inicia um repositório Git
git add <arquivo>  # Adiciona arquivo(s) para o próximo commit
git commit       # Salva mudanças no repositório
git push         # Envia mudanças para o repositório remoto
git pull         # Atualiza o repositório local com mudanças remotas
git status       # Verifica o estado dos arquivos
git log          # Mostra o histórico de commits

Fluxo básico de trabalho com Git

2.2 GitHub

Github

  • O que é?
    Plataforma de hospedagem de código e projetos baseada em Git, que permite colaboração, versionamento e publicação de conteúdos.

2.2 GitHub

  • Por que usar?
    • Armazenar e compartilhar projetos de forma pública ou privada.
    • Trabalhar em equipe com Issues, Pull Requests e Actions.
    • Publicar páginas da web (GitHub Pages).
    • Integrar fluxos de trabalho de pesquisa em ciência aberta.
    • Facilitar colaboração interdisciplinar em Humanidades Digitais.

2.3 Zenodo

  • O que é?
    Repositório aberto para compartilhamento e preservação de pesquisas (artigos, dados, softwares, apresentações, etc.), mantido pelo CERN.

2.3 Zenodo

  • Por que usar?
    • Gera DOI gratuito para qualquer publicação.
    • Garante preservação a longo prazo dos materiais.
    • Integra-se diretamente ao GitHub → permite arquivar versões de repositórios e atribuir DOI.
    • Favorece a ciência aberta e a reutilização de dados.
    • Aceita múltiplos formatos (texto, código, áudio, vídeo, datasets).

2.3 Zenodo - exemplo

  • Exemplo de repositório no Zenodo:
    pyHDB

2.4 OSF (Open Science Framework)

  • O que é?
    Plataforma aberta para gestão, colaboração e transparência em projetos científicos, mantida pelo Center for Open Science.

2.4 OSF (Open Science Framework)

  • Por que usar?
    • Organiza projetos de pesquisa em um único espaço (dados, códigos, textos).
    • Oferece armazenamento gratuito na nuvem.
    • Permite colaboração aberta ou restrita entre equipes.
    • Integra com GitHub, Google Drive, Dropbox e outros serviços.

3. Visualização de dados e redes

  • Visualizar dados é transformar tabelas, números e relações em gráficos, mapas e redes.
  • Torna padrões e conexões mais visíveis e compreensíveis.
  • Ferramentas como Gephi e QGIS permitem explorar desde redes sociais históricas até mapas interativos.
  • Recurso essencial para pesquisa em História Digital e Humanidades Digitais.

3.1 Gephi

  • O que é?
    Software livre para análise e visualização de redes (sociais, históricas, bibliográficas etc.).
    Muito usado em Humanidades Digitais para mapear conexões entre pessoas, lugares, ideias e documentos.

3.1 Gephi

  • Por que usar?
    • Explorar estruturas e padrões em grandes conjuntos de dados relacionais.
    • Criar mapas de redes interativos e publicáveis.
    • Aplicar métricas de análise de redes (centralidade, modularidade, comunidades).
    • Usado em áreas como História, Sociologia, Ciência da Informação e Comunicação.
    • Gratuito, de código aberto e multiplataforma.

3.1 Gephi - instalação

3.1 Gephi - referência

3.1.1 Lógica de Nodes e Edges

  • Nodes (nós)
    • Representam entidades (pessoas, lugares, documentos, conceitos).
    • São os pontos ou círculos do grafo.
  • Edges (arestas)
    • Representam as relações entre os nós.
    • Podem ser direcionadas (A → B) ou não direcionadas (A — B).
    • Podem ter peso (intensidade da relação).

3.1.1 Lógica de Nodes e Edges

💡 Em Gephi, redes = Nodes + Edges → possibilitam visualizar estruturas e padrões.

3.1.2 Exemplo: redes de correspondência

  • Cada intelectual é um node (nó).
  • Cada carta enviada é uma edge (aresta) conectando dois nós.
  • É possível analisar:
    • Quem escreve mais cartas (grau de centralidade).
    • Quem conecta diferentes grupos (nós de ponte).
    • A formação de comunidades epistolares.

3.2 QGIS

  • O que é?
    Software livre e multiplataforma de Sistema de Informação Geográfica (SIG).
    Permite criar, editar, visualizar e analisar mapas digitais.

3.2 QGIS

  • Por que usar?

    • Produzir mapas históricos e georreferenciar documentos.
    • Integrar dados espaciais de diferentes formatos (Shapefile, GeoJSON, KML, etc.).
    • Realizar análises espaciais complexas (densidade, fluxos, camadas históricas).
    • Código aberto, gratuito e com ampla comunidade de suporte.

3.2 QGIS - instalação

3.2 QGIS - referências

  • Jim Clifford, Josh MacFadyen, e Daniel Macfarlane, “Instalando o QGIS e adicionando camadas”, traduzido por Luanna Kaori, Programming Historian em português 5 (2025), DOI.
  • Justin Colson, “Geocodificando Dados Históricos com o QGIS”, traduzido por Luanna Kaori, Programming Historian em português 5 (2025), DOI.
  • Jim Clifford, Josh MacFadyen, e Daniel Macfarlane, “Georreferenciamento com o QGIS 3.20”, traduzido por Ângela Pité, Programming Historian em português 3 (2023), DOI.

4. Análise de textos

  • Analisar textos digitalmente permite identificar padrões, frequências e relações que seriam difíceis de perceber manualmente.
  • Usadas em História Digital para mapear discursos, vocabulários, temas e narrativas.
  • Facilitam tanto análises quantitativas (palavras, ocorrências) quanto qualitativas (contextos e significados).

4.1 Voyant Tools

  • O que é?
    Plataforma online e gratuita para análise textual exploratória.
    Permite visualizar padrões em grandes corpora de texto de forma interativa.

4.1 Voyant Tools

  • Por que usar?
    • Gera nuvens de palavras, gráficos de frequência e concordâncias.
    • Permite análises quantitativas rápidas em textos históricos.
    • Visualização interativa de vocabulário e relações semânticas.
    • Não exige instalação → roda direto no navegador.

4.1 Voyant Tools

  • Silvia Gutiérrez De la Torre, “Corpus Analysis with Voyant Tools,” translated by Eime Javier Cisneros Brito and Alberto Santiago Martínez, Programming Historian 14 (2025), https://doi.org/10.46430/phen0128.

4.2 AntConc

  • O que é?
    Software gratuito e multiplataforma para análise linguística de corpora textuais.
    Criado por Laurence Anthony, é bastante usado em pesquisas acadêmicas.

4.2 AntConc

  • Por que usar?
    • Buscar palavras-chave e suas ocorrências em contexto.
    • Gerar listas de frequência e concordâncias.
    • Explorar colocações e padrões de coocorrência.
    • Útil para análise de discursos históricos, literatura e documentos oficiais.
    • Interface simples, mas poderosa para análises quantitativas de texto.

4.2 AntConc - referência

4.3 OpenRefine

  • O que é?
    Ferramenta gratuita e de código aberto para limpeza, transformação e organização de dados.
    Muito usada para preparar bases textuais ou tabulares antes da análise.

4.3 OpenRefine

  • Por que usar?
    • Corrigir inconsistências em grandes conjuntos de dados (ex.: nomes duplicados, grafias diferentes).
    • Transformar e padronizar dados rapidamente.
    • Trabalhar com formatos variados (CSV, TSV, JSON, XML).
    • Recurso de clustering para identificar variações e duplicatas.

4.3 OpenRefine - instalação

4.3 OpenRefine - referência

  • Seth van Hooland, Ruben Verborgh, e Max De Wilde, “Limpar dados com o OpenRefine”, traduzido por Francisco Nabais, Programming Historian em português 3 (2023), https://doi.org/10.46430/phpt0038.
  • Evan Peter Williamson, “Fetching and Parsing Data from the Web with OpenRefine,” Programming Historian 6 (2017), https://doi.org/10.46430/phen0065.

5. Edição e produção multimídia

Ferramentas para trabalhar com áudio e vídeo em projetos de pesquisa, ensino e divulgação científica.

5.1 Audacity

5.2 OBS Studio

5.3 Kdenlive

  • O que é?
    Editor de vídeo livre e multiplataforma, com recursos profissionais.
  • Link: https://kdenlive.org/

5.4 FFmpeg

  • O que é?
    Conjunto de ferramentas de linha de comando para converter, gravar e manipular áudio e vídeo.
  • Link: https://ffmpeg.org/

6. Narrativas interativas

Ferramentas para criar exposições digitais, linhas do tempo e mapas narrativos.

6.1 StoryMapJS

6.2 TimelineJS

Como isso impacta a produção do conhecimento?