Versionamento, documentação e princípios FAIR

IM-1256 - Introdução à História Digital

Eric Brasil

2024-11-19

Planejamento da pesquisa

  • Documentação
  • Organização
  • Preservação
  • Licenciamento

Plano de gerenciamento de dados

  • Plano de Gerenciamento de Dados (Data Management Plan - DMP)
  • Documento vivo atualizado durante a pesquisa.
  • Exemplos e diretrizes disponíveis no OSF.
  • The Digital Documentation Process

Estratégias de Documentação

  • Finalidade: Capturar o processo de criação de dados e alterações.
  • Capacidade de preservar, recuperar, compartilhar e reutilizar os dados de uma pesquisa passa sobremaneira pela a forma como esses dados são documentados.

Estratégias de Documentação

James Baker, Preservar os seus dados de investigação.

  1. escrever explicitamente os critérios e os padrões adotados.
  2. utilizar formatos de texto simples e multiplataforma, como txt, md e csv;
  3. incluir README.md ou README.txt em cada diretório explicitando seu conteúdo;
  4. padronizar nomeação de diretórios e ficheiros;

Estratégias de Documentação

James Baker, Preservar os seus dados de investigação.

  1. pensar em formatos, padrões e convenções que sejam multiplataforma;
  2. registar suas decisões;
  3. produzir a documentação de forma continuada, durante todo o processo de pesquisa.

O que é o README?

Sobre arquivos README, veja a documentação do GitHub. Aqui um exemplo de README explicando o conteúdo de um diretório: README.md.

Estratégias de Organização

  1. Pensar estrutura de diretórios padronizada;
  2. Nomear ficheiros de forma padronizada;
  3. Criar padrão de realização de backups;
  4. Explicitar o uso de serviços de nuvem e sincronização de dados.
  5. Avaliar ferramentas de organização de dados e referências bibliográficas.
  6. Incluir decisões de organização na documentação.

Estrutura de diretórios

Exemplo simples de estrutura de ficheiros e diretórios.

Estrutura de diretórios

HEMDIG(pt): Métodos, ferramentas e hemerotecas digitais em português:

Estrutura de diretórios e ficheiros do repositório do HEMDIG(pt)

Princípios FAIR

  • Guia para organização e documentação de dados:
    1. Findable (Encontrável)
    2. Accessible (Acessível)
    3. Interoperable (Interoperável)
    4. Reusable (Reutilizável)
  • Detalhes em: FAIR Principles

1. Encontrável (Findable)

  • F1. Os (meta)dados recebem um identificador global único e persistente.
  • F2. Os dados são descritos com metadados ricos (definidos em R1 abaixo).
  • F3. Os metadados incluem clara e explicitamente o identificador dos dados que descrevem.
  • F4. Os (meta)dados são registrados ou indexados em um recurso pesquisável.

2. Acessível (Accessible)

  • A1. Os (meta)dados são recuperáveis pelo seu identificador, utilizando um protocolo de comunicação padronizado.
    • A1.1 O protocolo é aberto, gratuito e universalmente implementável.
    • A1.2 O protocolo permite um procedimento de autenticação e autorização, quando necessário.
  • A2. Os metadados são acessíveis, mesmo quando os dados não estão mais disponíveis.

3. Interoperável (Interoperable)

  • I1. Os (meta)dados utilizam uma linguagem formal, acessível, compartilhada e amplamente aplicável para representação do conhecimento.
  • I2. Os (meta)dados utilizam vocabulários que seguem os princípios FAIR.
  • I3. Os (meta)dados incluem referências qualificadas a outros (meta)dados.

4. Reutilizável (Reusable)

  • R1. Os (meta)dados são descritos com uma pluralidade de atributos precisos e relevantes.
    • R1.1. Os (meta)dados são disponibilizados com uma licença de uso clara e acessível.
    • R1.2. Os (meta)dados são associados a uma proveniência detalhada.
    • R1.3. Os (meta)dados atendem aos padrões comunitários relevantes para o domínio.

Licenciamento de Dados

Sistema de controle de versões

Eric Brasil, “Git como ferramenta metodológica em projetos de História (parte 1)”, Programming Historian em português 3 (2023), https://doi.org/10.46430/phpt0045.

  • O que é um SCV (Sistema de Controle de Versões)?
    • Registra mudanças de arquivos ao longo do tempo.
    • Exemplo: Git

Sistema de controle de versões

  • Benefícios:
    • Rastreabilidade de mudanças.
    • Reprodutibilidade de projetos.
    • Segurança e integridade dos dados.
    • Colaboração e compartilhamento de dados.

Git

Vamos fazer a lição do Programming Historian juntos?