The Vault (internship)

From Software Heritage Wiki
Jump to navigation Jump to search

Mechanisme de recuperation du contenu de Software Heritage

Contexte: Software Heritage, projet de recherche de grande envergure ayant comme but la récupération, l'archivage à très long terme, et le partage de la totalité du Logiciel Libre publiquement accessible en format code source.

Description: L'archive de Software Heritage permet actuellement de vérifier si un contenu est présent ou pas (p.ex., via son checksum), mais pas des récupérer (p.ex., via téléchargement) les contenus disponibles. Le but de ce stage et d'implementer le Software Heritage Vault, pour permettre de préparer (p.ex. sous forme de git bundle) et ensuite télécharger les contenus présents dans l'archive.

Connaissances souhaitées pour accéder au stage:

  • Python
  • HTTP et API REST
  • PostgreSQL

Établissement d'accueil: Inria Paris

Encadrants:

  • Roberto Di Cosmo <roberto@dicosmo.org>
  • Stefano Zacchiroli <zack@upsilon.cc>