The Vault (internship)
Mechanisme de recuperation du contenu de Software Heritage
Contexte: Software Heritage, projet de recherche de grande envergure ayant comme but la récupération, l'archivage à très long terme, et le partage de la totalité du Logiciel Libre publiquement accessible en format code source.
Description: L'archive de Software Heritage permet actuellement de vérifier si un contenu est présent ou pas (p.ex., via son checksum), mais pas des récupérer (p.ex., via téléchargement) les contenus disponibles. Le but de ce stage et d'implementer le Software Heritage Vault, pour permettre de préparer (p.ex. sous forme de git bundle) et ensuite télécharger les contenus présents dans l'archive.
Connaissances souhaitées pour accéder au stage:
- HTTP et API REST
- environnement *nix
- programmation
- bases de données
- la familiarité avec Python et PostgreSQL pourra être un plus significatif
Établissement d'accueil: Inria Paris
Environnement: vous serez en immersion totale avec l'équipe qui construit l'archive de Software Heritage, et vous aurez la possibilité d'observer de près la construction d'un projet d'envergure mondiale.
Encadrants:
- Roberto Di Cosmo <roberto@dicosmo.org>
- Stefano Zacchiroli <zack@upsilon.cc>