Expand archive coverage to other popular code hosting platforms (internship)

From Software Heritage Wiki
Revision as of 10:22, 24 November 2016 by RobertoDiCosmo (talk | contribs)
Jump to navigation Jump to search

Sauvegarder Bitbucket, GitLab, etc. dans Software Heritage

Contexte: Software Heritage, projet de recherche de grande envergure ayant comme but la récupération, l'archivage à très long terme, et le partage de la totalité du Logiciel Libre publiquement accessible en format code source.

Description: L'archive logiciel de Software Heritage contient actuellement une copie complète et à jour de GitHub, mais pas encore des code source hébergé par d'autres plateformes des développement collaboratif, comme notamment BitBucket ou GitLab. Le but de ce stage est d'automatiser le processus de recuperation et d'injection des dépôts (Git au autres logiciel de gestion de versions) hébergés sur une ou plusieurs parmi les plateformes de développement collaboratif les plus populaires pas encore supportées par Software Heritage.

Connaissances souhaitées pour accéder au stage:

  • connaissance (en tant qu'utilisateur) de BitBucket et/ou GitLab
  • HTTP et API REST
  • la familiarite avec Python pourra être un plus

Établissement d'accueil: Inria Paris

Environnement: vous serez en immersion totale avec l'équipe qui construit l'archive de Software Heritage, et vous aurez la possibilité d'observer de près la construction d'un projet d'envergure mondiale.

Encadrants:

  • Roberto Di Cosmo <roberto@dicosmo.org>
  • Stefano Zacchiroli <zack@upsilon.cc>