Darcs loader (internship)
Chargeur pour dépôts Mecurial et/ou Darcs
(english description follows)
Contexte: Software Heritage, projet de recherche de grande envergure ayant comme but la récupération, l'archivage à très long terme, et le partage de la totalité du Logiciel Libre publiquement accessible en format code source.
Description: L'archive logiciel de Software Heritage contient actuellement code source provenant principalement de dépôts Git accessibles via Internet. On souhaite supporter bien d'autres logiciel de gestion de versions, et en priorité d'autres DVCS (Distributed Version Control System) populaires comme Mercurial et Darcs. Le but de ce stage est de développer les "chargeurs" (loaders) pour injecter dans l'archive de Software Heritage du code source disponibles dans de dépôts Mercurial et/ou Darcs.
Connaissances souhaitées pour accéder au stage:
- connaissance des logiciels de gestion de versions, en particulier Mercurial et/ou Darcs
- structures de donnees
- programmation
- bases de données
- la familiarité avec Python et PostgreSQL pourra être un plus
Établissement d'accueil: Inria Paris
Environnement: vous serez en immersion totale avec l'équipe qui construit l'archive de Software Heritage, et vous aurez la possibilité d'observer de près la construction d'un projet d'envergure mondiale.
Encadrants:
- Roberto Di Cosmo <roberto@dicosmo.org>
- Stefano Zacchiroli <zack@upsilon.cc>
Mercurial and Darcs loaders
(version française ci-dessus)
Context: Software Heritage is an ambitious research project whose goal is to collect, preserve in the very long term, and share the whole publicly accessible Free/Open Source Software (FOSS) in source code form.
Description: The Software Heritage archive currently contains source code coming mostly from Git repositories publicly available on the Internet. We would like to extend the archive coverage to source code available from other popular Distributed Version Control Systems (DVCs), and in particular Mercurial and Darcs. The goal of this internship is to develop automated "loaders" that can be used to ingest into the archive source code available from Mercurial and/or Darcs repositories.
Desirable skills to obtain this internship:
- familiarity with the Distributed Version Control Systems (DVCs) Mercurial and/or Darcs
- graph data structures and algorithms
- Python development
- RDBMs
- working knowledge of PostgreSQL would be a plus
Workplace: Inria Paris
Environnement: you will work shoulder to shoulder with all members of the Software Heritage team, and you will have a chance to witness from within the construction of the ultimate source code archive.
Internship mentors:
- Roberto Di Cosmo <roberto@dicosmo.org>
- Stefano Zacchiroli <zack@upsilon.cc>