Distributed self-healing object storage (internship)

From Software Heritage Wiki
Jump to navigation Jump to search

Qui veut gagner des milliards (de fichiers source)? (DONE)

Contexte: projet de recherche de grande envergure ayant comme but la récupération, l'organisation, et l'archivage à très long terme (siècles) de la totalité du logiciel libre publiquement accessible via Internet.

Description: On souhaite concevoir, réaliser et tester en production un système de stockage pour fichiers textuels de petite taille (typiquement: code source) capable de stocker des milliards des fichiers, pour une occupation totale de l'ordre de 100 téraoctets, sur plusieurs noeuds des stockage géographiquement distribués. La synchronisation entre noeuds sera asynchrone, et chaque noeud disposera d'un contrôle automatique d'intégrité capable de réparer les fichiers corrompus (self-healing).

Connaissances souhaitées pour accéder au stage:

  • algorithmique répartie
  • Python
  • PostgreSQL

Établissement d'accueil: Inria Paris

Encadrants:

  • Roberto Di Cosmo <roberto@dicosmo.org>
  • Stefano Zacchiroli <zack@upsilon.cc>

Étudiant:

  • Quentin Campos