Difference between revisions of "Distributed self-healing object storage (internship)"

From Software Heritage Wiki
Jump to navigation Jump to search
 
m (1 revision: import public pages from the intranet wiki)
(No difference)

Revision as of 13:02, 20 July 2016

Qui veut gagner des milliards (de fichiers source)?

Contexte: projet de recherche de grande envergure ayant comme but la récupération, l'organisation, et l'archivage à très long terme (siècles) de la totalité du logiciel libre publiquement accessible via Internet.

Description: On souhaite concevoir, réaliser et tester en production un système de stockage pour fichiers textuels de petite taille (typiquement: code source) capable de stocker des milliards des fichiers, pour une occupation totale de l'ordre de 100 téraoctets, sur plusieurs noeuds des stockage géographiquement distribués. La synchronisation entre noeuds sera asynchrone, et chaque noeud disposera d'un contrôle automatique d'intégrité capable de réparer les fichiers corrompus (self-healing).

Connaissances souhaitées pour accéder au stage:

  • algorithmique répartie
  • Python
  • PostgreSQL

Établissement d'accueil: Inria Paris

Encadrants:

  • Roberto Di Cosmo <roberto@dicosmo.org>
  • Stefano Zacchiroli <zack@upsilon.cc>