GlusterFS est un système de fichiers distribué, modulable à volonté, qui réunit les éléments de stockage de plusieurs serveurs pour former un système de fichiers uniforme. Après leur ins­tal­la­tion, les systèmes de fichiers tra­vail­lent en secret et plus personne n’y prête attention. Gé­né­ra­le­ment, cette situation n’est amenée à changer que lorsque des données sont perdues ou lorsque le système de fichiers atteint ses limites, par exemple avec la taille maximale d’une partition ou des res­tric­tions dans la longueur des chemins de stockage.

Qui est derrière GlusterFS et de quoi s’agit-il ?

Le nom « Gluster » est composé de « GNU » (GNU’s not Unix) et « cluster ». Ce système a été publié sous licence GNU-General Public License (GNU-GPLS) et peut ainsi être utilisé gra­tui­te­ment. Dans le contexte des supports de données, le terme « cluster » (lit­té­ra­le­ment : « pile ») décrit le re­grou­pe­ment logique d’unités de stockage physiques. En lien avec des or­di­na­teurs, il désigne une grappe de plusieurs systèmes connectés ensemble. GlusterFS réunit ces approches en fu­sion­nant l’espace de stockage d’or­di­na­teurs connectés entre eux et en les utilisant comme une unité logique.

Le projet a été publié en 2005 par Gluster Inc. En 2011, l’en­tre­prise a été reprise par RedHat, le dis­tri­bu­teur de Linux, qui n’a depuis cessé de dé­ve­lop­per le système de fichiers. En janvier 2020, la version 7 de GlusterFS a fait son ap­pa­ri­tion. Elle est dis­po­nible sous forme pré­com­pi­lée pour les dis­tri­bu­tions Linux suivantes :

  • CentOS
  • Debian
  • Fedora
  • RedHat/RHEL
  • SUSE
  • Ubuntu

La li­mi­ta­tion aux systèmes basés sur Unix se justifie par l’in­té­gra­tion de la mémoire via le module FUSE. À ce jour, ce module n’est pas dis­po­nible sur Windows avec une stabilité suf­fi­sante.

Note

FUSE est l’abré­via­tion de « Fi­le­sys­tem in Userspace » (système de fichier dans l’espace uti­li­sa­teur). Les systèmes d’ex­ploi­ta­tion sont gé­né­ra­le­ment sub­di­vi­sés en espace uti­li­sa­teur et espace noyau. Ce dernier est par­ti­cu­liè­re­ment protégé et, par exemple, uni­que­ment ac­ces­sible avec des droits d’ad­mi­nis­tra­teur. Par con­sé­quent, l’in­té­gra­tion (le « montage ») et la gestion de disques sont nor­ma­le­ment uni­que­ment possibles avec des droits d’ad­mi­nis­tra­teur. FUSE permet toutefois aux uti­li­sa­teurs de gérer des systèmes de fichiers.

Les or­di­na­teurs peuvent fonc­tion­ner comme un serveur et un client. Un accès simple au système de fichiers est toutefois également possible depuis d’autres systèmes. Le NFS (Network File System) et le SMB/CIFS (Server Message Block/Common Internet File System) sont pris en charge.

Fonc­tion­ne­ment de GlusterFS

Un système de fichiers distribué s’avère uni­que­ment pertinent lorsque plusieurs or­di­na­teurs sont connectés entre eux. La do­cu­men­ta­tion de GlusterFS indique qu’un minimum de trois serveurs est né­ces­saire. Le terme « serveur » ne doit toutefois pas être in­ter­prété lit­té­ra­le­ment. Il est possible d’intégrer presque n’importe quelle forme de matériel physique ou émulé ce qui inclut n’importe quel or­di­na­teur, mais aussi des machines vir­tuelles. Cela s’avère par­ti­cu­liè­re­ment avan­ta­geux en termes de flexi­bi­lité.

Les serveurs intégrés fonc­tion­nent comme des nodes (nœuds) qui se con­nec­tent via le réseau TCP/IP. Les appareils intégrés forment un Trusted Pool, c’est-à-dire une grappe de serveurs fiables. Ils mettent à dis­po­si­tion leur mémoire sous la forme de bricks (blocs). Ces bricks per­met­tent fi­na­le­ment de former des volumes (disques) qui pourront ensuite être intégrés et utilisés comme des supports de données normaux. Les or­di­na­teurs accédant sont appelés clients. Un PC peut aussi bien être serveur que client.

La par­ti­cu­la­rité de ce système réside dans son immense mo­du­la­rité. Il est possible d’ajouter a pos­te­riori un nombre illimité de nodes et de bricks. Ceci permet d’adapter cons­tam­ment la taille de l’espace de stockage aux exigences. La taille maximale de la mémoire chargée de la gestion est de plusieurs pé­taoc­tets.

Par ailleurs, GlusterFS garantit une certaine fiabilité grâce à la re­don­dance. Le risque de panne est d’une part réparti entre plusieurs systèmes qui peuvent également être séparés phy­si­que­ment. D’autre part, il est possible de mettre en place des grappes RAID. Con­trai­re­ment au volume distribué, qui est présent par défaut, il est né­ces­saire de créer un volume dupliqué à cet effet. Celui-ci en­re­gistre chaque fichier en double et cor­res­pond à un RAID Mirror.

Remarque

Un Redundant Array of In­de­pen­dent Disks (RAID) est une grappe de disques in­dé­pen­dants phy­si­que­ment à partir desquels un disque fusionné est formé. En fonction de la des­ti­na­tion, il peut être axé sur la vitesse ou la sécurité des données. En con­sé­quence, l’espace de stockage est réduit par le stockage multiple de données ou le stockage d’in­for­ma­tions sup­plé­men­taires pour une ré­cu­pé­ra­tion des fichiers.

Pour les tran­sac­tions sur l’espace de stockage, GlusterFS offre dix tra­duc­teurs (trans­la­tors) pré­dé­fi­nis qui tra­dui­sent des commandes émises avec des droits d’uti­li­sa­tion pour l’exécution sur la mémoire. On peut citer pour exemples le tra­duc­teur « Storage », qui en­re­gistre les données sur un système de fichiers local et en gère l’accès, et le tra­duc­teur « En­cryp­tion » res­pon­sable du cryptage.

La géo­ré­pli­ca­tion est une nouvelle fonc­tion­na­lité qui permet d’effectuer une ré­par­ti­tion asyn­chrone des données sur des serveurs avec dif­fé­rentes lo­ca­li­sa­tions. Il s’agit d’une pro­tec­tion sup­plé­men­taire contre toute action physique sur le serveur, notamment en cas d’incidents, comme un incendie ou un vol. Dans ce cadre, un or­di­na­teur fonc­tionne comme un maître et l’autre comme un esclave. Le transfert des données est sécurisé via SSH (Secure Shell).

Avantages et in­con­vé­nients de GlusterFS

Nous avons résumé pour vous dans un aperçu plusieurs avantages et in­con­vé­nients d’un système de fichiers distribué par rapport à un stockage en réseau tra­di­tion­nel :

Avantages de Gluster In­con­vé­nients de Gluster
Bonne ex­ploi­ta­tion des capacités exis­tantes Création d’une structure réseau plus complexe
Fiabilité accrue Effort ad­mi­nis­tra­tif accru dans la mise en place
Ré­par­ti­tion de la charge du réseau Nécessite une in­fras­truc­ture réseau rapide
Très bonne mo­du­la­rité Effort sup­plé­men­taire pour la sécurité technique

Cas d’uti­li­sa­tion de GlusterFS

Sur le principe, GlusterFS reproduit par­fai­te­ment un Cloud. L’espace de stockage se trouvant dans une grappe est mis à la dis­po­si­tion des clients connectés. Un tel système est notamment adéquat pour les réseaux les plus grands dans lesquels des res­sources suf­fi­santes sont de toute façon dis­po­nibles pour la formation d’une grappe.

La connexion des appareils ayant lieu via le protocole Internet, les struc­tures d’en­tre­prise à plusieurs branches sont tout par­ti­cu­liè­re­ment adaptées à la mise en place d’un système de fichiers distribué. Mais un tel système peut également permettre de se passer d’un stockage réseau dédié dans des struc­tures réseau séparées phy­si­que­ment, sans pour autant devoir renoncer à la re­don­dance.

Conseil

Vous souhaitez tra­vail­ler avec GlusterFS ? IONOS a écrit pour vous un guide sur l’ins­tal­la­tion et la mise en place de ce système de fichiers (guide en anglais).

Al­ter­na­tives à GlusterFS

Parmi les al­ter­na­tives à GlusterFS, on trouve en par­ti­cu­lier Ceph qui est également dis­po­nible gra­tui­te­ment et offre de nombreux avantages parmi ceux listés pour les systèmes de fichiers dis­tri­bués. Ceph et Gluster pré­sen­tent dif­fé­rents avantages et in­con­vé­nients.

BeeGFS (au­pa­ra­vant FhGFS) a été développé spé­cia­le­ment par l’institut Fraun­ho­fer pour les systèmes in­for­ma­tiques per­for­mants. Il est lui aussi proposé gra­tui­te­ment et est axé sur une uti­li­sa­tion simple.

Dans le domaine com­mer­cial, il existe également des systèmes, tels que Storage Spaces Direct (S2D) de Microsoft, dont l’uti­li­sa­tion est toutefois limitée à des serveurs Windows sous licence payante.

Aller au menu principal