Le Grid Computing désigne un cluster d’or­di­na­teurs reliés entre eux de façon dé­cen­tra­li­sée et formant ainsi un su­pe­ror­di­na­teur virtuel. Avec sa puissance de calcul répartie de manière flexible, cette méthode permet de réaliser des tâches complexes avec plusieurs res­sources à la fois et d’optimiser l’uti­li­sa­tion de l’in­fras­truc­ture.

Grid Computing : dé­fi­ni­tion

Le Grid Computing constitue un sous-domaine du calcul distribué. Sous le terme générique de « calcul distribué » se cachent des in­fras­truc­tures nu­mé­riques composées d’or­di­na­teurs autonomes réunis au sein d’un même réseau in­for­ma­tique. Ce réseau est gé­né­ra­le­ment in­dé­pen­dant des res­sources ma­té­rielles. Vous pouvez intégrer des or­di­na­teurs dotés de per­for­mances et de ca­rac­té­ris­tiques dif­fé­rentes à ce réseau. Les ap­pli­ca­tions et processus que vous choi­sis­sez de dis­tri­buer peuvent fonc­tion­ner sur plusieurs appareils grâce à des unités de calcul en réseau. Au sein du réseau, ces unités de calcul peuvent donc com­mu­ni­quer entre elles au niveau local et su­pra­ré­gio­nal pour résoudre certains problèmes.

La dis­tinc­tion entre le calcul distribué et le Grid Computing est plutôt floue. Le calcul distribué peut s’appliquer à dif­fé­rentes formes de trai­te­ment dé­cen­tra­lisé des données au sein de réseaux in­for­ma­tiques. Le Grid Computing désigne plutôt la création d’un su­pe­ror­di­na­teur virtuel par le re­grou­pe­ment d’or­di­na­teurs connectés entre eux. Cette méthode peut être utilisée pour exécuter des processus ou des tâches de calcul intensif. Les serveurs et les or­di­na­teurs ainsi réunis mettent toutes leurs res­sources et leur puissance de calcul à dis­po­si­tion de l’uti­li­sa­teur, pour une meilleure évo­lu­ti­vité des per­for­mances in­for­ma­tiques né­ces­saires.

Comment fonc­tionne le Grid Computing ?

Dans le Grid Computing, les atouts des clusters d’or­di­na­teurs sont utilisés de manière su­pra­ré­gio­nale et dé­cen­tra­li­sée, en grilles. Les clusters d’or­di­na­teurs sont gé­né­ra­le­ment composés de réseaux in­for­ma­tiques limités lo­ca­le­ment, mais le Grid Computing repose sur les capacités in­for­ma­tiques su­pra­ré­gio­nales des réseaux. En plus des or­di­na­teurs, les bases de données, les res­sources ma­té­rielles et lo­gi­cielles et les capacités de calcul sont également mises en réseau. Sur cette grille, les four­nis­seurs relient des res­sources in­for­ma­tiques dis­tri­buées à l’échelle locale ou globale en utilisant des in­ter­faces (nœuds) et des in­ter­gi­ciels, pour les affecter à des or­ga­ni­sa­tions vir­tuelles. Celles-ci dé­ter­mi­nent la prise en charge des tâches par les res­sources ou la ré­par­ti­tion optimale de la puissance de calcul liée au fonc­tion­ne­ment d’une ap­pli­ca­tion.

Vous pouvez utiliser le Grid Computing à des fins com­mer­ciales, mais aussi pour analyser ou traiter des données scien­ti­fiques et éco­no­miques. Si certains processus complexes dépassent la puissance de calcul d’un or­di­na­teur ou d’un cluster local d’or­di­na­teurs, le Grid Computing peut permettre d’intégrer, d’évaluer ou de re­pré­sen­ter d’im­por­tants volumes de données. Aucun matériel spé­ci­fique n’est requis pour le Grid Computing. En effet, ce sont plutôt les in­ter­gi­ciels (logiciels destinés à l’échange de données entre les ap­pli­ca­tions) des or­di­na­teurs couplés qui ga­ran­tis­sent la dis­po­ni­bi­lité des capacités in­for­ma­tiques au sein de l’or­ga­ni­sa­tion virtuelle.

Domaines d’ap­pli­ca­tion du Grid Computing

En principe, le Grid Computing ne se limite à aucun domaine d’ap­pli­ca­tion spé­ci­fique, car le re­grou­pe­ment de clusters d’or­di­na­teurs peut remplir des objectifs aussi divers que variés. Pour les su­pe­ror­di­na­teurs virtuels, les domaines d’ap­pli­ca­tion les plus connus sont les analyses Big Data dans les domaines scien­ti­fique et éco­no­mique, qui im­pli­quent d’im­por­tants volumes de données et des si­mu­la­tions pour les­quelles il est né­ces­saire de recourir au calcul intensif. Ces exigences se re­trou­vent dans les re­cherches en lien avec les sciences na­tu­relles et la médecine, mais également dans les secteurs de la mé­téo­ro­lo­gie, de l’industrie ou de la physique des par­ti­cules. Les ex­pé­riences de grande ampleur menées par le CERN sur le grand col­li­sion­neur de hadrons en sont le parfait exemple.

Aperçu des clas­si­fi­ca­tions du Grid Computing

Pour définir et clas­si­fier le Grid Computing par rapport à d’autres tech­no­lo­gies comme le calcul de cluster ou calcul pair à pair, il est possible d’utiliser ces trois éléments fon­da­men­taux :

  • La coor­di­na­tion dé­cen­tra­li­sée (locale et globale) de res­sources telles que les clusters d’or­di­na­teurs, l’analyse de données, les solutions de stockage de masse et les bases de données
  • Les in­ter­faces ouvertes stan­dar­di­sées (nœuds) et les in­ter­gi­ciels (sous forme de pro­to­coles ou d’ensembles de pro­to­coles) qui relient les réseaux in­for­ma­tiques à la grille prin­ci­pale et ré­par­tis­sent les tâches
  • Une offre de qualité de service qui, loin d’être triviale, permet d’optimiser la ré­par­ti­tion des flux de données et de garantir la constance de l’évo­lu­ti­vité ainsi que la fiabilité des trans­ferts de données en cas de fortes exigences de calcul.

Le Grid Computing peut en outre faire l’objet d’une sub­di­vi­sion en dif­fé­rentes clas­si­fi­ca­tions :

  • Computing Grids (grilles de calcul) : il s’agit de la forme la plus courante de Grid Computing. À l’aide de leurs four­nis­seurs, les uti­li­sa­teurs de la grille utilisent la puissance de calcul couplée d’un su­pe­ror­di­na­teur virtuel pour répartir ou mettre à l’échelle leurs processus de calcul intensif.
  • Data Grids (grilles de données) : les grilles de données mettent à dis­po­si­tion des uti­li­sa­teurs les capacités de calcul d’or­di­na­teurs connectés entre eux, ce qui permet aux uti­li­sa­teurs d’évaluer, de re­pré­sen­ter, de trans­fé­rer, de partager ou d’analyser d’im­por­tants volumes de données à partir des nœuds de ces grilles.
  • Knowledge Grids (grilles de con­nais­sances) : dans cette structure, les capacités de su­per­cal­cul de la grille servent à scanner, relier, collecter, évaluer ou struc­tu­rer d’im­por­tants ensembles de données et des bases de con­nais­sances.
  • Ressource Grids (grilles de res­sources) : ces systèmes per­met­tent de définir des hié­rar­chies entre les four­nis­seurs de réseau ou de res­sources et les uti­li­sa­teurs, et de coupler celles-ci au sein d’une grille. Grâce à un modèle de rôle, il est possible de spécifier les four­nis­seurs de res­sources pouvant utiliser des in­ter­faces pour mettre à dis­po­si­tion des uti­li­sa­teurs des capacités de stockage et de calcul, des ensembles de données, des équi­pe­ments logiciels et matériels, des ap­pli­ca­tions, des capteurs, des appareils de mesure et bien d’autres ins­tru­ments encore.
  • Service Grids (grilles de services) : les four­nis­seurs de services de la grille four­nis­sent un service complet aux uti­li­sa­teurs, à savoir un ensemble des capacités et des com­po­sants proposés par les four­nis­seurs de res­sources. Le Grid Computing met donc l’accent aussi bien sur le service que sur la puissance de calcul.

Grid Computing vs Cloud Computing : quelle est la dif­fé­rence ?

Il convient de ne pas confondre Grid Computing et Cloud Computing. Dans le cadre du Grid Computing, des or­di­na­teurs sont couplés de manière dé­cen­tra­li­sée afin de réunir plusieurs res­sources pour former un su­pe­ror­di­na­teur virtuel. Les in­fras­truc­tures composées d’or­di­na­teurs et d’ap­pli­ca­tions en réseau ap­par­tien­nent aux four­nis­seurs de la grille. Pour ce qui est du Cloud Computing, ce sont les four­nis­seurs de Cloud qui utilisent l’hé­ber­ge­ment Cloud pour mettre à dis­po­si­tion des uti­li­sa­teurs cette puissance de calcul, mais aussi des capacités de stockage et des services de manière globale, tout en gérant les activités de calcul dans le Cloud, de manière cen­tra­li­sée.

Comme la réduction des dépenses in­for­ma­tiques, la mise à dis­po­si­tion d’in­fras­truc­tures in­for­ma­tiques ex­ter­na­li­sées et évo­lu­tives et de capacités de stockage sur le Cloud compte par exemple parmi les avantages du Cloud Computing. En­tre­prises et par­ti­cu­liers peuvent réaliser des économies et gagner en cen­tra­li­sa­tion en utilisant des services de Cloud pour diverses tâches, sans avoir à piocher dans leurs propres res­sources. Le Grid Computing, quant à lui, permet de traiter, d’exécuter et d’appeler d’im­por­tants volumes de données et des processus complexes de manière avan­ta­geuse grâce à des capacités de grille couplées, sans faire appel à ses propres centres de données physiques.

Grid Computing : avantages et in­con­vé­nients

Avantages

  • Coor­di­na­tion et gestion des processus et des tâches depuis n’importe quel appareil
  • Mise à l’échelle éco­no­mique des processus opé­ra­tion­nels grâce à une puissance de calcul et à des capacités de stockage couplées
  • Trai­te­ment, analyse et re­pré­sen­ta­tion en simultané/parallèle d’im­por­tants volumes de données à l’aide de réseaux in­for­ma­tiques globaux
  • Réa­li­sa­tion plus rapide et plus efficace des tâches complexes
  • Fiabilité d’uti­li­sa­tion et op­ti­mi­sa­tion de l’in­fras­truc­ture in­for­ma­tique à l’aide d’or­ga­ni­sa­tions vir­tuelles et d’une ré­par­ti­tion flexible des tâches
  • Bonne tolérance aux pannes due à la ré­par­ti­tion flexible et modulaire des capacités au sein du réseau
  • Aucun in­ves­tis­se­ment majeur requis pour l’in­fras­truc­ture de serveur

In­con­vé­nients

  • Ad­mi­nis­tra­tion complexe et in­com­pa­ti­bi­lité des com­po­sants du système (dans certains cas)
  • Puissance de calcul non pro­por­tion­nelle au nombre d’or­di­na­teurs couplés
Aller au menu principal