Qu’est-ce que le Grid Computing ?

Le Grid Computing désigne un cluster d’ordinateurs reliés entre eux de façon décentralisée et formant ainsi un superordinateur virtuel. Avec sa puissance de calcul répartie de manière flexible, cette méthode permet de réaliser des tâches complexes avec plusieurs ressources à la fois et d’optimiser l’utilisation de l’infrastructure.

Grid Computing : définition

Le Grid Computing constitue un sous-domaine du calcul distribué. Sous le terme générique de « calcul distribué » se cachent des infrastructures numériques composées d’ordinateurs autonomes réunis au sein d’un même réseau informatique. Ce réseau est généralement indépendant des ressources matérielles. Vous pouvez intégrer des ordinateurs dotés de performances et de caractéristiques différentes à ce réseau. Les applications et processus que vous choisissez de distribuer peuvent fonctionner sur plusieurs appareils grâce à des unités de calcul en réseau. Au sein du réseau, ces unités de calcul peuvent donc communiquer entre elles au niveau local et suprarégional pour résoudre certains problèmes.

La distinction entre le calcul distribué et le Grid Computing est plutôt floue. Le calcul distribué peut s’appliquer à différentes formes de traitement décentralisé des données au sein de réseaux informatiques. Le Grid Computing désigne plutôt la création d’un superordinateur virtuel par le regroupement d’ordinateurs connectés entre eux. Cette méthode peut être utilisée pour exécuter des processus ou des tâches de calcul intensif. Les serveurs et les ordinateurs ainsi réunis mettent toutes leurs ressources et leur puissance de calcul à disposition de l’utilisateur, pour une meilleure évolutivité des performances informatiques nécessaires.

Comment fonctionne le Grid Computing ?

Dans le Grid Computing, les atouts des clusters d’ordinateurs sont utilisés de manière suprarégionale et décentralisée, en grilles. Les clusters d’ordinateurs sont généralement composés de réseaux informatiques limités localement, mais le Grid Computing repose sur les capacités informatiques suprarégionales des réseaux. En plus des ordinateurs, les bases de données, les ressources matérielles et logicielles et les capacités de calcul sont également mises en réseau. Sur cette grille, les fournisseurs relient des ressources informatiques distribuées à l’échelle locale ou globale en utilisant des interfaces (nœuds) et des intergiciels, pour les affecter à des organisations virtuelles. Celles-ci déterminent la prise en charge des tâches par les ressources ou la répartition optimale de la puissance de calcul liée au fonctionnement d’une application.

Vous pouvez utiliser le Grid Computing à des fins commerciales, mais aussi pour analyser ou traiter des données scientifiques et économiques. Si certains processus complexes dépassent la puissance de calcul d’un ordinateur ou d’un cluster local d’ordinateurs, le Grid Computing peut permettre d’intégrer, d’évaluer ou de représenter d’importants volumes de données. Aucun matériel spécifique n’est requis pour le Grid Computing. En effet, ce sont plutôt les intergiciels (logiciels destinés à l’échange de données entre les applications) des ordinateurs couplés qui garantissent la disponibilité des capacités informatiques au sein de l’organisation virtuelle.

Domaines d’application du Grid Computing

En principe, le Grid Computing ne se limite à aucun domaine d’application spécifique, car le regroupement de clusters d’ordinateurs peut remplir des objectifs aussi divers que variés. Pour les superordinateurs virtuels, les domaines d’application les plus connus sont les analyses Big Data dans les domaines scientifique et économique, qui impliquent d’importants volumes de données et des simulations pour lesquelles il est nécessaire de recourir au calcul intensif. Ces exigences se retrouvent dans les recherches en lien avec les sciences naturelles et la médecine, mais également dans les secteurs de la météorologie, de l’industrie ou de la physique des particules. Les expériences de grande ampleur menées par le CERN sur le grand collisionneur de hadrons en sont le parfait exemple.

Aperçu des classifications du Grid Computing

Pour définir et classifier le Grid Computing par rapport à d’autres technologies comme le calcul de cluster ou calcul pair à pair, il est possible d’utiliser ces trois éléments fondamentaux :

  • La coordination décentralisée (locale et globale) de ressources telles que les clusters d’ordinateurs, l’analyse de données, les solutions de stockage de masse et les bases de données
  • Les interfaces ouvertes standardisées (nœuds) et les intergiciels (sous forme de protocoles ou d’ensembles de protocoles) qui relient les réseaux informatiques à la grille principale et répartissent les tâches
  • Une offre de qualité de service qui, loin d’être triviale, permet d’optimiser la répartition des flux de données et de garantir la constance de l’évolutivité ainsi que la fiabilité des transferts de données en cas de fortes exigences de calcul.

Le Grid Computing peut en outre faire l’objet d’une subdivision en différentes classifications :

  • Computing Grids (grilles de calcul) : il s’agit de la forme la plus courante de Grid Computing. À l’aide de leurs fournisseurs, les utilisateurs de la grille utilisent la puissance de calcul couplée d’un superordinateur virtuel pour répartir ou mettre à l’échelle leurs processus de calcul intensif.
  • Data Grids (grilles de données) : les grilles de données mettent à disposition des utilisateurs les capacités de calcul d’ordinateurs connectés entre eux, ce qui permet aux utilisateurs d’évaluer, de représenter, de transférer, de partager ou d’analyser d’importants volumes de données à partir des nœuds de ces grilles.
  • Knowledge Grids (grilles de connaissances) : dans cette structure, les capacités de supercalcul de la grille servent à scanner, relier, collecter, évaluer ou structurer d’importants ensembles de données et des bases de connaissances.
  • Ressource Grids (grilles de ressources) : ces systèmes permettent de définir des hiérarchies entre les fournisseurs de réseau ou de ressources et les utilisateurs, et de coupler celles-ci au sein d’une grille. Grâce à un modèle de rôle, il est possible de spécifier les fournisseurs de ressources pouvant utiliser des interfaces pour mettre à disposition des utilisateurs des capacités de stockage et de calcul, des ensembles de données, des équipements logiciels et matériels, des applications, des capteurs, des appareils de mesure et bien d’autres instruments encore.
  • Service Grids (grilles de services) : les fournisseurs de services de la grille fournissent un service complet aux utilisateurs, à savoir un ensemble des capacités et des composants proposés par les fournisseurs de ressources. Le Grid Computing met donc l’accent aussi bien sur le service que sur la puissance de calcul.

Grid Computing vs Cloud Computing : quelle est la différence ?

Il convient de ne pas confondre Grid Computing et Cloud Computing. Dans le cadre du Grid Computing, des ordinateurs sont couplés de manière décentralisée afin de réunir plusieurs ressources pour former un superordinateur virtuel. Les infrastructures composées d’ordinateurs et d’applications en réseau appartiennent aux fournisseurs de la grille. Pour ce qui est du Cloud Computing, ce sont les fournisseurs de Cloud qui utilisent l’hébergement Cloud pour mettre à disposition des utilisateurs cette puissance de calcul, mais aussi des capacités de stockage et des services de manière globale, tout en gérant les activités de calcul dans le Cloud, de manière centralisée.

Comme la réduction des dépenses informatiques, la mise à disposition d’infrastructures informatiques externalisées et évolutives et de capacités de stockage sur le Cloud compte par exemple parmi les avantages du Cloud Computing. Entreprises et particuliers peuvent réaliser des économies et gagner en centralisation en utilisant des services de Cloud pour diverses tâches, sans avoir à piocher dans leurs propres ressources. Le Grid Computing, quant à lui, permet de traiter, d’exécuter et d’appeler d’importants volumes de données et des processus complexes de manière avantageuse grâce à des capacités de grille couplées, sans faire appel à ses propres centres de données physiques.

Grid Computing : avantages et inconvénients

Avantages

  • Coordination et gestion des processus et des tâches depuis n’importe quel appareil
  • Mise à l’échelle économique des processus opérationnels grâce à une puissance de calcul et à des capacités de stockage couplées
  • Traitement, analyse et représentation en simultané/parallèle d’importants volumes de données à l’aide de réseaux informatiques globaux
  • Réalisation plus rapide et plus efficace des tâches complexes
  • Fiabilité d’utilisation et optimisation de l’infrastructure informatique à l’aide d’organisations virtuelles et d’une répartition flexible des tâches
  • Bonne tolérance aux pannes due à la répartition flexible et modulaire des capacités au sein du réseau
  • Aucun investissement majeur requis pour l’infrastructure de serveur

Inconvénients

  • Administration complexe et incompatibilité des composants du système (dans certains cas)
  • Puissance de calcul non proportionnelle au nombre d’ordinateurs couplés