Le 25 janvier 2021, Google a présenté en détail sa propre vision d’un Web sans cookies, mais toujours rempli de publicité. Le géant des moteurs de recherche décrit dans son article de blog « Building a privacy-first future for web ad­ver­ti­sing » comment la publicité per­son­na­li­sée fonc­tion­nera lorsque les cookies tiers ne seront plus pris en charge. La méthode dite Federated Learning of Cohorts (FLoC) est une com­po­sante élé­men­taire du Privacy Sandbox prévu.

Nous vous ex­pli­quons ce qui se cache derrière FLoC, ainsi que le fonc­tion­ne­ment de cette al­ter­na­tive res­pec­tueuse de la vie privée pour la création et l’uti­li­sa­tion de profils d’uti­li­sa­teurs in­di­vi­duels.

Qu’est-ce que FLoC (Federated Learning of Cohorts) ?

Le 14 janvier 2020, Google a annoncé son intention d’ajouter une API appelée Federated Learning of Cohorts (FLoC) à son na­vi­ga­teur Chrome. Le but de cette interface : permettre aux uti­li­sa­teurs de voir des pu­bli­ci­tés basées sur leurs centres d’intérêt sans que le na­vi­ga­teur ne s’appuie sur des cookies de suivi pour le faire. En effet, ces derniers portent gravement atteinte à la vie privée. Ainsi, l’API FLoC repose sur un al­go­rithme qui place les uti­li­sa­teurs du na­vi­ga­teur dans dif­fé­rentes cohortes. Les membres d’une cohorte, qui sont sem­blables à des groupes d’intérêt, pré­sen­tent un com­por­te­ment similaire sur Internet. L’iden­ti­fiant de cohorte respectif (anglais : cohort id) est censé permettre à Google et à ses par­te­naires pu­bli­ci­taires de diffuser ul­té­rieu­re­ment des pu­bli­ci­tés per­ti­nentes dans le respect de la vie privée, con­for­mé­ment au règlement ePrivacy et au nouveau RGPD.

Note

Les cohortes ne sont en aucun cas un nouveau moyen d’analyse du Web. Dans le domaine du commerce élec­tro­nique en par­ti­cu­lier, l’analyse de cohorte est utilisée depuis des années pour obtenir un aperçu rapide du com­por­te­ment de dif­fé­rents groupes d’uti­li­sa­teurs.

Pourquoi FLoC constitue-t-il une nouvelle méthode de publicité per­son­na­li­sée ?

Les pu­bli­ci­tés sont in­dis­pen­sables : elles per­met­tent à de nom­breuses en­tre­prises de générer du trafic pour leur projet Web et à de nombreux créateurs de contenus de gagner de l’argent. De leur côté, les uti­li­sa­teurs préfèrent les pu­bli­ci­tés per­ti­nentes et utiles. Des solutions comme les cookies ou le browser fin­ger­prin­ting cons­ti­tuent à ce jour la méthode la plus simple et la plus ciblée pour créer les profils d’uti­li­sa­teurs né­ces­saires. Cependant, elles sont cri­ti­quées à juste titre en raison de leur intrusion dans la vie privée des uti­li­sa­teurs de na­vi­ga­teurs. FLoC promet une approche al­ter­na­tive qui pourrait sa­tis­faire les an­non­ceurs, les éditeurs et les uti­li­sa­teurs, tout en ga­ran­tis­sant le respect de la vie privée.

Comment fonc­tionne Federated Learning of Cohorts ?

L’al­go­rithme, com­po­sante élé­men­taire de la tech­no­lo­gie FLoC, est à l’état ex­pé­ri­men­tal, mais il devrait fonc­tion­ner ainsi : sur la base de l’his­to­rique de na­vi­ga­tion, il est censé attribuer à un uti­li­sa­teur un iden­ti­fiant de cohorte re­pré­sen­ta­tif de ses intérêts. Pour éviter que l’uti­li­sa­teur ne soit reconnu sur la base de cet iden­ti­fiant, il doit partager cet iden­ti­fiant avec au moins x autres uti­li­sa­teurs de Chrome (le nombre concret n’est pas encore connu). Sur la base de cet iden­ti­fiant, les éditeurs et les an­non­ceurs peuvent alors lire les intérêts res­pec­tifs et placer des pu­bli­ci­tés ap­pro­priées, etc.

Google se base sur les principes suivants pour dé­ve­lop­per et élaborer l’al­go­rithme :

  1. L’ID de cohorte est destiné à empêcher le suivi intersite, c’est-à-dire la collecte du com­por­te­ment de l’uti­li­sa­teur sur plusieurs sites Web.
  2. Une cohorte est destinée à regrouper les uti­li­sa­teurs ayant un com­por­te­ment de na­vi­ga­tion similaire.
  3. L’al­go­rithme doit être basé sur l’ap­pren­tis­sage non supervisé, c’est-à-dire qu’il doit être capable d’« apprendre tout seul » sans in­ter­ven­tion ex­té­rieure.
  4. L’al­go­rithme doit limiter au maximum l’uti­li­sa­tion de « nombres magiques », en d’autres termes : être défini par un choix de pa­ra­mètres aussi simple et clair que possible.
  5. Le calcul d’une cohorte FLoC doit être aussi simple que possible et né­ces­si­ter peu d’effort de calcul.

Ces principes ga­ran­tis­sent que la création et la gestion des groupes d’intérêt sont trans­pa­rentes et faciles à com­prendre et ne peuvent être in­fluen­cées de l’extérieur. De plus, ils visent à garantir la meilleure pro­tec­tion possible des données : selon les principes de FLoC, les données relatives aux uti­li­sa­teurs sont toujours col­lec­tées et ex­ploi­tées, mais les uti­li­sa­teurs sont ano­ny­mi­sés au sein de leur cohorte.

Exemple du principe FLoC

Utilisons un exemple concret pour illustrer le fonc­tion­ne­ment du Federated Learning of Cohorts de Google. Voici les dif­fé­rents acteurs de base dans notre exemple du système FLoC :

  • Uti­li­sa­teur 1 : uti­li­sa­teur du na­vi­ga­teur affecté à la cohorte 123 ; il veut acheter des chaus­sures de sport en ligne.
  • Uti­li­sa­teur 2 : uti­li­sa­teur du na­vi­ga­teur également affecté à la cohorte 123 ; il veut se tenir au courant des dernières nouvelles en ligne.
  • Annonceur : magasin de mode en ligne qui place des annonces pour ses produits sur d’autres sites Web en utilisant des pla­te­formes pu­bli­ci­taires.
  • Éditeur : site d’in­for­ma­tion qui publie les dernières nouvelles et affiche des pu­bli­ci­tés, notamment celles de la boutique de mode en ligne.
  • Pla­te­forme pu­bli­ci­taire : pla­te­forme qui fournit des outils et des données pour diffuser des pu­bli­ci­tés ; elle sert d’in­ter­mé­diaire entre l’annonceur et l’éditeur.

Étape 1 : gé­né­ra­tion de la cohorte

Dans la première étape, le na­vi­ga­teur, ou l’al­go­rithme FLoC sur lequel il s’appuie, crée les dif­fé­rentes cohortes selon les centres d’intérêt. Chaque cohorte reçoit un iden­ti­fiant unique.

Étape 2 : at­tri­bu­tion de l’iden­ti­fiant de la cohorte

Sur la base de l’his­to­rique de na­vi­ga­tion de l’uti­li­sa­teur 1, le na­vi­ga­teur détermine la cohorte cor­res­pon­dante, dans ce cas l’iden­ti­fiant 123. Le na­vi­ga­teur de l’uti­li­sa­teur 2 analyse également l’his­to­rique d’uti­li­sa­tion pour attribuer l’iden­ti­fiant cor­res­pon­dant. Bien que son his­to­rique soit lé­gè­re­ment différent de celui de l’uti­li­sa­teur 1, il présente suf­fi­sam­ment de si­mi­li­tudes pour que l’uti­li­sa­teur 2 se voie également attribuer l’iden­ti­fiant FLoC 123.

Étape 3 : visite de la boutique en ligne (annonceur)

L’uti­li­sa­teur 1 commence sa recherche sur le Web pour des chaus­sures de sport. Il tombe sur la boutique en ligne de l’annonceur et parcourt la gamme de chaus­sures de sport et les articles connexes qui lui sont proposés. L’annonceur reçoit l’iden­ti­fiant de la cohorte de l’uti­li­sa­teur 1 et partage les con­nais­sances acquises sur le com­por­te­ment d’uti­li­sa­tion des membres de la cohorte 123 avec la pla­te­forme pu­bli­ci­taire avec laquelle il coopère dans le cadre du placement des annonces.

Étape 4 : visite de la page d’ac­tua­li­tés (éditeur)

L’uti­li­sa­teur 2 atterrit sur le site d’in­for­ma­tion de notre exemple d’éditeur à la recherche des dernières ac­tua­li­tés et transmet au passage son iden­ti­fiant de cohorte à l’éditeur. Afin de diffuser des pu­bli­ci­tés per­son­na­li­sées à l’uti­li­sa­teur 2, il s’adresse à la même pla­te­forme pu­bli­ci­taire que la boutique en ligne. L’éditeur transmet également l’iden­ti­fiant FLoC 123.

Étape 5 : iden­ti­fi­ca­tion de la publicité per­son­na­li­sée ap­pro­priée (pla­te­forme pu­bli­ci­taire)

Le four­nis­seur du réseau pu­bli­ci­taire peut main­te­nant dé­ter­mi­ner la publicité ap­pro­priée pour l’uti­li­sa­teur 2, pour lequel il dispose des données suivantes grâce au Federated Learning of Cohorts :

  • L’iden­ti­fiant de cohorte de l’uti­li­sa­teur 2 (123), transmis par l’éditeur
  • Des données propres sur les intérêts des uti­li­sa­teurs de la cohorte 123
  • Les données trans­mises par l’annonceur (boutique en ligne) sur les intérêts des produits (chaus­sures de course) des uti­li­sa­teurs de la cohorte 123

La pla­te­forme pu­bli­ci­taire détermine qu’une publicité pour les chaus­sures de course de la boutique en ligne convient également à l’uti­li­sa­teur 2, qui la voit im­mé­dia­te­ment sur le site d’in­for­ma­tion, tout cela sans uti­li­sa­tion de cookies.

FLoC et pro­tec­tion des données : une symbiose parfaite ?

À première vue, Federated Learning of Cohorts semble être la solution parfaite pour diviser les uti­li­sa­teurs de na­vi­ga­teurs en groupes d’intérêt sans trop empiéter sur leur vie privée. Google ne semble pas douter de cette hypothèse, du moins pour le marché américain où le système FLoC se prépare à être lancé. Les annonces du réseau pu­bli­ci­taire Google Ads basées sur la tech­no­lo­gie FLoC seront diffusées à titre d’essai dès le deuxième trimestre 2021.

Pendant ce temps, Google a mis en attente les tests de son Federated Learning of Cohorts en Europe. Le problème principal : il est difficile de dé­ter­mi­ner quelle partie est un con­trô­leur de données et quelle partie est un pro­ces­seur de données lors de la création de cohortes. Si l’on examine la situation juridique eu­ro­péenne en matière de pro­tec­tion des données et de la vie privée, c’est loin d’être le seul point de discorde : l’iden­ti­fiant de cohorte attribué qui relie les uti­li­sa­teurs à un groupe d’intérêt, ainsi que toutes les in­for­ma­tions connexes, pour­raient po­ten­tiel­le­ment être con­si­dé­rés comme des « données à caractère personnel ». En outre, le trai­te­ment des données col­lec­tées et utilisées pour générer les cohortes pourrait également violer les di­rec­tives du RGPD, à moins que Google n’obtienne le con­sen­te­ment des uti­li­sa­teurs.

Cependant, le res­pon­sable du produit Privacy Sandbox de Google, Marshall Vale, a déclaré en mars 2021 :

Citation

„It’s the start. We are working to begin testing in Europe as soon as possible. We are 100% committed to the Privacy Sandbox in Europe.“ – Marshall Vale, mars 2021, Source : https://twitter.com/mar­shall­vale/status/1374494962646020098

Tra­duc­tion : C’est le début. Nous nous employons à commencer les tests en Europe dès que possible. Nous nous engageons à 100% dans le Privacy Sandbox en Europe. (Traduit par IONOS)

Les res­pon­sables de Google sont donc con­vain­cus que les tests FLoC en Europe pourront également commencer bientôt.

Les ges­tion­naires de sites Web ont-ils la pos­si­bi­lité de bloquer FLoC ?

En tant que ges­tion­naire d’un site Web, vous aurez la pos­si­bi­lité de vous inscrire ou de vous dé­sins­crire du Federated Learning of Cohorts. Cela signifie que c’est à vous de décider si la visite de votre site Web ou de votre boutique en ligne doit être incluse ou non dans la structure des cohortes FLoC. Il s’agit d’un point important, en par­ti­cu­lier pour les sites Web traitant de sujets sensibles. De plus, Google veut inclure une instance de pro­tec­tion centrale qui supprime au­to­ma­ti­que­ment certaines cohortes si elles comptent un nombre élevé d’uti­li­sa­teurs qui visitent des sites Web dans des ca­té­go­ries sensibles. Par exemple, le géant des moteurs de recherche considère les dif­fi­cul­tés fi­nan­cières ou la santé mentale comme des ca­té­go­ries sensibles.

Vous pouvez vous retirer de FLoC en ajoutant l’entrée suivante dans l’en-tête Per­mis­sions-Policy :

interest-cohort=()

Si vous avez bloqué la technique FLoC mais que vous souhaitez l’autoriser à nouveau, il suffit de supprimer l’entrée de l’en-tête.

Note

Lors des pré­cé­dents tests FLoC dans Chrome, les sites Web qui ne s’étaient pas exclus de la méthode étaient au­to­ma­ti­que­ment inclus dans le calcul de la cohorte si Chrome détectait qu’il s’agissait de sites Web chargeant des pu­bli­ci­tés ou des res­sources liées à la publicité.

Aller au menu principal