FLoC : qu’est-ce que le Federated Learning of Cohorts ?

Le 25 janvier 2021, Google a présenté en détail sa propre vision d’un Web sans cookies, mais toujours rempli de publicité. Le géant des moteurs de recherche décrit dans son article de blog « Building a privacy-first future for web advertising » comment la publicité personnalisée fonctionnera lorsque les cookies tiers ne seront plus pris en charge. La méthode dite Federated Learning of Cohorts (FLoC) est une composante élémentaire du Privacy Sandbox prévu.

Nous vous expliquons ce qui se cache derrière FLoC, ainsi que le fonctionnement de cette alternative respectueuse de la vie privée pour la création et l’utilisation de profils d’utilisateurs individuels.

Qu’est-ce que FLoC (Federated Learning of Cohorts) ?

Le 14 janvier 2020, Google a annoncé son intention d’ajouter une API appelée Federated Learning of Cohorts (FLoC) à son navigateur Chrome. Le but de cette interface : permettre aux utilisateurs de voir des publicités basées sur leurs centres d’intérêt sans que le navigateur ne s’appuie sur des cookies de suivi pour le faire. En effet, ces derniers portent gravement atteinte à la vie privée. Ainsi, l’API FLoC repose sur un algorithme qui place les utilisateurs du navigateur dans différentes cohortes. Les membres d’une cohorte, qui sont semblables à des groupes d’intérêt, présentent un comportement similaire sur Internet. L’identifiant de cohorte respectif (anglais : cohort id) est censé permettre à Google et à ses partenaires publicitaires de diffuser ultérieurement des publicités pertinentes dans le respect de la vie privée, conformément au règlement ePrivacy et au nouveau RGPD.

Note

Les cohortes ne sont en aucun cas un nouveau moyen d’analyse du Web. Dans le domaine du commerce électronique en particulier, l’analyse de cohorte est utilisée depuis des années pour obtenir un aperçu rapide du comportement de différents groupes d’utilisateurs.

Pourquoi FLoC constitue-t-il une nouvelle méthode de publicité personnalisée ?

Les publicités sont indispensables : elles permettent à de nombreuses entreprises de générer du trafic pour leur projet Web et à de nombreux créateurs de contenus de gagner de l’argent. De leur côté, les utilisateurs préfèrent les publicités pertinentes et utiles. Des solutions comme les cookies ou le browser fingerprinting constituent à ce jour la méthode la plus simple et la plus ciblée pour créer les profils d’utilisateurs nécessaires. Cependant, elles sont critiquées à juste titre en raison de leur intrusion dans la vie privée des utilisateurs de navigateurs. FLoC promet une approche alternative qui pourrait satisfaire les annonceurs, les éditeurs et les utilisateurs, tout en garantissant le respect de la vie privée.

Comment fonctionne Federated Learning of Cohorts ?

L’algorithme, composante élémentaire de la technologie FLoC, est à l’état expérimental, mais il devrait fonctionner ainsi : sur la base de l’historique de navigation, il est censé attribuer à un utilisateur un identifiant de cohorte représentatif de ses intérêts. Pour éviter que l’utilisateur ne soit reconnu sur la base de cet identifiant, il doit partager cet identifiant avec au moins x autres utilisateurs de Chrome (le nombre concret n’est pas encore connu). Sur la base de cet identifiant, les éditeurs et les annonceurs peuvent alors lire les intérêts respectifs et placer des publicités appropriées, etc.

Google se base sur les principes suivants pour développer et élaborer l’algorithme :

  1. L’ID de cohorte est destiné à empêcher le suivi intersite, c’est-à-dire la collecte du comportement de l’utilisateur sur plusieurs sites Web.
  2. Une cohorte est destinée à regrouper les utilisateurs ayant un comportement de navigation similaire.
  3. L’algorithme doit être basé sur l’apprentissage non supervisé, c’est-à-dire qu’il doit être capable d’« apprendre tout seul » sans intervention extérieure.
  4. L’algorithme doit limiter au maximum l’utilisation de « nombres magiques », en d’autres termes : être défini par un choix de paramètres aussi simple et clair que possible.
  5. Le calcul d’une cohorte FLoC doit être aussi simple que possible et nécessiter peu d’effort de calcul.

Ces principes garantissent que la création et la gestion des groupes d’intérêt sont transparentes et faciles à comprendre et ne peuvent être influencées de l’extérieur. De plus, ils visent à garantir la meilleure protection possible des données : selon les principes de FLoC, les données relatives aux utilisateurs sont toujours collectées et exploitées, mais les utilisateurs sont anonymisés au sein de leur cohorte.

Exemple du principe FLoC

Utilisons un exemple concret pour illustrer le fonctionnement du Federated Learning of Cohorts de Google. Voici les différents acteurs de base dans notre exemple du système FLoC :

  • Utilisateur 1 : utilisateur du navigateur affecté à la cohorte 123 ; il veut acheter des chaussures de sport en ligne.
  • Utilisateur 2 : utilisateur du navigateur également affecté à la cohorte 123 ; il veut se tenir au courant des dernières nouvelles en ligne.
  • Annonceur : magasin de mode en ligne qui place des annonces pour ses produits sur d’autres sites Web en utilisant des plateformes publicitaires.
  • Éditeur : site d’information qui publie les dernières nouvelles et affiche des publicités, notamment celles de la boutique de mode en ligne.
  • Plateforme publicitaire : plateforme qui fournit des outils et des données pour diffuser des publicités ; elle sert d’intermédiaire entre l’annonceur et l’éditeur.

Étape 1 : génération de la cohorte

Dans la première étape, le navigateur, ou l’algorithme FLoC sur lequel il s’appuie, crée les différentes cohortes selon les centres d’intérêt. Chaque cohorte reçoit un identifiant unique.

Étape 2 : attribution de l’identifiant de la cohorte

Sur la base de l’historique de navigation de l’utilisateur 1, le navigateur détermine la cohorte correspondante, dans ce cas l’identifiant 123. Le navigateur de l’utilisateur 2 analyse également l’historique d’utilisation pour attribuer l’identifiant correspondant. Bien que son historique soit légèrement différent de celui de l’utilisateur 1, il présente suffisamment de similitudes pour que l’utilisateur 2 se voie également attribuer l’identifiant FLoC 123.

Étape 3 : visite de la boutique en ligne (annonceur)

L’utilisateur 1 commence sa recherche sur le Web pour des chaussures de sport. Il tombe sur la boutique en ligne de l’annonceur et parcourt la gamme de chaussures de sport et les articles connexes qui lui sont proposés. L’annonceur reçoit l’identifiant de la cohorte de l’utilisateur 1 et partage les connaissances acquises sur le comportement d’utilisation des membres de la cohorte 123 avec la plateforme publicitaire avec laquelle il coopère dans le cadre du placement des annonces.

Étape 4 : visite de la page d’actualités (éditeur)

L’utilisateur 2 atterrit sur le site d’information de notre exemple d’éditeur à la recherche des dernières actualités et transmet au passage son identifiant de cohorte à l’éditeur. Afin de diffuser des publicités personnalisées à l’utilisateur 2, il s’adresse à la même plateforme publicitaire que la boutique en ligne. L’éditeur transmet également l’identifiant FLoC 123.

Étape 5 : identification de la publicité personnalisée appropriée (plateforme publicitaire)

Le fournisseur du réseau publicitaire peut maintenant déterminer la publicité appropriée pour l’utilisateur 2, pour lequel il dispose des données suivantes grâce au Federated Learning of Cohorts :

  • L’identifiant de cohorte de l’utilisateur 2 (123), transmis par l’éditeur
  • Des données propres sur les intérêts des utilisateurs de la cohorte 123
  • Les données transmises par l’annonceur (boutique en ligne) sur les intérêts des produits (chaussures de course) des utilisateurs de la cohorte 123

La plateforme publicitaire détermine qu’une publicité pour les chaussures de course de la boutique en ligne convient également à l’utilisateur 2, qui la voit immédiatement sur le site d’information, tout cela sans utilisation de cookies.

FLoC et protection des données : une symbiose parfaite ?

À première vue, Federated Learning of Cohorts semble être la solution parfaite pour diviser les utilisateurs de navigateurs en groupes d’intérêt sans trop empiéter sur leur vie privée. Google ne semble pas douter de cette hypothèse, du moins pour le marché américain où le système FLoC se prépare à être lancé. Les annonces du réseau publicitaire Google Ads basées sur la technologie FLoC seront diffusées à titre d’essai dès le deuxième trimestre 2021.

Pendant ce temps, Google a mis en attente les tests de son Federated Learning of Cohorts en Europe. Le problème principal : il est difficile de déterminer quelle partie est un contrôleur de données et quelle partie est un processeur de données lors de la création de cohortes. Si l’on examine la situation juridique européenne en matière de protection des données et de la vie privée, c’est loin d’être le seul point de discorde : l’identifiant de cohorte attribué qui relie les utilisateurs à un groupe d’intérêt, ainsi que toutes les informations connexes, pourraient potentiellement être considérés comme des « données à caractère personnel ». En outre, le traitement des données collectées et utilisées pour générer les cohortes pourrait également violer les directives du RGPD, à moins que Google n’obtienne le consentement des utilisateurs.

Cependant, le responsable du produit Privacy Sandbox de Google, Marshall Vale, a déclaré en mars 2021 :

Citation

„It’s the start. We are working to begin testing in Europe as soon as possible. We are 100% committed to the Privacy Sandbox in Europe.“ – Marshall Vale, mars 2021, Source : https://twitter.com/marshallvale/status/1374494962646020098

Traduction : C’est le début. Nous nous employons à commencer les tests en Europe dès que possible. Nous nous engageons à 100% dans le Privacy Sandbox en Europe. (Traduit par IONOS)

Les responsables de Google sont donc convaincus que les tests FLoC en Europe pourront également commencer bientôt.

Les gestionnaires de sites Web ont-ils la possibilité de bloquer FLoC ?

En tant que gestionnaire d’un site Web, vous aurez la possibilité de vous inscrire ou de vous désinscrire du Federated Learning of Cohorts. Cela signifie que c’est à vous de décider si la visite de votre site Web ou de votre boutique en ligne doit être incluse ou non dans la structure des cohortes FLoC. Il s’agit d’un point important, en particulier pour les sites Web traitant de sujets sensibles. De plus, Google veut inclure une instance de protection centrale qui supprime automatiquement certaines cohortes si elles comptent un nombre élevé d’utilisateurs qui visitent des sites Web dans des catégories sensibles. Par exemple, le géant des moteurs de recherche considère les difficultés financières ou la santé mentale comme des catégories sensibles.

Vous pouvez vous retirer de FLoC en ajoutant l’entrée suivante dans l’en-tête Permissions-Policy :

interest-cohort=()

Si vous avez bloqué la technique FLoC mais que vous souhaitez l’autoriser à nouveau, il suffit de supprimer l’entrée de l’en-tête.

Note

Lors des précédents tests FLoC dans Chrome, les sites Web qui ne s’étaient pas exclus de la méthode étaient automatiquement inclus dans le calcul de la cohorte si Chrome détectait qu’il s’agissait de sites Web chargeant des publicités ou des ressources liées à la publicité.