Cloudflare Zaraz launches new privacy features in response to French CNIL standards

La semaine dernière, l'autorité nationale française chargée de la protection des données (la Commission nationale de l'informatique et des libertés ou « CNIL ») a publié des lignes directrices décrivant ce qu'elle considère être un moyen conforme au RGPD de charger Google Analytics et d'autres outils de mesure d'audience web. La publication de ces lignes directrices fait suite à l'émission (par la CNIL et d'autres autorités de protection des données et à l'encontre d'entreprises utilisatrices de Google Analytics) de plusieurs avertissements stipulant qu'une telle utilisation engendrait des transferts de données vers les États-Unis sans garanties suffisantes pour les droits des utilisateurs européens. C'est donc avec plaisir que nous annonçons aujourd'hui le lancement d'un ensemble de fonctionnalités, ainsi que la publication d'un guide expliquant de manière pratique et détaillée l'implémentation de Zaraz. Nous pensons que ces outils permettront aux entreprises de continuer à utiliser Google Analytics et les technologies similaires d'une manière visant à protéger la confidentialité des données personnelles de l'utilisateur final et à empêcher leur envoi vers les États-Unis. Et, avantage non négligeable : le déploiement de ces fonctionnalités ne prend pas plus d'une minute.

Et c'est ici qu'intervient Cloudflare Zaraz

Les nouvelles fonctionnalités de confidentialité de Zaraz

La nouvelle série de fonctionnalités que nous lançons aujourd'hui est conçue pour aider nos clients à renforcer la protection de la vie privée des utilisateurs finaux. À compter de ce jour, le tableau de bord de Zaraz vous permet d'appliquer les paramètres de configuration suivants :

  • Suppression des paramètres de requête d'URL : une fois la fonctionnalité activée, la solution Zaraz supprimera tout paramètre contenu dans les URL collectées (par exemple UTM ou glcid) pouvant participer à la génération d'une empreinte (ou fingerprint). Elle transformera ainsi « https://example.com/?q=hello » en « https://example.com ». Ce paramètre s'appliquera à l'ensemble de vos intégrations Zaraz.
  • Masquage de l'adresse IP d'origine : depuis quelque temps maintenant, il est tout à fait possible d'utiliser Zaraz pour charger intégralement les outils du type Google Analytics côté serveur, tout en masquant les adresses IP des visiteurs aux yeux de Google et de Facebook. Cette opération empêchera ainsi l'envoi de l'adresse IP d'un visiteur vers le serveur du fournisseur d'un outil tiers. Actuellement proposée pour Google Analytics Universal, Google Analytics 4 et Facebook Pixel, cette fonctionnalité sera implémentée au fur et à mesure sur les autres intégrations Zaraz. Au lieu de masquer les adresses IP des visiteurs, vous pouvez configurer Zaraz de manière à tronquer ces adresses sur l'ensemble des outils. Jugée moins stricte, cette option est disponible sur la page des paramètres de Zaraz.
  • Nettoyage des « user-agent » : l'activation de cette fonction permettra à Zaraz d'éliminer les informations sensibles des « user-agent ». L'en-tête de requête User-Agent inclut des informations sur le visiteur qui accède au site, notamment son système d'exploitation, son navigateur et ses extensions. Zaraz « nettoie » cette chaîne en supprimant des éléments d'information (les numéros de version et les extensions, par exemple) pouvant participer à la génération d'une empreinte (ou fingerprint). Ce paramètre ne s'appliquera qu'aux intégrations côté serveur.
  • Suppression de l'information de site référent (ou « referer ») externe au site : cette fonctionnalité demande à Zaraz de masquer l'URL de site référent s'il est externe aux yeux des serveurs tiers. Si l'URL de site référent est sur le même domaine elle ne sera pas masquée, afin de conserver la précision de l'analyse et d'éviter le « fractionnement » de la session. Ce paramètre s'appliquera à l'ensemble de vos intégrations Zaraz.

Configuration de Google Analytics avec les nouvelles fonctionnalités de confidentialité

Nous avons rédigé ce guide afin de vous permettre de mettre facilement en œuvre nos nouvelles fonctionnalités lorsque vous utiliserez Google Analytics. Le guide s'appuiera sur la version Google Analytics Universal pour ses exemples, car le service Google Analytics Universal est largement utilisé par les clients de Zaraz. Vous pouvez suivre les mêmes principes pour configurer Facebook Pixel ou toute autre intégration côté serveur proposée par Zaraz.

Étape 1 : installez Zaraz sur votre site web

Zaraz se charge automatiquement sur chaque site web mis en proxy par Cloudflare (cloud orange). Aucune modification du code n'est nécessaire. Si votre site web n'est pas mis en proxy par Cloudflare, vous pouvez charger Zaraz manuellement à l'aide d'un élément de code JavaScript. Si vous êtes nouveau sur Cloudflare ou si vous n'êtes pas sûr de savoir si votre site est mis en proxy par Cloudflare, vous pouvez utiliser cette extension Chrome pour découvrir si votre site est mis en proxy ou non par Cloudflare.

Étape 2 : ajoutez Google Analytics à l'aide du tableau de bord de Zaraz

Tous les clients ont accès au tableau de bord de Zaraz. Par défaut, lorsque vous ajoutez le service Google Analytics à l'aide de la bibliothèque d'outils de Zaraz, ce dernier se chargera côté serveur. Nul besoin de configurer un environnement cloud ou un serveur de proxy, Zaraz s'occupe de cette opération pour vous. Lorsque vous ajoutez un outil, Zaraz commence par se charger sur votre site web et une requête est émise par le navigateur de l'utilisateur final à destination d'un Cloudflare Worker situé sur votre propre domaine. Cloudflare Workers est notre plateforme d'Edge Computing ; le Worker visé par la requête communiquera directement avec les serveurs de Google Analytics. Aucune communication directe n'aura lieu entre le navigateur d'un utilisateur final et les serveurs de Google. Si vous souhaitez en savoir plus sur le fonctionnement de Zaraz, n'hésitez pas à consulter nos articles précédents traitant de l'architecture unique de Zaraz et de la manière dont nous utilisons Workers. Il est important de prendre en compte que, d'après les directives de la CNIL, la « mise en proxy » de Google Analytics ne suffit pas en soi. Vous devrez prendre des mesures supplémentaires pour vous assurer de la bonne configuration de Google Analytics.

Étape 3 : configurez Google Analytics et masquez les adresses IP

Il vous suffit de saisir votre ID de suivi pour configurer Google Analytics. Vous devrez également activer l'option « Masquer l'adresse IP d'origine » sur la page des paramètres de Zaraz. Cette fonctionnalité empêchera l'outil d'envoyer l'adresse IP du visiteur à Google. Zaraz supprimera l'adresse IP du visiteur, avant qu'elle n'atteigne les serveurs de Google. Si vous souhaitez faire en sorte que Zaraz ne s'exécute qu'au sein de l'UE, renseignez-vous sur la Data Localization Suite de Cloudflare.
Selon vos besoins, vous pouvez bien entendu déployer des configurations plus complexes de Google Analytics, incluant diverses fonctionnalités, comme le suivi du commerce électronique, les dimensions et métriques personnalisées, les champs à définir, etc. Pour plus d'instructions, suivez ce guide.

Étape 4 : activez les nouvelles fonctionnalités de confidentialité de Zaraz

L'étape suivante consiste à activer l'ensemble des nouvelles fonctionnalités de confidentialité mentionnées plus haut. Pour ce faire, rendez-vous sur la page des paramètres de Zaraz, sous la section Privacy (Confidentialité).

Étape 5 : nettoyez votre configuration de Google Analytics

À cette étape, vous devrez prendre les mesures nécessaires pour « nettoyer » votre déploiement spécifique de Google Analytics. Nous avons dressé une liste de suggestions à votre intention afin de vous aider à préserver la confidentialité des utilisateurs finaux :

  • Ne mentionnez aucune information à caractère personnel (PII). Consultez les directives de la CNIL quant à l'anonymisation et déterminez comment les appliquer de votre côté. Il est probable que ce processus d'anonymisation rende l'identifiant unique particulièrement inutile pour la plupart des outils d'analyse. D'après nos recherches, les fonctionnalités telles que la vue « User-ID » de Google Analytics, par exemple, ne fonctionneront pas correctement avec ce type d'anonymisation. Le mieux dans ce type de cas serait potentiellement d'arrêter d'utiliser ces outils afin d'éviter les disparités et d'assurer la précision des analyses.
  • Si vous souhaitez masquer l'identifiant client (Client ID) de Google Analytics, rendez-vous sur la page des paramètres de Google Analytics, cliquez sur « Ajouter un champ » et sélectionnez « Client ID ». Pour remplacer le Client ID, vous pouvez insérer n'importe quelle chaîne en tant que valeur constante du champ. Veuillez noter que cette approche limitera vraisemblablement la capacité de Google à agréger les données et générera probablement des disparités en termes de décompte des sessions et des utilisateurs. Pourtant, nous avons observé certains clients utiliser Google Analytics pour compter le nombre d'événements et, à notre connaissance, l'opération devrait être possible avec ce paramètre.
  • Supprimez les identifiants intersites de votre implémentation. Il peut s'agir de divers éléments, comme l'identifiant unique de votre outil de CRM ou les paramètres de requête d'URL transmettant des identifiants afin de les partager entre différents domaines. Évitez la fonctionnalité de « suivi interdomaines » (cross-domain tracking) également connue sous le nom de « site linking ».
  • Veillez bien à ne pas inclure de données personnelles dans votre configuration personnalisée, ni au sein de votre implémentation. Nous vous recommandons de passer en revue la liste des dimensions personnalisées, des paramètres/propriétés des événements, des données relatives à l'e-commerce et des propriétés utilisateurs afin de vous assurer que ces éléments ne contiennent pas de données personnelles. Si ce processus nécessite une certaine quantité de travail manuel à l'heure actuelle, nous avons une bonne nouvelle pour vous. En effet, nous sommes sur le point d'annoncer un nouvel ensemble de fonctionnalités de confidentialité, le Zaraz Data Loss Prevention (l'ensemble de mesures de prévention des pertes de données de Zaraz), qui vous aidera à effectuer automatiquement cette opération, à l'échelle souhaitée. Restez à l'écoute !

Étape 6 : vous avez terminé ! 🎉

Au rang des autres éléments à prendre en considération, n'oubliez pas que la mise en œuvre des étapes décrites dans ce guide entraînera certaines limitations de votre capacité à utiliser Google Analytics. Le fait de ne pas collecter les paramètres et les référents UTM, par exemple, désactivera la possibilité de suivre les sources de trafic et les campagnes, le fait de ne pas suivre l'User ID vous empêchera d'utiliser la vue « User-ID », et ainsi de suite. Certaines entreprises trouveront ces limitations pour le moins extrêmes, mais comme pour bien d'autres aspects de la vie, tout est affaire de compromis. Nous avançons d'un pas vers un Internet plus orienté vers la confidentialité et ce n'est que le début. L'avènement de nouvelles contraintes réglementaires entraînera l'émergence de nouvelles technologies, qui donneront à leur tour naissance à de nouvelles capacités et fonctionnalités. Zaraz se fixe pour objectif d'ouvrir la voie dans ce domaine, en proposant des outils axés sur la confidentialité, capables d'assister les opérateurs de sites web et de protéger les utilisateurs finaux.

Nous vous recommandons d'en apprendre plus sur la Data Localization Suite de Cloudflare et la manière dont vous pouvez utiliser Zaraz pour conserver les données d'analyse au sein de l'UE.
Pour conclure, nous apprécierions vivement que vous nous fassiez part de vos commentaires concernant cette annonce ou de vos desiderata en matière de nouvelles fonctionnalités. Pour ce faire, n'hésitez pas à joindre le responsable de votre compte Cloudflare ou à nous contacter directement via notre compte Discord. La confidentialité réside au cœur de tout ce que notre équipe développe. Nous adoptons toujours une approche proactive en matière de protection de la vie privée. Nous considérons en effet que le concept de confidentialité ne doit pas uniquement reposer sur le fait de répondre aux différents règlements, mais aussi sur le développement de technologies capables d'aider nos clients à mieux protéger leurs utilisateurs. Le concept est de simplifier les mesures nécessaires au respect et à la protection de la confidentialité des informations personnelles des utilisateurs. En d'autres termes, contribuer à bâtir un Internet meilleur.

.