Découvrez Speed Brain : un outil permettant une accélération de 45 % du chargement des pages web

Chaque fois qu'un utilisateur consulte votre page web, il se lance dans une course visant à recevoir du contenu aussi rapidement que possible. Les performances sont un facteur essentiel qui influence la manière dont les visiteurs web interagissent avec votre site. D'aucuns penseront que le déplacement de contenu à travers le monde introduit une latence importante, cependant, depuis un certain temps, les vitesses de transmission réseau ont atteint leurs limites théoriques. Pour donner un élément de comparaison, les données de Cloudflare peuvent parcourir les 11 000 kilomètres qui séparent New York et Londres en 76 millisecondes, plus vite qu'un clin d'œil.

Toutefois, les retards de chargement des pages web persistent en raison de la complexité liée au traitement des requêtes, des réponses et des configurations. En plus de nos efforts d'amélioration en matière d'établissement de connexions, de compression, de matériel et de logiciels, nous avons mis au point un nouveau moyen de réduire la latence lors du chargement des pages en anticipant les interactions des visiteurs web avec une page web donnée.

Aujourd'hui, nous sommes particulièrement enthousiastes à l'idée de vous présenter le dernier coup d'accélération en matière de vitesse : Speed Brain. Il s'appuie sur l'API Speculation Rules pour précharger le contenu des probables navigations à venir de l'utilisateur. L'objectif principal de Speed Brain est de télécharger une page web dans la mémoire cache du navigateur avant qu'un utilisateur n'y accède, ce qui permet un chargement quasi instantané au moment de la véritable navigation.

Notre méthode de départ utilise un modèle prudent qui récupère à l'avance le contenu statique de la page suivante lorsqu'un utilisateur déclenche une action tangible ou un effectue un clic. Au cours du quatrième trimestre 2024 et au début de l'année 2025, nous proposerons des modèles de spéculation plus audacieux, tels que le prérendu spéculatif (pas uniquement la récupération de la page avant que la navigation n'ait lieu, mais son rendu complet) pour une expérience encore plus rapide. À terme, Speed Brain apprendra comment éliminer la latence de votre site web statique, sans aucune configuration, et comment travailler avec les navigateurs pour faire en sorte qu'il se charge le plus rapidement possible.

À titre d'exemple, imaginez un site web d'e-commerce qui vendrait des vêtements. Grâce aux informations fournies par nos journaux de requêtes à l'échelle mondiale, nous pouvons prédire avec une grande précision qu'un visiteur web type est susceptible de cliquer sur « chemises » lorsqu'il consulte la page parent « homme > vêtements ». Sur cette base, nous pouvons commencer à diffuser du contenu statique tel que des images avant même que l'acheteur ne clique sur le lien « chemises ». Ainsi, lorsqu'il finit inévitablement par cliquer, la page se charge instantanément. De récents tests en laboratoire concernant la mise en œuvre de notre modèle audacieux de chargement ont permis de mettre en évidence une accélération pouvant aller jusqu'à 75 % du LCP (Largest Contentful Paint), à savoir du temps de chargement et de rendu de l'élément visible le plus volumineux (comme une image, une vidéo ou un bloc de texte) dans le navigateur.

Le plus beau dans tout ça ? Nous mettons Speed Brain à disposition de tous les types d'offres, immédiatement et sans frais. Activez simplement la fonctionnalité Speed Brain pour votre site web depuis le tableau de bord ou l'API. Cela ressemble à de la magie, mais en coulisse, cela suppose beaucoup d'ingénierie intelligente.

Nous avons déjà activé Speed Brain par défaut sur tous les domaines gratuits, et nous constatons une réduction du LCP de 45 % pour les préchargements réussis. Les domaines associés à l'offre Pro, Business et Enterprise doivent activer manuellement Speed Brain. Si vous ne l'avez pas encore fait, nous vous recommandons vivement d'activer également Real User Measurements (RUM) dans votre tableau de bord afin de découvrir les performances de vos pages web qu'elles soient nouvelles ou qu'elles aient été améliorées. Cerise sur le gâteau, l'activation de RUM pour votre domaine nous permettra très prochainement de fournir des règles améliorées et personnalisées pour le préchargement et le prérendu de votre site web !

Vue d'ensemble du fonctionnement des navigateurs

Avant de discuter de la manière dont Speed Brain peut contribuer à charger du contenu à une vitesse exceptionnelle, nous devons prendre un peu de recul et examiner la complexité que suppose le chargement de contenu sur les navigateurs. Chaque fois qu'un utilisateur accède à votre page web, une série de cycles requête-réponse doit se produire.

Une fois que le navigateur a établi une connexion sécurisée avec un serveur, il envoie une requête HTTP afin de récupérer le document de base de la page web. Le serveur traite la requête, construit le document HTML nécessaire et le renvoie au navigateur dans la réponse.

Lorsque le navigateur reçoit un document HTML, il commence immédiatement à en analyser le contenu. Au cours de ce processus, il peut rencontrer des références à des ressources externes telles que des fichiers CSS, JavaScript, des images et des polices. Ces sous-ressources sont essentielles pour afficher correctement la page, aussi le navigateur émet-il des requêtes HTTP supplémentaires pour les récupérer. Toutefois, si ces ressources sont disponibles dans le cache du navigateur, le navigateur peut les récupérer localement, ce qui réduit considérablement la latence du réseau et améliore les temps de chargement des pages.

À mesure que le navigateur traite le code HTML, CSS et JavaScript, le moteur de rendu commence à afficher le contenu à l'écran. Une fois les éléments visuels de la page affichés, les interactions de l'utilisateur (comme le fait de cliquer sur un lien) invitent le navigateur à recommencer une grande partie de ce processus pour récupérer le nouveau contenu pour la page suivante. Ce flux de travail est typique de chaque session de navigation : pendant que les utilisateurs naviguent, le navigateur récupère et rend continuellement des ressources nouvelles ou non mises en cache, ce qui introduit un délai avant le chargement complet de la nouvelle page.

Prenons l'exemple d'un utilisateur accédant au site d'achat en ligne décrit ci-dessus. À mesure que l'acheteur passe de la page d'accueil à la section « hommes » du site, puis à la section « vêtements » et à la section « chemises », le temps consacré à la récupération de chacune des pages suivantes peut s'accumuler et contribuer au fait que l'acheteur quitte le site avant de finaliser la transaction.

Idéalement, la présence de pages préchargées et prérendues dans le navigateur au moment où l'utilisateur clique sur chacun de ces liens éliminerait une grande partie de l'impact sur la latence du réseau, en permettant au navigateur de charger instantanément le contenu et en offrant une expérience utilisateur plus fluide .

Attendez, j'ai déjà entendu cette histoire (comment sommes-nous arrivés à Speed Brain ?)

Nous savons ce que vous pensez. Nous utilisons le préchargement depuis des années. Plusieurs tentatives de préchargement spéculatives ont même eu lieu par le passé. Vous avez déjà entendu cette histoire. En quoi la situation est-elle différente à l'heure actuelle ?

Vous avez raison, bien sûr. Au fil des ans, les développeurs et les fournisseurs de navigateurs ont déployé des efforts constants pour optimiser les temps de chargement des pages et améliorer l'expérience utilisateur sur le web. De nombreuses techniques ont été développées, couvrant différentes couches de la pile Internet, de l'optimisation de la connectivité de la couche réseau au préchargement du contenu d'application au plus près du client.

Préchargement précoce : manque de données et de flexibilité

Le préchargement web est une de ces techniques qui existe depuis plus d'une décennie. Il repose sur l'hypothèse que certaines sous-ressources seront nécessaires dans un avenir proche, alors pourquoi ne pas les récupérer de manière proactive ? Cela peut aller de pages HTML à des images, des feuilles de style ou des scripts dont l'utilisateur peut avoir besoin lorsqu'il navigue sur un site web. En réalité, le principe de base de l'exécution spéculative n'est pas nouveau, car il s'agit d'une technique générale utilisée dans divers domaines de l'informatique depuis des années, la prédiction par branche dans des processeurs en est un parfait exemple.

Aux débuts du web, plusieurs solutions de préchargement personnalisées qui visaient à améliorer les performances ont vu le jour. Par exemple, en 2005, Google a lancé Google Web Accelerator, une application côté client dont l'objectif était d'accélérer la navigation pour les utilisateurs en haut débit. Bien qu'innovant, le projet fut de courte durée en raison de problèmes de confidentialité et de compatibilité (nous décrivons par la suite en quoi Speed Brain diffère). À l'époque, le préchargement prédictif manquait d'informations sur les données et de la prise en charge des API nécessaires pour capturer le comportement des utilisateurs, en particulier ceux qui traitent des actions sensibles telles que les suppressions ou les achats.

Listes statiques et efforts manuels

Traditionnellement, le préchargement était réalisé à l'aide de l'attribut <link rel="prefetch"> parmi les Resource Hints. Les développeurs devaient spécifier manuellement l'attribut de chaque page pour chaque ressource que le navigateur devait récupérer et mettre en cache à titre préventif. Cet effort manuel s'avérait laborieux, mais souvent il manquait aux développeurs la possibilité de savoir quelles ressources devaient être préchargées, ce qui limitait la pertinence des indications spécifiées.

Dans le même ordre d'idées, Cloudflare propose depuis 2015 une fonctionnalité de préchargement d'URL. Au lieu de les précharger dans le cache du navigateur, Cloudflare permet aux clients de précharger une liste statique de ressources dans le cache du CDN. Cette fonctionnalité permet de précharger les ressources avant qu'elles ne soient réellement nécessaires, généralement pendant les périodes d'inactivité ou lorsque les conditions du réseau sont favorables. Cependant, le préchargement CDN implique les mêmes problèmes puisque les clients doivent décider manuellement des ressources qui sont de bons candidats au préchargement pour chaque page qu'ils possèdent. Si la configuration n'est pas correcte, le préchargement de liens statiques peut devenir contreproductif et ralentir le temps de chargement de la page web .

Server Push et ses écueils

La fonctionnalité « server push » de HTTP/2 est née d'une autre tentative d'améliorer les performances web en envoyant les ressources au client avant qu'elles ne soient demandées. En théorie, cela devait permettre de réduire la latence en éliminant la nécessité d'allers-retours supplémentaires pour les ressources futures. Cependant, le caractère dictatorial et concentré sur le serveur de l'opération « push » consistant à envoyer des ressources vers le client a donné lieu à des difficultés considérables, principalement en raison du manque de contexte concernant les éléments déjà mis en cache dans le navigateur. Non seulement cela gaspillait de la bande passante, mais cela risquait de ralentir la livraison de ressources essentielles telles que le code HTML et le CSS de base, en raison des conditions de concurrence lors du chargement de la page par le navigateur. La solution proposée des cache digests, qui auraient informé les serveurs du contenu du cache des clients, n'a jamais été généralisée et a obligé les serveurs à « pousser » les ressources à l'aveugle. En octobre 2022, Google Chrome a annulé la prise en charge de Server Push, Firefox a fait la même chose en septembre 2024.

Un pas en avant avec Early Hints

Est arrivé ensuite Early Hints, présenté en 2017, mais il n'a été largement adopté qu'à partir de 2022, date à laquelle nous avons établi des partenariats avec des navigateurs et des clients clés pour le déployer. Il constitue une solution plus efficace en « indiquant » aux clients les ressources à charger, permettant ainsi une hiérarchisation plus précise en fonction des besoins du navigateur. Concrètement, le serveur envoie un code de statut HTTP 103 Early Hints avec une liste de ressources essentielles pour la page que le navigateur doit commencer à charger pendant que la réponse principale est encore en cours de préparation. Cela donne au navigateur une longueur d'avance pour récupérer les ressources essentielles et évite le préchargement redondant si des ressources sont déjà mises en cache. Early Hints ne s'adapte pas (encore) aux comportements des utilisateurs ou aux conditions de pages dynamiques, son utilisation se limite toutefois principalement au préchargement de ressources spécifiques et non de pages web complètes ; notamment lorsque la production du code HTML implique un long « temps de réflexion » du serveur.

À fur et à mesure de l'évolution du web, les outils capables de gérer des interactions dynamiques et complexes avec les utilisateurs deviendront de plus en plus importants afin de trouver un compromis entre les gains en performances liés à l'exécution spéculative et ses inconvénients potentiels pour les utilisateurs finaux. Pendant des années, Cloudflare a proposé des solutions basées sur les performances qui s'adaptaient au comportement des utilisateurs et contribuaient à équilibrer la vitesse et la précision des décisions sur l'ensemble d'Internet comme Argo smart routing, la mise en cache par niveau intelligente et Smart Placement. Aujourd'hui, nous faisons un nouveau pas vers un cadre adaptable pour une transmission de contenu ultra-rapide.

Speed Brain entre en scène : qu'est-ce qui le rend différent ?

Speed Brain apporte une solide méthode pour la mise en œuvre de stratégies de préchargement prédictif directement dans le navigateur, sur la base des règles renvoyées par nos serveurs. En s'appuyant sur les enseignements tirés des tentatives précédentes, la méthode transfère la responsabilité de la prédiction des ressources vers le client, permettant ainsi des optimisations plus dynamiques et personnalisées basées sur l'interaction de l'utilisateur (comme le survol d'un lien, par exemple) et les capacités de son appareil. Plutôt que de laisser le navigateur attendre que la page web suivante soit demandée par l'utilisateur, elle se renseigne sur la manière dont l'utilisateur interagit avec une page et commence à demander la page web suivante avant que l'utilisateur n'ait fini de cliquer sur un lien.

En coulisses, c'est l'API Speculation Rules qui rend la magie possible. Il s'agit d'une norme émergente dans le domaine des performances web de Google. Lorsque la fonction Speed Brain de Cloudflare est activée, un en-tête HTTP appelé Speculation-Rules est ajouté aux réponses de la page web. La valeur de cet en-tête est une URL qui héberge une configuration de règles dogmatique. Cette configuration demande au navigateur de lancer des requêtes de préchargement pour les navigations futures. Speed Brain n'améliore pas le temps de chargement de la première page visitée sur un site web, mais il peut l'améliorer pour les pages web qui sont consultées ensuite sur le même site.

L'idée semble assez simple, mais le préchargement n'est pas exempt de difficultés ; en effet, il arrive que certains éléments de contenu préchargé ne soient jamais utilisés. Avec la première version de Speed Brain, nous avons conçu une solution avec des garde-fous, qui permet de répondre à deux problèmes importants mais distincts qui limitaient les tentatives de spéculation par le passé : la configuration prefetch obsolète et le préchargement incorrect. La configuration de l’ API Speculation Rules que nous avons choisie pour cette version initiale a été soigneusement conçue pour maintenir un compromis entre la sécurité du préchargement et des règles applicables largement pour l’ensemble du site.

Configuration de préchargement obsolète

Les sites web changeant inévitablement avec le temps, les configurations de préchargement statiques deviennent souvent obsolètes, ce qui rend le préchargement inefficace. Cela s'est révélé particulièrement vrai pour les techniques telles que l'attribut rel=prefetch ou les ensembles d' URL de préchargement CDN statiques, qui obligeaient les développeurs à tenir à jour manuellement des listes d'URL préchargeables pertinentes pour chaque page de leur site web. La plupart des listes de préchargement statiques reposent sur l'intuition des développeurs plutôt que sur les données de navigation des utilisateurs réels, ce qui induit le risque de passer à côté d'importantes opportunités de préchargement ou de gaspiller des ressources avec des préchargements inutiles.

Préchargement incorrect

Les requêtes prefetch sont identiques aux requêtes normales, à la différence près qu'elles comportent un en-tête de requête HTTP sec-purpose, elles imposent donc la même surcharge pour le client, le réseau et le serveur. Cependant, la différence décisive réside dans le fait que les requêtes prefetch anticipent le comportement de l'utilisateur et que la réponse peut finalement ne pas être utilisée, de sorte que toute cette surcharge pourrait être gaspillée. Ce mode opératoire rend la précision du préchargement extrêmement importante, c'est-à-dire l'optimisation du pourcentage de pages préchargées qui finissent par être consultées par l'utilisateur. Un préchargement incorrect peut entraîner des dysfonctionnements et des coûts inutiles, tels que la mise en cache de ressources qui ne sont pas demandées ou le gaspillage de bande passante et de ressources réseau, ce qui est particulièrement critique sur les réseaux mobiles facturés ou dans les environnements à faible bande passante.

Garde-fous

Avec la première version de Speed Brain, nous avons prévu d'importants garde-fous destinés à prévenir les effets secondaires et qui éliminent complètement le risque de configuration prefetch obsolète en même temps qu'ils minimalisent le risque de préchargement incorrect. Cette configuration dogmatique est obtenue grâce aux règles de documentation et aux paramètres eagerness de l'API Speculation Rules. La configuration que nous avons choisie se présente comme suit :

{
  "prefetch": [{
    "source": "document",
    "where": {
      "and": [
        { "href_matches": "/*", "relative_to": "document" },
      ]
    },
    "eagerness": "conservative"
  }]
}

Règles de documentation

e Les règles de documentation, indiquées par "source": "document" et la clé "where" dans la configuration, permettent d'appliquer le préchargement de manière dynamique sur l'ensemble de la page web. Ceci élimine la nécessité d'une liste d' URL statique prédéfinie pour le préchargement. Par conséquent, nous éliminons le problème de la configuration de préchargement obsolète, car les liens candidats au préchargement sont déterminés en fonction de la structure de la page active.

L'utilisation que nous faisons de l'expression « relatif_to » : « document » dans la clause where indique au navigateur de limiter le préchargement aux liens d'un même site. Cela présente l'avantage supplémentaire de permettre à notre mise en œuvre d'éviter les préchargements d'origines croisées et ainsi d'éviter toute incidence sur la confidentialité des utilisateurs, car elle ne les suit pas sur le web.

Eagerness

Eagerness contrôle le degré d'empressement avec laquelle le navigateur précharge le contenu. Quatre configurations sont possibles :

immediate: utilisé dès que possible au chargement de la page ; généralement, dès que le navigateur voit la valeur de la règle, il commence à précharger la page suivante.
eager: identique au paramètre immédiat ci-dessus, mais le déclencheur de préchargement repose également sur de légers événements d'interaction de l'utilisateur, tels que le déplacement du curseur vers le lien (prochainement).
moderate: procède au préchargement si vous maintenez le pointeur sur un lien pendant plus de 200 millisecondes (ou à l'événement d'activation du pointeur, pointerdown si celui-ci intervient plus tôt, et sur des appareils mobiles en l'absence d'événement hover).
conservative: précharge lors de l'événement pointer ou touch down sur le lien.

Notre version initiale de Speed Brain s'appuie sur la valeur eagerness (empressement) conservative (prudente) pour maintenir au minimum le risque de préchargement incorrect, susceptible d'entraîner un gaspillage indésirable de ressources, tout en accélérant sensiblement vos sites web. Certes, nous ne voyons pas les améliorations de performances potentielles qu'offrent les paramètres d'empressement les plus audacieux, mais nous avons adopté cette démarche prudente pour donner la priorité à la sécurité de nos utilisateurs. À l'avenir, nous prévoyons d'explorer des paramètres d'empressement plus dynamiques pour les sites qui pourraient tirer profit d'un cadre plus libéral, et nous enrichirons également nos règles pour inclure le prérendu.

Nous mettons également en œuvre une autre mesure de protection importante qui consiste à n'accepter les requêtes prefetch que pour le contenu statique déjà stocké dans notre cache CDN . Si le contenu ne se trouve pas dans le cache, nous rejetons la requête prefetch. La récupération de contenu directement depuis notre cache CDN aux fins du préchargement des requêtes nous permet de contourner les problèmes d'éligibilité du cache de notre réseau. La raison à cela est simple : si une page n'est pas éligible à la mise en mise en cache, nous ne voulons pas qu'elle soit préchargée dans le cache du navigateur, car cela pourrait avoir des conséquences indésirables et provoquer une augmentation du chargement du serveur d'origine. Par exemple, le préchargement d'une page de déconnexion peut déconnecter l'utilisateur prématurément avant qu'il n'ait terminé son action. Les requêtes de préchargement ou de prérendu avec état peuvent avoir des effets imprévisibles, modifiant potentiellement l'état du serveur pour des actions que le client n'a pas confirmées. En n'autorisant le préchargement que pour les pages déjà présentes dans notre cache CDN, nous avons la certitude que ces pages n'affecteront pas l'expérience utilisateur.

Ces garde-fous ont été mis en place pour fonctionner dans des environnements sensibles aux performances. Nous avons mesuré l'incidence de notre modèle de déploiement prudent de référence sur toutes les pages de la documentation pour développeurs de Cloudflare au début du mois de juillet 2024. Nous avons constaté que nous étions capables de précharger le contenu correct, à savoir le contenu vers lequel l'utilisateur allait réellement naviguer dans 94 % des fois.Nous y sommes parvenus tout en améliorant les performances de la navigation avec une réduction de 40% du LCP au 75e quantile (p75), sans induire d'effets secondaires indésirables. Les résultats ont été impressionnants !

Expliquer la mise en œuvre de Cloudflare

Notre réseau mondial s’étend sur plus de 330 villes et s’exécute à moins de 50 millisecondes de 95 % de la population connectée à Internet. L'ampleur du champ d'action nous permet d'améliorer considérablement les performances des ressources qui peuvent être mises en cache pour nos clients. En utilisant ce réseau pour la préchargement intelligent avec Speed Brain, Cloudflare peut servir du contenu prérécupéré directement auprès du cache CDN, ce qui réduit la latence du réseau presque instantanément.

Notre position unique sur le réseau nous permet d'activer automatiquement Speed Brain sans que nos clients aient à modifier la configuration de leurs serveurs d'origine. Ce n'est pas plus compliqué que d'appuyer sur un interrupteur ! Notre première version de Speed Brain est désormais disponible.

À réception d'une requête pour une page web sur laquelle Speed Brain a été activé, le serveur Cloudflare renvoie un en-tête de réponse HTTP « Speculation Rules » supplémentaire. La valeur de cet en-tête correspond à une URL qui héberge une configuration de règles définies (comme il est évoqué précédemment).
Lorsque le navigateur commence à analyser l'en-tête de la réponse, il récupère notre configuration Speculation-Rules et la charge comme partie intégrante de la page web.
La configuration indique au navigateur quand précharger depuis Cloudflare la page vers laquelle le visiteur web a des chances de naviguer ensuite, en s'appuyant sur la façon dont le visiteur web interagit avec la page.
Lorsqu'une action de l'utilisateur (par exemple, un événement mouse-down sur le lien de la page suivante) déclenche l'application Rules, le navigateur envoie une requête Prefetch pour cette page avec l'en-tête de requête HTTP « SEC-purpose: prefetch ».
Notre serveur analyse l'en-tête de la requête afin d'identifier la requête prefetch. Si le contenu demandé est présent dans notre cache, nous le renvoyons ; dans le cas contraire, nous renvoyons un code de statut HTTP 503 et refusons la requête prefetch. Cette méthode élimine le risque d'effets secondaires dangereux liés à l'envoi de requêtes vers des serveurs d'origine ou des Cloudflare Workers qui ne sont pas au courant du préchargement. Seul le contenu présent exclusivement dans le cache est renvoyé.
En cas de réponse aboutie, le navigateur parvient à précharger le contenu en mémoire et, lorsque le visiteur web accède à cette page, le navigateur charge directement la page web à partir du cache du navigateur pour un rendu immédiat.

Logiques courantes pour la résolution des problèmes

La prise en charge de Speed Brain repose sur l'API Speculation Rules, une norme web émergente. En date de septembre 2024, la prise en charge de cette norme émergente est limitée aux navigateurs basés sur Chromium (version 121 ou ultérieure), tels que Google Chrome et Microsoft Edge. À mesure que la communauté web parviendra à un consensus sur la normalisation des API, nous espérons assister à une adoption plus large chez d'autres fournisseurs de navigateurs.

Par nature, le préchargement ne s'applique pas au contenu dynamique, car l'état de ce contenu peut changer, ce qui pourrait donner lieu à la transmission de données dépassées ou obsolètes à l'utilisateur final, ainsi qu'à une augmentation du chargement au niveau du serveur d'origine. Par conséquent, Speed Brain ne fonctionnera que pour les pages non dynamiques de votre site web qui sont mises en cache sur notre réseau. Il est sans incidence pour le chargement des pages dynamiques. Pour exploiter au mieux Speed Brain, nous vous suggérons d'avoir recours à des règles de cache pour vérifier que tout le contenu statique (notamment le contenu HTML) de votre site est éligible à la mise en cache.

Lorsque le navigateur reçoit un code de statut HTTP 503 en réponse à une requête de préchargement spéculative (marquée par l'en-tête section-purpose: prefetch), il annule la tentative de préchargement. L'apparition d'une erreur 503 dans la console du navigateur peut sembler alarmante, elle est toutefois totalement inoffensive pour l'annulation de requête prefetch. Lors de nos premiers tests, le code de réponse 503 a suscité des inquiétudes chez les propriétaires de sites. Nous travaillons avec nos partenaires à des itérations à ce sujet afin d'améliorer l'expérience client ; toutefois, pour l'instant, suivez la directive qui suggère une réponse 503 pour le navigateur, afin d'éliminer en toute sécurité la requête spéculative. Nous discutons activement avec Chrome sur la base des commentaires des premiers bêta-testeurs, et nous pensons qu’un nouveau code de réponse dédié aux erreurs serait plus approprié et entraînerait moins de confusion. En attendant, les journaux de réponses 503 pour les requêtes prefetch liées à Speed Brain sont sans importance. Si vos outils ne vous permettent pas d'ignorer facilement ces requêtes, vous pouvez désactiver temporairement la fonctionnalité Speed Brain jusqu'à ce que nous convenions d'une solution préférable avec l'équipe Chrome.

De plus, lorsqu’un site web utilise à la fois ses propres règles de spéculation personnalisées et la fonctionnalité Speed Brain de Cloudflare, les deux ensembles de règles peuvent fonctionner simultanément. Les garde-fous de Cloudflare limiteront les règles de spéculation aux pages pouvant être mises en cache ; une limitation qui pourra sembler inattendue pour ceux ayant déjà mis en œuvre les fonctionnalités. Si vous observez ce type de comportement, envisagez de désactiver l'une des mises en œuvre pour votre site, afin de garantir la cohérence du comportement. Sachez que si les réponses de votre serveur d'origine comprennent l'en-tête Speculation-Rules, il ne sera pas écrasé. Par conséquent, les conflits potentiels d'ensembles de règles concernent principalement les règles de spéculation internes prédéfinies.

Comment puis-je constater les effets de Speed Brain ?

En règle générale, nous vous suggérons d’utiliser Speed Brain et la plupart des fonctionnalités d’amélioration des performances de Cloudflare lorsque notre outil de mesure des performances RUM est activé. Notre fonctionnalité RUM aide les développeurs et les exploitants de site web à comprendre de quelle manière leurs utilisateurs finaux perçoivent les performances de leur application, en leur offrant une visibilité sur les éléments suivants :

Chargement : combien de temps a-t-il fallu pour que le contenu soit disponible ?
Interactivité : quelle est la réactivité du site web lorsque les utilisateurs interagissent avec lui ?
Stabilité visuelle: dans quelle mesure la page se déplace-t-elle pendant le chargement ?

Avec la fonctionnalité RUM activée, vous pouvez accéder à la section Web Analytics du tableau de bord pour consulter des informations importantes concernant la manière dont Speed Brain contribue à réduire la latence de vos indicateurs de signaux web essentiels tels que le Largest Contentful Paint (LCP) et le temps de chargement.

Exemple de tableau de bord RUM pour un site web avec une grande quantité de contenu préchargeable qui a activé Speed Brain autour du 16 septembre.

Qu'avons-nous constaté jusqu'ici au niveau du déploiement ?

Nous avons activé cette fonctionnalité par défaut dans toutes nos offres gratuites et avons constaté les faits suivants :

Domaines

Cloudflare compte actuellement des dizaines de millions de domaines utilisant Speed Brain. Nous avons mesuré le LCP au 75e quantile (p75) pour ces sites et avons constaté une amélioration pour ces sites allant de 40 à 50 % (moyenne d'environ 45 %).

Nous avons constaté cette amélioration en comparant les préchargements de navigation aux chargements de pages normaux (non préchargés) pour le même ensemble de domaines.

Requêtes

Avant que Speed Brain ne soit activé, le p75 des sites web gratuits sur Cloudflare présente un LCP d'environ 2,2 secondes. Lorsque Speed Brain est activé, la latence pour ces sites diminue grandement au niveau du LCP. Au total, Speed Brain permet d'économiser environ 0,88 seconde à l'extrémité inférieure et jusqu'à 1,1 seconde à chaque préchargement réussi !

Navigateurs applicables

Pour le moment, l'API Speculation Rules n'est disponible que dans les navigateurs Chromium. Dans Cloudflare Radar, nous pouvons voir qu'environ 70 % des requêtes de visiteurs web proviennent de navigateurs Chromium (Chrome, Edge, etc.).

Sur l'ensemble du réseau

Cloudflare observe des centaines de milliards de requêtes de contenu HTML chaque jour. Parmi ces requêtes, environ la moitié sont mises en cache (vérifiez vous que votre code HTML peut être mis en cache !). Environ 1 % de ces requêtes correspondent à du préchargement de navigation effectué par les visiteurs web. Cela représente des gains significatifs chaque jour pour les visiteurs web de sites web avec Speed Brain activé. Toutes les 24 heures, Speed Brain peut permettre de s'épargner plus de 82 ans de latence !

Et ensuite ?

La solution que nous proposons aujourd'hui au service Speed Brain n'est qu'un début. À l'horizon 2025, nous avons un certain nombre d'ajouts passionnants à explorer et à proposer.

Mettre à profit l'apprentissage automatique

Grâce à notre position unique sur Internet, nous disposons d'informations précieuses sur les logiques de navigation sur le web ; nous pouvons les exploiter pour améliorer les performances web tout en préservant la confidentialité de chaque utilisateur. En adoptant une démarche généralisée d'apprentissage automatique piloté par les données, nous pouvons définir des prédicteurs de préchargement plus précis et spécifiques au site pour les pages des utilisateurs.

Nous sommes actuellement en train de développer un modèle spéculatif adaptatif qui améliore considérablement notre offre prudente actuelle. Ce modèle applique une méthode compatible avec la nécessité de confidentialité pour générer un graphique de parcours d'utilisateur pour chaque site sur la base des en-têtes Referer du même site. Pour deux pages connectées par un saut de navigation, notre modèle prédit la probabilité qu'un utilisateur type se déplace de l'une à l'autre en se basant sur les informations extraites de nos données agrégées sur le trafic.

Ce modèle nous permet d'adapter des ensembles de règles comportant des valeurs eagerness (empressement) personnalisées pour chaque lien pertinent vers la page suivante de votre site. Pour les pages pour lesquelles le modèle prédit une grande confiance dans la navigation des utilisateurs, le système les préchargera ou les prérendra de manière audacieuse. Si le modèle ne fournit pas de règle pour une page, il s'en remet à notre démarche prudente existante, ce qui permet de conserver les avantages du modèle Speed Brain de base. Ces signaux guident les navigateurs lors du préchargement et du prérendu des pages appropriées, ce qui permet d'accélérer la navigation pour les utilisateurs tout en préservant nos garde-fous de sécurité actuels.

Lors de tests réalisés en laboratoire, notre modèle d'apprentissage automatique a amélioré la latence du LCP de 75 % et a prédit la navigation des visiteurs web avec une précision d'environ 98 %, garantissant ainsi le préchargement des pages appropriées afin d'éviter le gaspillage de ressources pour les utilisateurs. À mesure que nous développons cette solution, nous nous concentrons sur l'entraînement périodique du modèle afin de l'adapter à la diversité des comportements des utilisateurs et à l'évolution des sites web. L'utilisation d'une méthode d'apprentissage automatique en ligne réduira considérablement le besoin de mises à jour manuelles et de dérives de contenu, tout en préservant une grande précision ; la solution de chargement Speed Brain qui gagne en intelligence au fil du temps !

Une observabilité plus précise grâce au RUM

Comme nous l'avons mentionné, nous pensons que nos outils RUM offrent les meilleures informations sur la manière dont Speed Brain améliore les performances de votre site web. À l'avenir, notre objectif est de proposer la possibilité de filtres avec l'outil RUM par type de navigation, afin de vous permettre de comparer le rendu par le navigateur d'un contenu préchargé et d'un contenu non préchargé dans le navigateur.

Prérendu

Nous offrons actuellement la possibilité de précharger le contenu pouvant être mis en cache. Le préchargement télécharge la ressource principale du document de la page avant la navigation de l'utilisateur, mais il ne demande pas au navigateur de prérendre la page ni de télécharger d'autres sous-ressources.

À l'avenir, l'offre Speed Brain de Cloudflare ira précharger le contenu dans le cache de notre CDN et travaillera ensuite avec les navigateurs pour déterminer quelles sont les meilleures perspectives de prérendu. Cette opération permet d'obtenir un contenu statique encore plus proche d'un rendu instantané.

Argo Smart Browser : Speed Brain et Smart Routing

Speed Brain, dans sa mise en œuvre initiale, permet un incroyable gain de performances tout en restant prudent dans son déploiement ; tant du point de vue de l'empressement que de la consommation des ressources.

Comme il a été mentionné plus haut dans l'article, les tests en laboratoire d'un modèle plus audacieux, reposant sur l'apprentissage automatique et un plus grand empressement, ont permis de réduire de 75 % le LCP. Nous étudions la possibilité d'une intégration de cette mise en œuvre supplémentaire plus audacieuse de Speed Brain avec Argo Smart Routing dans un produit appelé «Argo Smart Browsing ».

Les clients de Cloudflare pourront continuer à utiliser Speed Brain, mais ceux qui souhaitent améliorer encore les performances pourront activer Argo Smart Browsing d'un simple clic. Avec cette solution, non seulement le contenu statique pouvant être mis en cache se charge jusqu'à 75 % plus rapidement dans le navigateur, grâce aux modèles les plus audacieux, mais pour les situations ne permettant pas la mise en cache et rendant obligatoire la transmission d'une requête à un serveur d'origine, le contenu sera acheminé via le chemin réseau le plus performant, ce qui donne lieu à une amélioration des performances de 33 % en moyenne. Les optimisations de performances sont appliquées à presque chaque segment du cycle de vie des requêtes, que le contenu soit statique ou dynamique, qu'il soit mis en cache ou non.

Conclusion

Pour débuter avec Speed Brain, suivez Vitesse > Optimisation > Optimisation de contenu > Speed Brain dans le tableau de bord Cloudflare et activez-le. C'est fini ! La fonctionnalité peut également être activée par le biais d'une API. Speed Brain est activé par défaut pour les domaines associés à une offre gratuite.

Nous recommandons vivement aux clients d'activer également RUM, que l'on peut retrouver dans la même section du tableau de bord, afin de profiter d'une visibilité sur les améliorations de performances apportées par Speed Brain et les autres fonctionnalités et produits Cloudflare.

Nous sommes ravis de continuer à développer des produits et des fonctionnalités qui rendent les performances web fiables et rapides. Si vous êtes ingénieur et intéressé par l'amélioration des performances du web pour tous, rejoignez-nous !

Le blog Cloudflare