Cloudflare est officiellement adolescente ! L'entreprise a été lancée le 27 septembre 2010. Aujourd'hui, nous fêtons notre treizième anniversaire. Comme il est de tradition pour nous, nous profitons de la semaine de notre anniversaire pour lancer des produits que nous considérons comme autant de cadeaux que nous faisons à Internet. Nous allons vous en dire plus sur ces annonces incroyables dans un instant mais nous souhaitons commencer par évoquer quelque chose de plus fondamental : notre identité.
À l'instar de nombreux enfants, il nous a fallu un certain temps pour comprendre réellement qui nous étions. Nous avons été agacés d'être placés dans des cases. De nombreuses personnes décrivaient Cloudflare comme une entreprise spécialisée dans la sécurité, ce à quoi nous répondions que « Notre activité ne se réduit pas à cela. » Ils disaient que nous étions un réseau et nous protestions que nous étions bien plus. Pire que tout, ils nous qualifiaient parfois de « CDN », et nous leur précisions que la mise en cache fait partie de tout système judicieusement conçu, mais qu'il ne s'agit pas d'une fonctionnalité en soi. Merci beaucoup.
Ainsi, hier, à la veille de notre treizième anniversaire, nous annoncions au monde que nous avions enfin pris conscience de ce que nous étions : une connectivité cloud.
La connectivité cloud
Qu’est-ce que cela signifie ? Le terme « connectivité » signifie que nous avons toutes les qualités requises pour connecter les personnes et les objets entre eux. Notre rôle ne consiste pas à devenir la destination finale de vos données, mais de leur permettre de circuler. Peu importent les applications, les données, les personnes, les lieux et les moments ; ils sont tous au cœur de la connectivité et Internet en a toujours fait la promesse.
Avec le « Cloud », tout est compris. Il évolue avec vous. Il est programmable. Il intègre une sécurité constante. Il est intelligent et s'enrichit à mesure que vous et d'autres l'utilisez et optimise les résultats, mieux que vous ne pourriez le faire par vous-même.
Notre connectivité cloud soutient la comparaison avec d'autres clouds. Les fameux clouds publics à grande échelle, font par bien des aspects totalement le contraire. Ils optimisent en accaparant vos données. En les enfermant. Ce qui entrave leur circulation. Ce sont des clouds de captivité. Et, s'ils sont formidables pour certaines choses, l'ensemble de leur potentiel ne peut pleinement profiter aux clients que s'ils sont associés à une connectivité cloud qui vous permet de combiner et d'associer le meilleur de chacune de leurs fonctionnalités.
Préparer l'avenir
C'est ce que nous observons chez les start-up les plus en vue actuellement. De nombreuses entreprises leaders dans le domaine de l'IA ont recours à la connectivité cloud de Cloudflare pour déplacer leurs données d'entraînement là où la capacité de processeur graphique se trouve en excès. Nous estimons que parmi les start-up spécialisées dans l'IA, Cloudflare est le fournisseur de Cloud le plus communément utilisé. En effet, lorsqu'il s'agit de préparer l'avenir, vous savez que la connectivité et l'agilité du Cloud sont essentielles.
Nous avons passé l'année dernière à écouter nos clients de l'IA puis à essayer de comprendre à quoi ressemblerait l'avenir de l'IA et comment nous pouvions y contribuer au mieux. Aujourd'hui nous lançons une série de produits et fonctionnalités qui sont nés de ces entretiens et nous ouvrons la voie à de nouvelles opportunités incroyables.
En matière d'IA la plus grande opportunité est celle de l'inférence. L'inférence correspond à ce qui se passe lorsque vous entrez dans ChatGPT une invite pour la rédaction d'un poème sur votre amour pour la connectivité cloud et que, quelques secondes plus tard, vous obtenez une réponse cohérente. Ou lorsque vous lancez une recherche pour une photo de votre passeport sur votre téléphone et qu'elle la trouve immédiatement.
Les modèles qui sont à l'origine de ces miracles modernes sont le fruit d'un processus très long : l'entraînement. Une fois entraînés, ils peuvent toujours acquérir de nouvelles données encore et encore pour donner de nouveaux résultats de plus en plus intéressants.
C'est là que se produit l'inférence
Avant, ces modèles pouvaient s'exécuter à deux endroits. Le premier était l'appareil de l'utilisateur final, comme dans le cas de la recherche du passeport parmi les photos présentes sur votre téléphone. Lorsque c'est possible, c'est formidable. C'est rapide. Vos données confidentielles restent en local. Et cela fonctionne même en l'absence d'accès réseau. Mais cela suppose également des difficultés. Les modèles sont volumineux et le stockage sur votre téléphone ou sur les autres appareils en local est limité. Qui plus est, placer les ressources des processeurs graphiques les plus rapides pour exploiter ces modèles dans votre téléphone rendrait celui-ci très cher et consommerait les ressources précieuses de votre batterie.
L'autre solution était celle du cloud public centralisé. C'est ce qui est utilisé pour un grand modèle tel que GPT-4 d'OpenAI, qui exécute des services tels que ChatGPT. Mais cela ne se fait pas non plus sans difficulté. Aujourd'hui, presque toutes les ressources en processeurs graphiques consacrés à l'IA sont déployées aux États-Unis, une situation qui à juste titre dérange le reste du monde. Alors que les requêtes en IA deviennent de plus en plus personnelles, le fait de les envoyer toutes vers un cloud centralisé constitue une bombe à retardement en matière de sécurité et de localisation des données. En outre, l'opération est par essence plus lente, moins efficace et par conséquent plus coûteuse que d'exécuter l'inférence en local.
Il existe donc un troisième endroit pour l'inférence
Dans le cas d'une exécution sur l'appareil, c'est trop petit. Dans le cas d'une exécution sur un cloud public centralisé, c'est trop loin. Comme dans l'histoire de « Boucle d'or et les trois ours », la bonne solution se trouve dans le juste milieu. C'est pourquoi aujourd'hui nous sommes heureux de déployer des ressources de processeur graphique moderne au sein de la connectivité cloud globale de Cloudflare. Le troisième endroit pour l'inférence de l'IA. Ni trop petit. Ni trop loin. La situation idéale se trouve entre les deux. D'ici la fin de l'année, vous serez en mesure d'exécuter des modèles d'IA dans plus de 100 villes et plus de 40 pays dans lesquels Cloudflare est actif. D'ici la fin de l'année 2024, nous prévoyons de déployer des processeurs graphiques adaptés à l'inférence dans presque chacune des villes qui forment le réseau global de Cloudflare et à quelques millisecondes de pratiquement chaque appareil connecté à l'Internet dans le monde.
(Un grand merci aux membres de l'équipe de Cloudflare qui en ce moment même transportent littéralement des valises entières de cartes de processeurs graphiques NVIDIA dans le monde entier pour les installer dans les serveurs grâce auxquels notre réseau est mondial. Il faut beaucoup d'atomes pour déplacer tous les bits que nous créons et il faut des personnes intrépides partout dans le monde pour mettre à jour notre réseau afin de permettre la mise en place de ces nouvelles fonctionnalités).
En exécutant l'IA dans une connectivité cloud telle que Cloudflare, vous obtenez le meilleur des deux mondes : des ressources quasiment illimitées exécutées localement, à proximité de n'importe quel appareil connecté à Internet. Et nous l'avons conçu avec suffisamment de flexibilité pour qu'il puisse exécuter n'importe quel modèle créé par un développeur, qu'il soit facile à utiliser sans l'aide d'une équipe d'ingénieurs développeurs, et qu'il ne vous coûte pas plus que ce qui est consommé lorsque nous procédons à l'interférence pour vous.
Pour illustrer concrètement le propos, prenons l'exemple d'un client de Cloudflare tel que Garmin. Ils fabriquent des appareils qui doivent être intelligents tout en restant abordables et dont l'autonomie de la batterie doit être la plus longue possible. Les explorateurs dépendent littéralement d'eux pour se sortir de conditions difficiles, et il n'est pas question de compromis. C'est pourquoi, lorsqu'ils ont entendu parler de Cloudflare Workers AI, ils ont immédiatement compris qu'il s'agissait de quelque chose qu'ils devaient essayer. Voici ce que nous a dit Aaron Dearinger, Architect en périphérie de réseau chez Garmin International :
« Garmin accompagne ses utilisateurs pendant leurs courses, leurs entraînements et leurs aventures au grand air, et nous voulons nous assurer que la puissance de nos montres et appareils peut durer des semaines et des mois, plutôt que des heures ou des jours. Nous sommes ravis de découvrir les innovations de Cloudflare pour rendre l'IA performante, rapide, proche des utilisateurs, et surtout, respectueuse de la confidentialité. Cette évolution représente, à nos yeux, un grand potentiel, car nous souhaitons proposer à nos utilisateurs des informations plus détaillées sur la santé, le bien-être et l'aventure, au fur et à mesure de leurs explorations. »
Ils font partie des quelques rares clients à qui nous en avons donné un avant-goût, et qui ont immédiatement commencé à proposer des idées sur ce qu'ils pourraient faire par la suite et à réclamer un accès plus large. Nous avons l'impression de l'avoir aperçu et nous sommes ici pour en témoigner : le futur proche est génial.
Toujours la même philosophie : contribuer à bâtir un Internet meilleur
Au fil des ans, plusieurs des produits que nous avons annoncés à l'occasion de notre anniversaire ont été décisifs dans l'évolution d'Internet. Lors de notre premier anniversaire, nous annoncions une passerelle IPv6 qui a permis de faire avancer les décisions concernant les premiers protocoles pour Internet. Pour notre quatrième anniversaire, nous annoncions que nous allions rendre gratuit le chiffrement et nous avons doublé le volume de contenu web chiffré en un jour. À l'occasion de notre septième anniversaire, nous avons lancé la plateforme Workers qui a révolutionné la manière dont les applications modernes sont développées. Pour notre onzième anniversaire, nous avons annoncé le lancement de R2 et avons libéré un peu plus de données de nos clouds de captivité.
Cette année, alors que nous célébrons le treizième anniversaire de Cloudflare, nous sommes bien décidés à être aussi influents sur le développement de l'IA que nous l'avons été dans les autres domaines auxquels nous avons consacré notre travail par le passé : nous voulons proposer des outils qui permettent à chacun, où qu'il se trouve sur la planète, de bénéficier d'une inférence de l'IA performante et à prix abordable.
Un poème en guise de conclusion
Ainsi, pour marquer l'événement, terminons avec un poème sur la connectivité cloud. Celle-ci a été générée à partir d'un tout petit peu de code et du modèle Llama 2 LLM de Meta exécuté sur la plateforme Workers AI de Cloudflare dans un datacenter situé à proximité de l'endroit d'où nous écrivons ces lignes...
Invite : « Écrire un poème qui parle de la connectivité cloud en la comparant avec le cloud de captivité »
La connectivité cloud, un paysage merveilleux à voir,Où les données fleurissent et le savoir est libéré,Un lieu où les esprits se rencontrent et où les idées fusent,Un monde de possibilités infinies à perte de vue.
Tandis qu'existe le cloud captif, un lieu sombre,Où les pensées sont prisonnières et les esprits malheureux,une prison pour l'esprit, où la liberté n'est plus,Un monde de chagrin et de coûts interminables.
Choisissons plutôt la connectivité cloud,Libérons nos esprits et autorisons-les,À s'envoler, planer et atteindre le ciel,Sans jamais être retenus, toujours en vol.