Cloudflare ist jetzt offiziell ein Teenager. Uns gibt es seit dem 27. September 2010. Heute feiern wir unseren dreizehnten Geburtstag. Wie es zur guten Tradition geworden ist, nutzen wir die Woche unseres Geburtstags, um Produkte auf den Markt zu bringen, mit denen wir uns dem Internet erkenntlich zeigen wollen. Bevor wir gleich etwas näher auf einige der großartigen Ankündigungen eingehen, möchten wir uns zunächst mit etwas Grundlegenderem befassen: unserer Identität.
Wie viele Kinder haben wir eine Weile gebraucht, um zu verstehen, wer wir sind. Wir wollten nicht in Schubladen gesteckt werden. Wenn jemand Cloudflare als Sicherheitsanbieter bezeichnete, sagten wir: „Wir machen auch noch ganz andere Dinge.“ Wurde Cloudflare als Netzwerk bezeichnet, so entgegneten wir, dass wir viel mehr seien. Noch schlimmer: Oft wurden wir als „CDN“ bezeichnet. Wir erinnerten dann daran, dass Caching ein Teil jedes vernünftig konzipierten Systems ist, aber keine eigenständige Funktion darstellen sollte. Vielen Dank.
Und so haben wir gestern, am Tag vor unserem dreizehnten Geburtstag, der Welt endlich verkündet, was wir wirklich sind: eine Connectivity Cloud.
Die Connectivity Cloud
Was soll das bedeuten? „Connectivity“ bedeutet, dass wir uns daran messen, wie wir Menschen und Dinge miteinander verbinden. Unsere Aufgabe ist es nicht, der endgültige Bestimmungsort für Ihre Daten zu sein, sondern sie zu bewegen und fließen zu lassen. Beliebige Anwendungen, beliebige Daten, jeder, überall und jederzeit – das ist das Wesen der Konnektivität, und das war schon immer das Versprechen des Internets.
„Cloud“ bedeutet, dass die Batterien im Lieferumfang enthalten sind. Sie skaliert mit Ihnen. Sie ist programmierbar. Sie verfügt über eine einheitliche, integrierte Sicherheit. Sie ist intelligent und lernt aus Ihrer Nutzung und der anderer und optimiert Ihre Ergebnisse besser, als Sie es jemals selbst könnten.
Unsere Connectivity Cloud ist es wert, mit einigen anderen Clouds verglichen zu werden. Die sogenannten „hyperskalierbaren“ Public Clouds sind in vielerlei Hinsicht das Gegenteil. Sie optimieren das Horten Ihrer Daten. Sie binden Sie. Dadurch können Sie nur schwer wechseln, sich kaum bewegen. Es handelt sich also um Captivity Clouds, die Sie gefangen nehmen. Und obwohl sie für einige Dinge hervorragend geeignet sind, können sie ihr volles Potenzial nur dann entfalten, wenn sie mit einer Connectivity Cloud kombiniert werden, die es Ihnen ermöglicht, das Beste aus jeder ihrer Funktionen zu kombinieren.
Für die Zukunft gerüstet
Das sehen wir derzeit bei den angesagtesten Start-ups. Viele der führenden KI-Unternehmen nutzen die Connectivity Cloud von Cloudflare, um ihre Trainingsdaten dorthin zu verlagern, wo es überschüssige GPU-Kapazitäten gibt. Wir schätzen, dass Cloudflare im gesamten Ökosystem der KI-Startups der am häufigsten genutzte Cloud-Anbieter ist. Denn wenn Sie die Zukunft gestalten, wissen Sie, dass Konnektivität und die Agilität der Cloud ausschlaggebend sind.
Wir haben das letzte Jahr damit verbracht, unseren KI-Kunden zuzuhören und zu versuchen zu verstehen, wie die Zukunft der KI aussehen wird und wie wir sie besser unterstützen können. Heute stellen wir eine Reihe von Produkten und Funktionen vor, die aus diesen Gesprächen entstanden sind und unglaubliche neue Möglichkeiten eröffnen.
Die größte Chance in der KI ist die Inferenz. Inferenz ist das, was passiert, wenn Sie einen Prompt eingeben, um ein Gedicht über Ihre Liebe für Connectivity Clouds in ChatGPT zu schreiben und Sekunden später eine stimmige Antwort erhalten. Oder wenn Sie auf Ihrem Handy nach einem Bild Ihres Passes suchen und es sofort angezeigt wird.
Die Erstellung der Modelle, die diese modernen Wunder bewirken, nimmt viel Zeit in Anspruch – ein Prozess, der als Training bezeichnet wird.Einmal trainiert, können sie jedoch immer wieder mit neuen Daten gefüttert werden, um wertvolle neue Outputs zu erzeugen.
Wo Inferenz stattfindet
Bis heute konnten diese Modelle an zwei Orten laufen. Die erste war das Gerät des Nutzers – wie im Fall der Suche nach dem „Reisepass“ in den Fotos auf Ihrem Smartphone. Wenn das möglich ist, ist das großartig. Es ist schnell. Ihre privaten Daten bleiben lokal. Und es funktioniert auch ohne Netzwerkzugriff. Es bringt jedoch auch Herausforderungen mit sich. Die Modelle sind groß und der Speicherplatz auf Ihrem Smartphone oder einem anderen lokalen Gerät ist begrenzt. Verwendet man die schnellsten GPU-Ressourcen, um diese Modelle zu verarbeiten, wird das Smartphone teuer und verbraucht wertvollen Akku.
Die Alternative war die zentralisierte öffentliche Cloud. Dies wird für ein großes Modell wie OpenAIs GPT-4 verwendet, das Dienste wie ChatGPT betreibt. Diese Infrastruktur bringt jedoch seine eigenen Herausforderungen mit sich. Derzeit werden fast alle für KI eingesetzten GPU-Ressourcen in den USA bereitgestellt – eine Tatsache, die den Rest der Welt zu Recht beunruhigt. Da KI-Anfragen immer persönlicher werden, ist das Senden aller Anfragen an eine zentrale Cloud eine potenzielle Katastrophe für die Sicherheit und die Datenlokalisierung, die nur darauf wartet zu passieren. Außerdem ist es von Natur aus langsam und weniger effizient und daher kostspieliger als die lokale Ausführung der Inferenz.
Ein dritter Ort für die Inferenz
Das Nutzergerät ist für wirksame KI-Inferenz zu klein. Die Ausführung in einer zentralisierten öffentlichen Cloud ist zu umfangreich. Es ist wie in der Geschichte von „Goldlöckchen und den drei Bären“: Die richtige Antwort liegt irgendwo dazwischen. Deshalb freuen wir uns, dass wir heute moderne GPU-Ressourcen in der globalen Connectivity-Cloud von Cloudflare einführen können. Dem dritten Ort für KI-Inferenz. Nicht zu klein. Nicht allzu umfangreich.Der perfekte Zwischenschritt. Bis Ende des Jahres werden Sie in der Lage sein, KI-Modelle in mehr als 100 Städten in über 40 Ländern, in denen Cloudflare präsent ist, auszuführen. Bis Ende 2024 planen wir, auf KI-Inferenz optimierte GPUs in fast jeder Stadt des globalen Netzwerks von Cloudflare und nur wenige Millisekunden entfernt von fast jedem Gerät, das weltweit mit dem Internet verbunden ist, bereitzustellen.
(Ein kurzes Lob an die Mitglieder des Cloudflare-Teams, die in diesem Moment buchstäblich Koffer voller NVIDIA-GPU-Karten um die Welt schleppen und sie in den Servern installieren, aus denen unser Netzwerk weltweit besteht. Es braucht eine Menge Atome, um all die Bits zu bewegen, die wir bewegen, und es braucht furchtlose Menschen rund um den Globus, um unser Netz zu aktualisieren und diese neuen Fähigkeiten bereitzustellen).
Die Ausführung von KI in einer Connectivity-Cloud wie Cloudflare bietet Ihnen das Beste aus beiden Welten: nahezu unbegrenzte Ressourcen, die lokal in der Nähe jedes mit dem Internet verbundenen Geräts ausgeführt werden. Und wir haben sie so flexibel gestaltet, dass alle Modelle, die ein Entwickler erstellt, ausgeführt werden können, dass sie einfach zu bedienen ist, ohne dass ein Dev-Ops-Team erforderlich ist, und dass sie kostengünstig ist, da Sie nur dann zahlen, wenn wir Inferenz für Sie durchführen.
Betrachten Sie einen Cloudflare-Kunden wie Garmin, um dies zu verdeutlichen. Sie stellen Geräte her, die intelligent, aber auch erschwinglich sein müssen und eine möglichst lange Akkulaufzeit haben sollten. Da sich die Forscher und Abenteurer buchstäblich auf sie verlassen, um aus schwierigen Situationen herauszufinden, gibt es keinen Spielraum für Kompromisse oder Leistungsabstriche. Als sie von Cloudflare Workers AI hörten, wussten sie deshalb sofort, dass sie es ausprobieren mussten. Aaron Dearinger, Edge Architect bei Garmin International, sagte damals Folgendes zu uns:
"Garmin begleitet unsere Nutzerinnen und Nutzer beim Workout ebenso wie beim Joggen und bei anderen Outdoor-Aktivitäten. Wir möchten sicherstellen, dass unsere Watches und Geräte nicht Stunden oder Tage, sondern Wochen oder Monate durchhalten, bis sie wieder aufgeladen werden müssen. „Wir sind begeistert von den Innovationen, mit denen Cloudflare gewährleistet, dass leistungsfähige KI schnell und datenschutzfreundlich in der Nähe der Nutzerinnen und Nutzer zum Einsatz kommen kann. Für uns bietet das großes Potenzial, denn wir wollen unseren Nutzerinnen und Nutzern für Ihre Aktivitäten noch ausgereiftere Informationen rund um Fitness, Wellness und Abenteuer liefern.“
Sie gehören zu dem begrenzten Kreis von Kunden, denen wir vorab einen Blick auf die Software gewähren konnten. Wie viele weitere Kunden dieses erlesenen Kreises hatten sie sofort Ideen für weitere Schritte und verlangten lautstark, das Tool umfangreicher einsetzen zu können. Wir haben das Gefühl, sie bereits zu kennen (und erlebt zu haben), und freuen uns zu berichten: Die nahe Zukunft ist echt cool!
Der Wille, ein besseres Internet zu schaffen
Im Laufe der Jahre haben wir an unserem Geburtstag mehrere Entwicklungen angekündigt, die die Zukunft des Internets verändert haben. An unserem ersten Geburtstag, kündigten wir ein IPv6-Gateway an, das dazu beigetragen hat, dass das Internet über seine ersten Protokollentscheidungen hinaus gewachsen ist. An unserem vierten Geburtstag, kündigten wir an, dass wir die Verschlüsselung ab sofort kostenlos anbieten würden, wodurch das verschlüsselte Web über Nacht doppelt so groß wurde. An unserem siebenten Geburtstag haben wir die Workers-Plattform eingeführt, die die Entwicklung moderner Anwendungen revolutioniert hat. An unserem elften Geburtstag kündigten wir R2 an und befreiten weitere Daten aus den Captivity Clouds.
Dieses Jahr, in dem wir den dreizehnten Geburtstag von Cloudflare feiern, haben wir uns vorgenommen, die KI-Entwicklung genauso stark zu beeinflussen, wie wir es in anderen Bereichen getan haben, auf die wir uns in der Vergangenheit konzentriert haben: Wir wollen Tools bereitstellen, die erschwingliche, leistungsstarke KI-Inferenz für jeden und überall auf der Welt bieten.
Zum Abschluss ein Gedicht
Zur Erinnerung daran wollen wir mit einem Gedicht über die Connectivity Cloud schließen. Dieses englischsprachige Gedicht wurde mit einem winzigen Stückchen Code und dem Llama 2 LLM-Modell von Meta generiert, das auf der Workers AI-Plattform von Cloudflare in einem Rechenzentrum läuft, das nicht weit von dem Ort entfernt ist, an dem wir diese Zeilen verfassen...
Prompt: „Schreibe ein Gedicht über die Connectivity Cloud und stelle sie der Captivity Cloud gegenüber“
Die Connectivity Cloud, ein Wunder und Segen,Wo Daten fließen und Wissen kann sich bewegen,Ein Ort, wo Gedanken sich treffen, Ideen entstehen,Ein Reich voll Möglichkeiten, so weit wir nur sehen.
Doch dann gibt's die Captivity Cloud, düster und kalt,Wo Gedanken gefangen, der Geist wird alt,Ein Gefängnis des Denkens, wo Freiheit entweicht,Ein Ort voller Leid, wo Freude nicht reicht.
Wählen wir darum die Connectivity Cloud, ganz klar,Und lassen den Geist frei, völlig ohne Gefahr,Zu schweben, zu gleiten, zum Himmel empor,Nie gehalten, stets fliegend, immerfort.