We hebben vandaag groot nieuws: Replicate, het toonaangevende platform voor het uitvoeren van AI-modellen, sluit zich aan bij Cloudflare.
We gingen voor het eerst met Replicate in gesprek omdat we veel gemeen hadden, meer dan alleen een passie voor felle kleuren. Onze missie voor het Workers-ontwikkelaarsplatform van Cloudflare is om het bouwen en implementeren van full-stackapplicaties zo eenvoudig mogelijk te maken. Replicate heeft een vergelijkbare missie: het implementeren van AI-modellen zo eenvoudig maken als het schrijven van één regel code. We beseften dat we samen iets nog beters konden bouwen door het Replicate-platform rechtstreeks in Cloudflare te integreren.
We zijn trots op deze nieuwe ontwikkeling en zijn enthousiast over wat het voor onze klanten betekent. Door de tools van Replicate in Cloudflare te integreren, blijft ons ontwikkelaarsplatform de beste plek op internet om AI- of agentworkflows te bouwen en implementeren.
Wat betekent dit voor jou?
Voordat we meer tijd besteden aan de toekomst van AI, willen we graag de vragen beantwoorden die voor Replicate- en Cloudflare-gebruikers het belangrijkst zijn. Kortom:
Voor bestaande Replicate-gebruikers: Jouw API's en workflows blijven zonder onderbreking werken. Je profiteert binnenkort van de extra prestaties en betrouwbaarheid van het wereldwijde netwerk van Cloudflare.
Voor bestaande Workers AI-gebruikers: maak je klaar voor een enorme uitbreiding van de modelcatalogus en de nieuwe mogelijkheid om finetunes en aangepaste modellen rechtstreeks op Workers AI uit te voeren.
Laten we even teruggaan naar waarom we zo enthousiast zijn over onze gezamenlijke toekomst.
De AI-revolutie werd niet op televisie uitgezonden, maar begon met open source
Voordat AI echt AI was en het onderwerp van elk gesprek was, stond het decennialang bekend als ‘machine learning’. Het was een gespecialiseerd, bijna academisch vakgebied. De vooruitgang verliep gestaag maar in afzonderlijke systemen, waarbij de doorbraken plaatsvonden in een paar grote, goed gefinancierde onderzoekslaboratoria. De modellen waren monolithisch, de gegevens waren eigendom van de ontwikkelaars en de tools waren voor de meeste ontwikkelaars ontoegankelijk. Alles veranderde toen de cultuur van open-source-samenwerking – dezelfde kracht die het moderne internet heeft gebouwd – toegepast werd op machine learning. Onderzoekers en bedrijven begonnen niet alleen hun artikelen te publiceren, maar ook hun modelgewichten en code.
Dit leidde tot een enorme explosie van innovatie. De snelheid waarmee veranderingen zijn doorgevoerd in de afgelopen jaren is verbijsterend. Wat 18 maanden geleden (soms lijkt het nog maar een paar dagen geleden) nog de nieuwste technologie was, is nu de basis. Deze versnelling is het meest zichtbaar bij generatieve AI.
In een oogwenk gingen we van vreemde, wazige curiositeiten naar fotorealistische beeldgeneratie. Open source-modellen zoals Stable Diffusion maakten onmiddellijke creativiteit mogelijk voor ontwikkelaars, en dat was nog maar het begin. Als je vandaag een blik werpt op de modelcatalogus van Replicate, zie je duizenden afbeeldingsmodellen, die stuk voor stuk gebaseerd zijn op de vorige.
Dit gebeurde niet alleen met beeldmodellen, maar ook met video-, audio-, taalmodellen en meer…
Maar deze ongelooflijke, door de gemeenschap aangestuurde vooruitgang creëert een enorme praktische uitdaging: hoe moet je deze modellen eigenlijk uitvoeren? Elk nieuw model heeft andere afhankelijkheden, vereist specifieke GPU-hardware (en voldoende daarvan) en heeft een complexe serverinfrastructuur nodig om te kunnen schalen. Ontwikkelaars merkten dat ze meer tijd kwijt waren aan het worstelen met CUDA-drivers en requirements.txt-bestanden dan aan het daadwerkelijk bouwen van hun applicaties.
Dat is precies het probleem dat Replicate heeft opgelost. Ze hebben een platform gebouwd dat al die complexiteit wegneemt (met behulp van hun open-sourcetool Cog om modellen te verpakken in standaard, reproduceerbare containers), waardoor iedere ontwikkelaar of datawetenschapper zelfs de meest complexe open-sourcemodellen kan uitvoeren met een eenvoudige API-aanroep.
Momenteel omvat de catalogus van Replicate meer dan 50.000 open-sourcemodellen en gefinetunede modellen. Open source heeft zoveel mogelijkheden gecreëerd, maar de toolset van Replicate gaat nog verder en zorgt ervoor dat ontwikkelaars op één plek toegang hebben tot alle modellen die ze nodig hebben. Punt. Via hun marktplaats bieden ze bovendien naadloze toegang tot toonaangevende, gepatenteerde modellen zoals GPT-5 en Claude Sonnet, allemaal via dezelfde, uniforme API.
Het is opmerkelijk dat Replicate niet zomaar een inferentiedienst heeft gebouwd; ze hebben een community opgebouwd. Innovatie ontstaat vaak doordat je geïnspireerd raakt door wat anderen doen, daarop voortborduurt en het verbetert. Replicate is uitgegroeid tot de ultieme hub voor ontwikkelaars om de nieuwste modellen te ontdekken, delen, finetunen en ermee te experimenteren in de openbare ruimte.
Samen sterker: de AI-catalogus ontmoet de AI-cloud
Terug naar de missie van het Workers-platform: ons doel is altijd geweest om ontwikkelaars in staat te stellen full-stack applicaties te bouwen zonder dat ze zich zorgen over de infrastructuur hoeven te maken. Hoewel dat niet is veranderd, heeft AI wel de eisen aan applicaties veranderd.
Ontwikkelaars bouwen momenteel allerlei andere soorten applicaties: drie jaar geleden bouwde niemand agents of maakte niemand door AI gegenereerde lanceringsvideo's. Tegenwoordig wel. Als gevolg hiervan zijn ook hun behoeften en verwachtingen van de cloud, of de AI-cloud, veranderd.
Om aan de behoeften van ontwikkelaars te voldoen, heeft Cloudflare de basispijlers van de AI-cloud gebouwd. Deze is ontworpen om inferentie aan de rand uit te voeren, dicht bij gebruikers. Dit is niet één product, maar een hele stack:
Workers AI: serverloze GPU-inferentie op ons wereldwijde netwerk.
AI Gateway: een controlepaneel voor caching, rate limiting en het observeren van elke AI-API.
Datastack: inclusief Vectorize (onze vectordatabase) en R2 (voor model- en dataopslag).
Orkestratie: hulpmiddelen zoals AI Search (voorheen Autorag), Agents en Workflows om complexe, meerstapsapplicaties te bouwen.
Fundering: alles gebouwd op ons belangrijkste ontwikkelaarsplatform van Workers, Durable Objects en de rest van onze stack.
Net zoals wij, wil Replicate ontwikkelaars helpen bij het opschalen van hun applicaties: het implementeren van AI-modellen net zo eenvoudig maken als het implementeren van code. Nu komt het allemaal samen. Replicate biedt een van de grootste en meest dynamische modelcatalogi en ontwikkelaarscommunity's in de branche. Cloudflare biedt een ongelooflijk krachtig wereldwijd netwerk en serverloos inferentieplatform. Samen kunnen we het beste van twee werelden bieden: de meest uitgebreide selectie modellen, uitvoerbaar op een snel, betrouwbaar en betaalbaar inferentieplatform.
De mogelijkheid om modellen te delen, finetunes te publiceren, sterren te verzamelen en te experimenteren in de playground vormt de kern van de Replicate-community. We zullen hierin blijven investeren en dit verder uitbouwen tot dé plek voor het ontdekken en experimenteren met AI. Dit wordt nu ondersteund door het wereldwijde netwerk van Cloudflare, voor een nog snellere en responsievere ervaring voor iedereen.
Wij streven ernaar om het beste van beide platforms samen te brengen. We brengen de volledige Replicate-catalogus – alle 50.000+ modellen en finetunes – naar Workers AI. Dit geeft je de ultieme keuze: voer modellen uit in de flexibele omgeving van Replicate of op het serverloze platform van Cloudflare, allemaal vanaf één plek.
Maar we breiden niet alleen de catalogus uit. We kondigen nu ook aan dat we Workers AI gaan voorzien van finetuning-mogelijkheden, aangestuurd door de uitgebreide expertise van Replicate. Bovendien maken we Workers AI flexibeler dan ooit. Binnenkort kun je je eigen aangepaste modellen aan ons netwerk toevoegen. We gaan de expertise van Replicate inzetten om dit proces samen met Cog naadloos, reproduceerbaar en eenvoudig te maken.
De AI-cloud: meer dan alleen inferentie
Het uitvoeren van een model is slechts één stukje van de puzzel. Het echte wonder gebeurt wanneer je AI verbindt met je volledige applicatie. Stel je eens voor wat je kunt bouwen als de enorme catalogus van Replicate volledig is geïntegreerd met het gehele Cloudflare-ontwikkelaarsplatform: voer een model uit en sla de resultaten rechtstreeks op in R2 of Vectorize; trigger inferentie van een Worker of Queue; gebruik Durable Objects om de status van een AI-agent te beheren; of bouw realtime generatieve UI met WebRTC en WebSockets.
Om dit alles te beheren, integreren we ons uniforme inferentieplatform nauw met de AI Gateway. Zo krijg je één enkel controlevlak voor observatie, prompt management, A/B-testen en kostenanalyses voor al je modellen, ongeacht of deze op Cloudflare, Replicate of een andere provider worden uitgevoerd.
We zijn ontzettend blij om het Replicate-team te mogen verwelkomen bij Cloudflare. Hun passie voor de ontwikkelaarscommunity en hun expertise in het AI-ecosysteem zijn ongeëvenaard. We kunnen niet wachten om samen de toekomst van AI te bouwen.