免费开始使用|联系销售|

Cloudflare 博客

订阅以接收新文章的通知：

基础设施

构建运行超大语言模型的基础

2026-04-16

我们构建了一套定制的技术栈，用于在 Cloudflare 基础设施上运行快速加载的大语言模型 (LLM)。本篇博客文章将介绍实现高性能 AI 推理所需的工程权衡与技术优化。...

继续阅读 »

构建运行超大语言模型的基础

Workers 如何为我们的内部维护调度流程提供支持

2025-12-22

Cloudflare Workers 可靠性 Prometheus 基础设施

在全球网络上，物理数据中心的维护工作充满风险。为此，我们在 Workers 上构建了一个维护调度器，用以安全地规划具有破坏性的操作；同时，通过在多个数据源与指标管道之上引入图接口来洞察基础设施的整体状态，从而解决了扩展过程中遇到的种种挑战。...

1