构建运行超大语言模型的基础
2026-04-16
我们构建了一套定制的技术栈,用于在 Cloudflare 基础设施上运行快速加载的大语言模型 (LLM)。本篇博客文章将介绍实现高性能 AI 推理所需的工程权衡与技术优化。...
继续阅读 »
2026-04-16
我们构建了一套定制的技术栈,用于在 Cloudflare 基础设施上运行快速加载的大语言模型 (LLM)。本篇博客文章将介绍实现高性能 AI 推理所需的工程权衡与技术优化。...
继续阅读 »
2025-12-22
在全球网络上,物理数据中心的维护工作充满风险。为此,我们在 Workers 上构建了一个维护调度器,用以安全地规划具有破坏性的操作;同时,通过在多个数据源与指标管道之上引入图接口来洞察基础设施的整体状态,从而解决了扩展过程中遇到的种种挑战。...