Cloudflare 正式成为青少年。我们成立于 2010 年 9 月 27 日。今天,我们热烈庆祝十三周岁生日。按照我们的传统,我们会利用生日这一周推出一些产品,作为我们献给互联网的礼物。稍后我们将详细介绍一些令人震惊的公告,但我们想先谈谈更基本的东西:我们的身份。
和许多孩子一样,我们需要一段时间才能完全明白自己是谁。我们并不愿意被某一个身份所限制。人们会将 Cloudflare 描述为一家安全公司,而我们会说:“这不是我们的全部业务”。他们会说我们是一个网络,而我们会反对说我们的意义远不止于此。最糟糕的是,他们有时会称我们为“CDN”,我们会提醒他们,缓存是任何合理设计的系统的一部分,但它本身不应该是一个功能。非常感谢。
因此,昨天,在我们 13 岁生日的前一天,我们终于向世界宣布了我们的身份:全球连通云。
全球连通云
这是什么意思?“全球连通”意味着我们通过将人和物连接在一起来衡量自己。我们的工作不是成为您数据的最终目的地,而是帮助数据移动和流动。任何应用程序、任何数据、任何人、任何地点、任何时间——这就是连接的本质,也是互联网的一贯承诺。
“云”意味着所包含的一系列功能。它与您一起成长。它是可编程的。内置一致的安全性。它是智能的,可以从您和他人的使用中学习,并比您自己更能优化结果。
我们的全球连通云不惧与其他一些云进行对比。所谓的超大规模公共云在很多方面都是相反的。它们为储存您的数据而优化。锁定它。使它难以移动。它们是被囚禁的云。虽然它们在某些方面可能很出色,但只有与全球连通云结合,让您可以混合和匹配它们各自的最佳功能,才能真正为客户释放它们的全部潜力。
赋能未来
这就是我们从最近最热门的初创企业身上看到的。许多领先的 AI 公司都在使用 Cloudflare 的全球连通云,将他们的训练数据转移到 GPU 容量过剩的地方。我们估计,在整个 AI 初创企业生态系统中,Cloudflare 是最常用的云提供商。因为,如果您正在建设未来,您就会知道云的连接性和敏捷性正是关键。
去年,我们一直在倾听 AI 客户的声音,试图了解 AI 的未来会是什么样子,以及我们如何更好地帮助他们构建未来。今天,我们将发布一系列基于这些对话的产品和功能,并开启令人震惊的新机遇。
AI 的最大机遇在于推理。当您在 ChatGPT 中输入提示:“写一首诗,表达你对全球连通云的热爱”,几秒钟后就会得到一个连贯的回复,这就是推理。或者当您在手机上搜索护照照片时,它会立即显示出来。
为这些现代奇迹提供动力的模型需要大量时间才能生成,这个过程称为训练。不过,一旦经过培训,它们就可以一遍又一遍地输入新数据,以生成有价值的新输出。
推理发生的地方
在今天之前,这些模型可以在两个地方运行。首先是终端用户的设备——比如在手机照片中搜索“护照”。当这一点能够实现时,那就太棒了。速度很快。您的私人数据将保留在本地。即使在没有网络连接的情况下,它也能正常工作。但这也具有挑战性。模型很大,而手机或其他本地设备的存储空间有限。此外,在手机中使用最快的 GPU 资源来处理这些模型会使手机变得昂贵,并消耗宝贵的电池资源。
另一个选择是集中式公共云。这正是 OpenAI 的 GPT-4 等大型模型所使用的,它可以运行像 ChatGPT 这样的服务。但这也有其自身的挑战。如今,几乎所有用于 AI 的 GPU 资源都部署在美国——毫无疑问,这一事实让世界其他国家都感到困扰。随着 AI 查询变得越来越个性化,将它们全部发送到某个集中式云端将是一场潜在的安全和数据定位灾难,随时可能发生。此外,这种方法本身速度慢、效率低,因此比在本地运行推理的成本更高。
推理的第三个场所
对于运行而言,设备太小了。而在集中式公共云上运行又过于遥远。这就像《金发姑娘与三只熊》的故事:正确的答案是介于两者之间。于是,就在今天,我们非常高兴地宣布,在 Cloudflare 全球连通云中推出现代 GPU 资源。AI 推理的第三个场所。不会太小。不会太远。二者之间的完美位置。到今年年底,您将能够在 Cloudflare 运营的 40 多个国家的 100 多个城市运行 AI 模型。到 2024 年底,我们计划在 Cloudflare 全球网络的几乎每个城市部署经过推理调整的 GPU,并在几毫秒内将其部署到全球几乎所有连接到互联网的设备上。
(在此,我们要向 Cloudflare 团队的成员们致以最崇高的敬意!此时此刻,他们正拖着装满 NVIDIA GPU 卡的行李箱奔波于世界各地,并将它们安装到构成我们全球网络的服务器中。我们需要大量的原子来移动我们所做的所有数据,也需要全球各地勇敢的人来更新我们的网络,以促进这些新功能的实现。)
在 Cloudflare 这样的全球连通云中运行 AI,可以让您在两个方面都获得全球最佳体验:在连接到互联网的任何设备附近本地运行几乎无穷无尽的资源。我们让它可以灵活地运行开发人员创建的任何模型,无需开发运营团队即可轻松使用,而且运行成本低廉,您只需在我们为您进行推理工作时支付费用。
为了使这一点具体化,我们考虑 Cloudflare 的一个客户,如 Garmin。他们制造的设备既要智能,又要经济实惠,电池寿命也要尽可能长。由于探险者完全依靠它们来走出艰苦的环境,权衡取舍是不可取的。因此,当他们听说 Cloudflare Workers AI 时,他们立即意识到这是他们需要尝试的东西。以下是 Garmin International 的边缘架构师 Aaron Dearinger 对我们说的话:
“Garmin 与我们的用户一起进行跑步、锻炼和户外探险,我们希望确保我们的手表和设备的动力可以持续数周或数月,而不是数小时或数天。我们对 Cloudflare 的创新感到兴奋,这些创新可确保 AI 高性能、快速、贴近用户,而且重要的是隐私优先。这对我们来说潜力巨大,因为我们的目标是在用户探索的过程中为他们带来更先进的健身、健康和探险见解。”
我们让少量客户提前知晓了这款产品,Garmin 就是其中之一。所有客户都立即开始畅想下一步的计划,并争先恐后地要求获得更多的访问权限。我们感觉我们已经看到了这一点,并在此报告:不远的未来非常酷。
帮助建设更好的互联网的精神
多年来,我们在生日当天宣布了几件改变互联网未来的事情。在我们一岁生日那天,我们宣布推出 IPv6 网关,帮助互联网扩展并超越其早期协议决策。四岁生日那天,我们宣布将免费提供加密,并在一天之内将加密 Web 的规模扩大了一倍。七岁生日那天,我们推出了 Workers 平台,彻底改变了现代应用程序的开发方式。十一岁生日那天,我们宣布推出 R2,并进一步将数据从囚禁云中释放出来。
今年,在庆祝 Cloudflare 十三岁生日之际,我们立志要像过去在其他领域一样,对 AI 的发展产生巨大影响:提供工具,为地球上任何地方的任何人带来经济实惠、功能强大的 AI 推理。
以一首诗结束
因此,为了纪念这一点,让我们以一首关于“全球连通云”的诗作为结尾。在离我们写这篇文章的地方不远的一个数据中心中,我们使用一小段代码和在 Cloudflare 的 Workers AI 平台上运行的 Meta Llama 2 LLM 模型,生成了这首诗……
提示:“写一首关于全球连通云的诗,并将其与囚禁云进行对比”
全球连通云,蔚为奇观数据在这里流动,知识在这里释放一个思想交汇、创意飞扬的地方一个充满无限可能的世界就在眼前。
但是,还有一个更黑暗的地方,称为囚禁云思想受困,心灵蒙羞失去自由的心灵牢笼这个世界充满了无尽的悲伤和代价。
因此,让我们选择全球连通云让我们的思想得到自由和允许翱翔、滑行,直冲云霄永不退缩,永远飞翔。