新規投稿のお知らせを受信されたい方は、サブスクリプションをご登録ください:

Chris Branch

Chris Branch

軽量化:品質を犠牲にせずにLLMを22%圧縮した方法

2026-04-17

Agents Week研究AI

Cloudflareのネットワーク全体でLLMを実行するには、GPUメモリ帯域幅についてよりスマートで効率的になる必要があります。そこで当社は、最高22%のモデルフットプリント削減を実現するロスレスな推論時間圧縮システムUnweightを開発しました。これにより、かつてないほど高速かつ安価な推論を提供できるようになりました。...

フィッシングの皆様に感謝しています:Linuxネットワークスタックからの回避方法

2025-10-29

研究LinuxEgress

Cloudflareの製品の多くは、ネットワークハードウェアとソフトウェアの限界を押し広げて、パフォーマンスの向上、効率性の向上、あるいはデータセンター間でIPサブネットを共有する方法であるソフトunicastなどの新しい機能を実現するために、必ず使用できます。幸いなことに、ほとんどの人は、オペレーティングシステムがネットワークやインターネットアクセスをどのように処理するかという複雑な情報を知る必要はありません。そう、Cloudflare内のほとんどの人がそうなのです。しかし、CloudflareはLinuxのネットワークスタックの設計意図を十分に超えようとすることがあります。これは、その試みの1つについて話します。...