年間600時間を削減した1行のKubernetes修正
2026-03-26
Atlantisインスタンスが再起動に30分かかった理由を調査したところ、Kubernetesがボリューム許可を処理する方法にボトルネックがあることがわかりました。fsGroupChangePolicyを調整することで、再起動時間を30秒に短縮しました。...
続きを読む »
2026-03-26
Atlantisインスタンスが再起動に30分かかった理由を調査したところ、Kubernetesがボリューム許可を処理する方法にボトルネックがあることがわかりました。fsGroupChangePolicyを調整することで、再起動時間を30秒に短縮しました。...
続きを読む »
2026-02-13
ecdysisは、ネットワークサービスのダウンタイムアップグレードを可能にするRustライブラリです。Cloudflareは、数百万の接続を5年間保護し、現在はオープンソースとなっています。...
2025-12-22
グローバルネットワークでは、物理的なデータセンターのメンテナンスにリスクが伴います。さらに、複数のデータソースと指標パイプラインに加え、グラフインターフェイスでインフラストラクチャの状態を表示することで、スケーリングの課題を解決しながら、Workers上でサービスを停止させるような保守スケジューラーを構築しました。...