초대형 언어 모델을 실행하기 위한 기반 다지기
2026-04-16
Cloudflare는 자체 인프라 환경에서 대규모 언어 모델을 신속하게 실행할 수 있도록 맞춤형 기술 스택을 구축했습니다. 본 게시물에서는 누구나 고성능 AI 추론 환경을 활용할 수 있도록 구현하는 과정에서 적용된 엔지니어링 측면의 절충 사항과 기술적 최적화 과정을 살펴봅니다....
계속 읽기 »
2026-04-16
Cloudflare는 자체 인프라 환경에서 대규모 언어 모델을 신속하게 실행할 수 있도록 맞춤형 기술 스택을 구축했습니다. 본 게시물에서는 누구나 고성능 AI 추론 환경을 활용할 수 있도록 구현하는 과정에서 적용된 엔지니어링 측면의 절충 사항과 기술적 최적화 과정을 살펴봅니다....
계속 읽기 »
2026-03-26
Atlantis 인스턴스를 다시 시작하는 데 30분이 걸리는 이유를 조사한 결과, Kubernetes가 볼륨 권한을 처리하는 방식에서 병목 현상을 발견했습니다. 우리는 fsGroupchangePolicy를 조정하여 재시작 시간을 30초로 단축했습니다....
2026-02-13
ecdysis는 네트워크 서비스의 다운타임 없이 업그레이드할 수 있는 Rust 라이브러리입니다. Cloudflare에서는 수백만 개의 연결을 5년 동안 보호해 온 이후, 이제 오픈 소스가 되었습니다....
2025-12-22
물리적 데이터 센터 유지 관리는 전역 네트워크에서 위험합니다. 당사는 중단되는 작업을 안전하게 계획할 수 있도록 워커스에 유지 관리 스케줄러를 구축했으며, 여러 데이터 소스와 메트릭 파이프라인 위에 있는 그래프 인터페이스를 통해 인프라 상태를 확인하여 확장 문제를 해결했습니다....