Demystifying NCCL: An In-depth Analysis of GPU Communication Protocols and Algorithms
·
논문 리뷰/네트워크
https://arxiv.org/abs/2507.04786 NCCL은 굉장히 널리 쓰이는 집합 통신 라이브러리다. MPI와는 다르게 GPU-GPU 통신만을 위해 개발되었고, NVLink, PICe, InfiniBand를 활용해서 고대역폭, 저지연을 목표로 하고 있다. NCCL은 공개된 정보가 거의 없어서 공식 Github 질문 정도로만 다들 해결하고 있다 이 논문 reference 조차도 몇 개가…. 공식 API 문서로는 내부 구현, 예를 들어서 토폴로지 생성, 알고리즘 선택, 파이프라이닝, 버퍼 관리 같은 것을 제대로 알 수 없다. 이 논문에서는 1. 기본적인 API 구조, 통신 채널 관리2. 통신 프로토콜 (Simple, LL, LL128) 세부 정보3. Data-transfer model 분석4. ..