deepspeed의 공식 문서에서는 deepspeed로 활용할 수 있는 부분들을 아래와 같이 소개하고 있습니다.

Extreme Speed and Scale for DL Training and Inference

결국, 강조하고 싶은 부분을 세가지 키워드로 요약하자면 Speed, Scale, Compression 입니다.

즉, large model을 학습/추론하기 위해 여러 대의 GPU로 스케일링하여 분산처리하고, 해당 과정에서 latency 및 throughput을 위한 compression까지 제공합니다.

DeepSpeed has three innovation pillars

deepspeed는 Training, Inference, Compression의 세가지 영역에서 혁신을 제공합니다.
