SGLang ist eine Open-Source-Inferenz-Engine, die durch technische Optimierung deutliche Performancegewinne bei der LLM-Inferenz erzielt.