sgl-project는 GitHub에서 다양한 공개 리포지토리를 운영하는 조직으로, 주요 프로그래밍 언어로는 Python, Go, C++, Jupyter Notebook, Cuda, HTML이 있습니다. 이 조직은 SGLang 및 mini-sglang과 같은 고성능 언어 모델 서빙 프레임워크를 개발하여 많은 개발자들 사이에서 주목받고 있습니다.
SGLang is a high-performance serving framework for large language models and multimodal models.
A compact implementation of SGLang, designed to demystify the complexities of modern LLM serving systems.
Train speculative decoding models effortlessly and port them smoothly to SGLang serving.
Materials for learning SGLang
SGLang Omni: High-Performance Multi-Stage Pipeline Framework for Omni Models
Genai-bench is a powerful benchmark tool designed for comprehensive token-level performance evaluation of large language model (LLM) serving systems.
JAX backend for SGL
A workload for deploying LLM inference services on Kubernetes
SGLang kernel library for NPU
This is the documentation repository for SGLang. It is auto-generated from https://github.com/sgl-project/sglang
DeepGEMM: clean and efficient FP8 GEMM kernels with fine-grained scaling
SGLang kernel library for Intel XPU
SGLang Kernel Wheel Index
Fast and memory-efficient exact attention
SGLang wheels for multiple platforms
Cookbook of SGLang - Recipe
이 저장소에 대한 설명이 제공되지 않았습니다.
이 저장소에 대한 설명이 제공되지 않았습니다.
이 저장소에 대한 설명이 제공되지 않았습니다.
Fast Hadamard transform in CUDA, with a PyTorch interface
이 저장소에 대한 설명이 제공되지 않았습니다.
이 저장소에 대한 설명이 제공되지 않았습니다.
이 저장소에 대한 설명이 제공되지 않았습니다.
The test files for SGLang.
FlashMLA: Efficient Multi-head Latent Attention Kernels
이 저장소에 대한 설명이 제공되지 않았습니다.
sgl-project는 SGLang과 같은 고성능 언어 모델 서빙 프레임워크를 개발하고 있으며, mini-sglang과 SpecForge와 같은 여러 리포지토리를 통해 다양한 ML 관련 도구를 제공합니다.
sgl-project는 주로 Python, Go, C++, Jupyter Notebook, Cuda, HTML과 같은 다양한 프로그래밍 언어를 사용하여 리포지토리를 개발하고 있습니다.
네, sgl-project의 모든 리포지토리는 공개되어 있으며, 이를 통해 개발자들은 SGLang 및 관련 도구들을 자유롭게 이용하고 기여할 수 있습니다.