sgl-project 在 GitHub 上拥有多个公共代码库,专注于大语言模型和多模态模型的开发。其主要编程语言包括 Python、Go 和 C++,其中著名的项目如 sglang 和 mini-sglang 提供了高性能的服务框架,适用于复杂的 LLM 服务系统。
SGLang is a high-performance serving framework for large language models and multimodal models.
A compact implementation of SGLang, designed to demystify the complexities of modern LLM serving systems.
Train speculative decoding models effortlessly and port them smoothly to SGLang serving.
Materials for learning SGLang
SGLang Omni: High-Performance Multi-Stage Pipeline Framework for Omni Models
Genai-bench is a powerful benchmark tool designed for comprehensive token-level performance evaluation of large language model (LLM) serving systems.
JAX backend for SGL
A workload for deploying LLM inference services on Kubernetes
SGLang kernel library for NPU
This is the documentation repository for SGLang. It is auto-generated from https://github.com/sgl-project/sglang
DeepGEMM: clean and efficient FP8 GEMM kernels with fine-grained scaling
SGLang kernel library for Intel XPU
SGLang Kernel Wheel Index
Fast and memory-efficient exact attention
SGLang wheels for multiple platforms
Cookbook of SGLang - Recipe
此仓库未提供描述。
此仓库未提供描述。
此仓库未提供描述。
Fast Hadamard transform in CUDA, with a PyTorch interface
此仓库未提供描述。
此仓库未提供描述。
此仓库未提供描述。
The test files for SGLang.
FlashMLA: Efficient Multi-head Latent Attention Kernels
此仓库未提供描述。
sgl-project 在 GitHub 上构建了多个与大语言模型相关的项目,包括 sglang 和 mini-sglang 等,致力于提供高效的模型服务和学习材料。
sgl-project 主要使用 Python、Go、C++、Jupyter Notebook 和 Cuda 等编程语言。这些语言支持其多个公开项目的开发和实现。
是的,sgl-project 的所有代码库都是公开的,任何人都可以访问和使用这些资源,包括其重要项目和学习材料。