La organización vllm-project en GitHub presenta una amplia gama de proyectos enfocados en la inferencia y el despliegue de modelos de lenguaje. Sus principales lenguajes de programación incluyen Python, C++, Rust, Go y TypeScript. Entre sus repositorios más destacados se encuentran vllm y vllm-omni, que son ampliamente utilizados en la comunidad de inteligencia artificial.
A high-throughput and memory-efficient inference and serving engine for LLMs
A framework for efficient model inference with omni-modality models
Cost-efficient and pluggable Infrastructure components for GenAI inference
System Level Intelligent Router for Mixture-of-Models at Cloud, Data Center and Edge
Transformers-compatible library for applying various compression algorithms to LLMs for optimized deployment with vLLM
vLLM’s reference system for K8S-native cluster-wide deployment with community-driven performance optimization
Community maintained hardware plugin for vLLM on Ascend
Community maintained hardware plugin for vLLM on Apple Silicon
Evaluate and Enhance Your LLM Deployments for Real-World Inference Needs
Common recipes to run vLLM
A unified library for building, evaluating, and storing speculative decoding algorithms for LLM inference in vLLM
TPU inference for vLLM, with unified JAX and PyTorch support.
A safetensors extension to efficiently store sparse quantized tensors on disk
A high-performance and light-weight router for vLLM large scale deployment
An LLM post-training framework with vLLM for RL Scaling
Fast and memory-efficient exact attention
Agent skills for vLLM
No se proporcionó descripción para este repositorio.
vLLM Daily Summarization of Merged PRs
The vLLM XPU kernels for Intel GPU
No se proporcionó descripción para este repositorio.
This repo hosts code for vLLM CI & Performance Benchmark infrastructure.
Community maintained hardware plugin for vLLM on Intel Gaudi
Stateful API logic for agentic applications using vLLM
Community maintained hardware plugin for vLLM on AWS Neuron
vLLM plugin for block-based diffusion language model (dLLM) support
Manages vllm-nccl dependency
No se proporcionó descripción para este repositorio.
vLLM Model plugin for the encoder-decoder BART model
No se proporcionó descripción para este repositorio.
vLLM Logo Assets
No se proporcionó descripción para este repositorio.
vLLM Quantization plugin for GGUF
Performance benchmark & accuracy evaluation for vLLM
No se proporcionó descripción para este repositorio.
Performance dashboard for vLLM
vLLM Quantization plugin for bitsandbytes
No se proporcionó descripción para este repositorio.
No se proporcionó descripción para este repositorio.
DeepGEMM: clean and efficient FP8 GEMM kernels with fine-grained scaling
No se proporcionó descripción para este repositorio.
Standalone fork of llm-multimodal from SMG
vllm-project desarrolla herramientas y bibliotecas para la inferencia de modelos de lenguaje, incluyendo repositorios como vllm y vllm-omni, que son esenciales para la optimización y el despliegue de modelos de inteligencia artificial.
vllm-project utiliza varios lenguajes de programación, siendo los principales Python, C++, Rust, Go y TypeScript. Esta diversidad permite el desarrollo de soluciones eficientes para el manejo de modelos de lenguaje.
Sí, todos los repositorios de vllm-project son públicos. Esto permite a la comunidad acceder a sus proyectos y contribuciones, promoviendo la colaboración y el aprendizaje en el ámbito de la inteligencia artificial.
Monitorea a vLLM con RepoGuard y recibe alertas en el momento en que aparece un nuevo repositorio público.
Monitorea esta cuenta