vllm-project का सार्वजनिक GitHub उपस्थिति कई महत्वपूर्ण प्रोजेक्ट्स के साथ है, जिसमें vllm, vllm-omni, और aibrix शामिल हैं। यह संगठन मुख्य रूप से Python, C++, Rust, Go, HTML, और TypeScript जैसी भाषाओं का उपयोग करता है। vllm-project के प्रोजेक्ट्स उच्च-थ्रूपुट और मेमोरी-कुशल इंफेरेंस और सर्विंग के लिए जाने जाते हैं।
A high-throughput and memory-efficient inference and serving engine for LLMs
A framework for efficient model inference with omni-modality models
Cost-efficient and pluggable Infrastructure components for GenAI inference
System Level Intelligent Router for Mixture-of-Models at Cloud, Data Center and Edge
Transformers-compatible library for applying various compression algorithms to LLMs for optimized deployment with vLLM
vLLM’s reference system for K8S-native cluster-wide deployment with community-driven performance optimization
Community maintained hardware plugin for vLLM on Ascend
Community maintained hardware plugin for vLLM on Apple Silicon
Evaluate and Enhance Your LLM Deployments for Real-World Inference Needs
Common recipes to run vLLM
A unified library for building, evaluating, and storing speculative decoding algorithms for LLM inference in vLLM
TPU inference for vLLM, with unified JAX and PyTorch support.
A safetensors extension to efficiently store sparse quantized tensors on disk
A high-performance and light-weight router for vLLM large scale deployment
An LLM post-training framework with vLLM for RL Scaling
Fast and memory-efficient exact attention
Agent skills for vLLM
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
vLLM Daily Summarization of Merged PRs
The vLLM XPU kernels for Intel GPU
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
This repo hosts code for vLLM CI & Performance Benchmark infrastructure.
Community maintained hardware plugin for vLLM on Intel Gaudi
Stateful API logic for agentic applications using vLLM
Community maintained hardware plugin for vLLM on AWS Neuron
vLLM plugin for block-based diffusion language model (dLLM) support
Manages vllm-nccl dependency
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
vLLM Model plugin for the encoder-decoder BART model
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
vLLM Logo Assets
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
vLLM Quantization plugin for GGUF
Performance benchmark & accuracy evaluation for vLLM
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
Performance dashboard for vLLM
vLLM Quantization plugin for bitsandbytes
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
DeepGEMM: clean and efficient FP8 GEMM kernels with fine-grained scaling
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
Standalone fork of llm-multimodal from SMG
vllm-project GitHub पर उच्च-थ्रूपुट और मेमोरी-कुशल इंजीनियरिंग से संबंधित कई प्रोजेक्ट्स बनाता है, जैसे कि vllm और vllm-omni। ये प्रोजेक्ट्स LLMs के लिए इंफेरेंस और सर्विंग को अनुकूलित करते हैं।
vllm-project मुख्य रूप से Python, C++, Rust, Go, HTML और TypeScript जैसी प्रोग्रामिंग भाषाओं का उपयोग करता है। ये भाषाएँ इनके प्रोजेक्ट्स की विविधता और कार्यक्षमता में योगदान करती हैं।
हाँ, vllm-project के सभी रिपॉजिटरी सार्वजनिक हैं। यह संगठन GitHub पर अपने काम को साझा करता है, जिससे अन्य डेवलपर्स को सहयोग और उपयोग करने का अवसर मिलता है।
RepoGuard के साथ vLLM की निगरानी करें और जैसे ही एक नया सार्वजनिक रिपोजिटरी बनता है, सूचित हों।
इस खाते की निगरानी करें