vllm-project adalah organisasi yang memiliki kehadiran publik yang signifikan di GitHub dengan berbagai repositori yang mencakup berbagai bahasa pemrograman seperti Python, C++, dan Go. Beberapa repositori yang menonjol termasuk vllm, yang berfungsi sebagai mesin inferensi untuk LLM, dan vllm-omni, yang menyediakan kerangka kerja untuk inferensi model yang efisien.
A high-throughput and memory-efficient inference and serving engine for LLMs
A framework for efficient model inference with omni-modality models
Cost-efficient and pluggable Infrastructure components for GenAI inference
System Level Intelligent Router for Mixture-of-Models at Cloud, Data Center and Edge
Transformers-compatible library for applying various compression algorithms to LLMs for optimized deployment with vLLM
vLLM’s reference system for K8S-native cluster-wide deployment with community-driven performance optimization
Community maintained hardware plugin for vLLM on Ascend
Community maintained hardware plugin for vLLM on Apple Silicon
Evaluate and Enhance Your LLM Deployments for Real-World Inference Needs
Common recipes to run vLLM
A unified library for building, evaluating, and storing speculative decoding algorithms for LLM inference in vLLM
TPU inference for vLLM, with unified JAX and PyTorch support.
A safetensors extension to efficiently store sparse quantized tensors on disk
A high-performance and light-weight router for vLLM large scale deployment
An LLM post-training framework with vLLM for RL Scaling
Fast and memory-efficient exact attention
Agent skills for vLLM
Tidak ada deskripsi yang diberikan untuk repositori ini.
vLLM Daily Summarization of Merged PRs
The vLLM XPU kernels for Intel GPU
Tidak ada deskripsi yang diberikan untuk repositori ini.
This repo hosts code for vLLM CI & Performance Benchmark infrastructure.
Community maintained hardware plugin for vLLM on Intel Gaudi
Stateful API logic for agentic applications using vLLM
Community maintained hardware plugin for vLLM on AWS Neuron
vLLM plugin for block-based diffusion language model (dLLM) support
Manages vllm-nccl dependency
Tidak ada deskripsi yang diberikan untuk repositori ini.
vLLM Model plugin for the encoder-decoder BART model
Tidak ada deskripsi yang diberikan untuk repositori ini.
vLLM Logo Assets
Tidak ada deskripsi yang diberikan untuk repositori ini.
vLLM Quantization plugin for GGUF
Performance benchmark & accuracy evaluation for vLLM
Tidak ada deskripsi yang diberikan untuk repositori ini.
Performance dashboard for vLLM
vLLM Quantization plugin for bitsandbytes
Tidak ada deskripsi yang diberikan untuk repositori ini.
Tidak ada deskripsi yang diberikan untuk repositori ini.
DeepGEMM: clean and efficient FP8 GEMM kernels with fine-grained scaling
Tidak ada deskripsi yang diberikan untuk repositori ini.
Standalone fork of llm-multimodal from SMG
vllm-project membangun berbagai repositori yang berkaitan dengan inferensi dan penyajian model machine learning. Repositori utama seperti vllm dan vllm-omni menawarkan solusi untuk kebutuhan inferensi yang efisien.
vllm-project menggunakan berbagai bahasa pemrograman termasuk Python, C++, Rust, Go, HTML, dan TypeScript. Ini mencerminkan diversitas dalam pengembangan proyek mereka di GitHub.
Ya, semua repositori vllm-project bersifat publik. Ini memungkinkan pengguna dan pengembang lain untuk mengakses, berkontribusi, dan mempelajari kode sumber yang tersedia secara terbuka di GitHub.
Pantau vLLM dengan RepoGuard dan dapatkan pemberitahuan saat repositori publik baru muncul.
Pantau akun ini