RepoGuard
Mis à jour 3 h ago
vLLM

Organization

Empreinte publique GitHub de vLLM

@vllm-project
Voir le profil sur GitHub

42

Dépôts publics

110 891

Total des étoiles

3 436

Abonnés

L'organisation vllm-project sur GitHub se concentre sur le développement d'outils pour l'inférence et le déploiement des modèles d'apprentissage automatique. Elle possède plusieurs répertoires publics écrits principalement en Python, C++, Rust, et Go, avec des projets notables tels que vllm et vllm-omni, qui sont largement utilisés dans la communauté.

Langues principales

Python 21C++ 3Rust 3Go 2HTML 2TypeScript 2JavaScript 1Shell 1

Dépôts publics

vllm

82 765

A high-throughput and memory-efficient inference and serving engine for LLMs

Python
Mis à jour 13 juin 2026

vllm-omni

5 130

A framework for efficient model inference with omni-modality models

Python
Mis à jour 13 juin 2026

aibrix

4 875

Cost-efficient and pluggable Infrastructure components for GenAI inference

Go
Mis à jour 13 juin 2026

semantic-router

4 349

System Level Intelligent Router for Mixture-of-Models at Cloud, Data Center and Edge

Go
Mis à jour 13 juin 2026

llm-compressor

3 392

Transformers-compatible library for applying various compression algorithms to LLMs for optimized deployment with vLLM

Python
Mis à jour 13 juin 2026

production-stack

2 401

vLLM’s reference system for K8S-native cluster-wide deployment with community-driven performance optimization

Python
Mis à jour 13 juin 2026

vllm-ascend

2 237

Community maintained hardware plugin for vLLM on Ascend

C++
Mis à jour 13 juin 2026

vllm-metal

1 315

Community maintained hardware plugin for vLLM on Apple Silicon

Python
Mis à jour 13 juin 2026

guidellm

1 252

Evaluate and Enhance Your LLM Deployments for Real-World Inference Needs

Python
Mis à jour 13 juin 2026

recipes

846

Common recipes to run vLLM

JavaScript
Mis à jour 13 juin 2026

speculators

515

A unified library for building, evaluating, and storing speculative decoding algorithms for LLM inference in vLLM

Python
Mis à jour 13 juin 2026

tpu-inference

350

TPU inference for vLLM, with unified JAX and PyTorch support.

Python
Mis à jour 13 juin 2026

compressed-tensors

292

A safetensors extension to efficiently store sparse quantized tensors on disk

Python
Mis à jour 13 juin 2026

router

267

A high-performance and light-weight router for vLLM large scale deployment

Rust
Mis à jour 11 juin 2026

vime

234

An LLM post-training framework with vLLM for RL Scaling

Python
Mis à jour 13 juin 2026

flash-attention

125

Fast and memory-efficient exact attention

Python
Mis à jour 13 juin 2026

vllm-skills

84

Agent skills for vLLM

Shell
Mis à jour 13 juin 2026

vllm-openvino

54

Aucune description fournie pour ce dépôt.

Python
Mis à jour 22 mai 2026

vllm-daily

51

vLLM Daily Summarization of Merged PRs

Langue inconnue
Mis à jour 13 juin 2026

vllm-xpu-kernels

47

The vLLM XPU kernels for Intel GPU

C++
Mis à jour 13 juin 2026

vllm-project.github.io

45

Aucune description fournie pour ce dépôt.

HTML
Mis à jour 13 juin 2026

ci-infra

43

This repo hosts code for vLLM CI & Performance Benchmark infrastructure.

HCL
Mis à jour 12 juin 2026

vllm-gaudi

40

Community maintained hardware plugin for vLLM on Intel Gaudi

Python
Mis à jour 12 juin 2026

agentic-api

33

Stateful API logic for agentic applications using vLLM

Rust
Mis à jour 11 juin 2026

vllm-neuron

31

Community maintained hardware plugin for vLLM on AWS Neuron

Python
Mis à jour 29 mai 2026

dllm-plugin

21

vLLM plugin for block-based diffusion language model (dLLM) support

Python
Mis à jour 10 juin 2026

vllm-nccl

18

Manages vllm-nccl dependency

Python
Mis à jour 14 avr. 2026

FlashMLA

14

Aucune description fournie pour ce dépôt.

C++
Mis à jour 1 juin 2026

bart-plugin

12

vLLM Model plugin for the encoder-decoder BART model

Python
Mis à jour 3 juin 2026

vLLM-in-PyTorch-Conference-2025

11

Aucune description fournie pour ce dépôt.

Langue inconnue
Mis à jour 26 mai 2026

media-kit

9

vLLM Logo Assets

Langue inconnue
Mis à jour 27 mai 2026

vllm-project.github.io-static

9

Aucune description fournie pour ce dépôt.

HTML
Mis à jour 26 nov. 2025

vllm-gguf-plugin

8

vLLM Quantization plugin for GGUF

Python
Mis à jour 13 juin 2026

perf-eval

7

Performance benchmark & accuracy evaluation for vLLM

Python
Mis à jour 12 juin 2026

vllm-dashboard

4

Aucune description fournie pour ce dépôt.

TypeScript
Mis à jour 11 juin 2026

perf-dashboard

3

Performance dashboard for vLLM

Python
Mis à jour 11 juin 2026

vllm-bnb-plugin

1

vLLM Quantization plugin for bitsandbytes

Python
Mis à jour 9 juin 2026

rfcs

1

Aucune description fournie pour ce dépôt.

Langue inconnue
Mis à jour 4 juin 2025

MSA

0

Aucune description fournie pour ce dépôt.

Langue inconnue
Mis à jour 11 juin 2026

DeepGEMM

0

DeepGEMM: clean and efficient FP8 GEMM kernels with fine-grained scaling

Cuda
Mis à jour 5 juin 2026

vllm-docs

0

Aucune description fournie pour ce dépôt.

TypeScript
Mis à jour 21 mai 2026

llm-multimodal

0

Standalone fork of llm-multimodal from SMG

Rust
Mis à jour 20 mai 2026

Questions fréquemment posées

Que construit vllm-project sur GitHub ?

vllm-project développe des outils et des frameworks pour l'inférence de modèles d'apprentissage automatique. Ses principaux projets incluent vllm, un moteur d'inférence efficace, et vllm-omni, un cadre pour l'inférence de modèles omni-modaux.

Quelles langues de programmation utilise vllm-project ?

vllm-project utilise principalement Python, C++, Rust, et Go pour ses développements. Ces langages sont adaptés à la création d'outils performants pour l'inférence de modèles d'apprentissage automatique.

Les dépôts de vllm-project sont-ils publics ?

Oui, tous les dépôts de vllm-project sur GitHub sont publics. Cela permet à la communauté de consulter, d'utiliser et de contribuer aux projets liés à l'inférence et au déploiement des modèles d'apprentissage automatique.

Cette exposition est-elle intentionnelle ?

Surveillez vLLM avec RepoGuard et soyez alerté dès qu'un nouveau dépôt public apparaît.

Surveiller ce compte