Bijgewerkt 3 h ago

Organization

Publieke GitHub-voetafdruk van vLLM

@vllm-project

Bekijk profiel op GitHub

Publieke repositories

110.891

Totaal aantal sterren

3.436

Volgers

De vllm-project organisatie heeft een aanzienlijke aanwezigheid op GitHub met een breed scala aan publieke repositories. Deze omvatten belangrijke projecten zoals vllm en vllm-omni, die zich richten op efficiënte inferentie en modelbeheer. De primaire programmeertalen zijn Python, C++, Rust, Go, HTML en TypeScript.

Top talen

Python 21C++ 3Rust 3Go 2HTML 2TypeScript 2JavaScript 1Shell 1

Publieke repositories

vllm

★82.765

A high-throughput and memory-efficient inference and serving engine for LLMs

Python

Bijgewerkt 13 jun 2026

vllm-omni

★5.130

A framework for efficient model inference with omni-modality models

Python

Bijgewerkt 13 jun 2026

aibrix

★4.875

Cost-efficient and pluggable Infrastructure components for GenAI inference

Bijgewerkt 13 jun 2026

semantic-router

★4.349

System Level Intelligent Router for Mixture-of-Models at Cloud, Data Center and Edge

Bijgewerkt 13 jun 2026

llm-compressor

★3.392

Transformers-compatible library for applying various compression algorithms to LLMs for optimized deployment with vLLM

Python

Bijgewerkt 13 jun 2026

production-stack

★2.401

vLLM’s reference system for K8S-native cluster-wide deployment with community-driven performance optimization

Python

Bijgewerkt 13 jun 2026

vllm-ascend

★2.237

Community maintained hardware plugin for vLLM on Ascend

C++

Bijgewerkt 13 jun 2026

vllm-metal

★1.315

Community maintained hardware plugin for vLLM on Apple Silicon

Python

Bijgewerkt 13 jun 2026

guidellm

★1.252

Evaluate and Enhance Your LLM Deployments for Real-World Inference Needs

Python

Bijgewerkt 13 jun 2026

recipes

★846

Common recipes to run vLLM

JavaScript

Bijgewerkt 13 jun 2026

speculators

★515

A unified library for building, evaluating, and storing speculative decoding algorithms for LLM inference in vLLM

Python

Bijgewerkt 13 jun 2026

tpu-inference

★350

TPU inference for vLLM, with unified JAX and PyTorch support.

Python

Bijgewerkt 13 jun 2026

compressed-tensors

★292

A safetensors extension to efficiently store sparse quantized tensors on disk

Python

Bijgewerkt 13 jun 2026

router

★267

A high-performance and light-weight router for vLLM large scale deployment

Rust

Bijgewerkt 11 jun 2026

vime

★234

An LLM post-training framework with vLLM for RL Scaling

Python

Bijgewerkt 13 jun 2026

flash-attention

★125

Fast and memory-efficient exact attention

Python

Bijgewerkt 13 jun 2026

vllm-skills

★84

Agent skills for vLLM

Shell

Bijgewerkt 13 jun 2026

vllm-openvino

★54

Geen beschrijving gegeven voor deze repository.

Python

Bijgewerkt 22 mei 2026

vllm-daily

★51

vLLM Daily Summarization of Merged PRs

Onbekende taal

Bijgewerkt 13 jun 2026

vllm-xpu-kernels

★47

The vLLM XPU kernels for Intel GPU

C++

Bijgewerkt 13 jun 2026

vllm-project.github.io

★45

Geen beschrijving gegeven voor deze repository.

HTML

Bijgewerkt 13 jun 2026

ci-infra

★43

This repo hosts code for vLLM CI & Performance Benchmark infrastructure.

HCL

Bijgewerkt 12 jun 2026

vllm-gaudi

★40

Community maintained hardware plugin for vLLM on Intel Gaudi

Python

Bijgewerkt 12 jun 2026

agentic-api

★33

Stateful API logic for agentic applications using vLLM

Rust

Bijgewerkt 11 jun 2026

vllm-neuron

★31

Community maintained hardware plugin for vLLM on AWS Neuron

Python

Bijgewerkt 29 mei 2026

dllm-plugin

★21

vLLM plugin for block-based diffusion language model (dLLM) support

Python

Bijgewerkt 10 jun 2026

vllm-nccl

★18

Manages vllm-nccl dependency

Python

Bijgewerkt 14 apr 2026

FlashMLA

★14

Geen beschrijving gegeven voor deze repository.

C++

Bijgewerkt 1 jun 2026

bart-plugin

★12

vLLM Model plugin for the encoder-decoder BART model

Python

Bijgewerkt 3 jun 2026

vLLM-in-PyTorch-Conference-2025

★11

Geen beschrijving gegeven voor deze repository.

Onbekende taal

Bijgewerkt 26 mei 2026

media-kit

★9

vLLM Logo Assets

Onbekende taal

Bijgewerkt 27 mei 2026

vllm-project.github.io-static

★9

Geen beschrijving gegeven voor deze repository.

HTML

Bijgewerkt 26 nov 2025

vllm-gguf-plugin

★8

vLLM Quantization plugin for GGUF

Python

Bijgewerkt 13 jun 2026

perf-eval

★7

Performance benchmark & accuracy evaluation for vLLM

Python

Bijgewerkt 12 jun 2026

vllm-dashboard

★4

Geen beschrijving gegeven voor deze repository.

TypeScript

Bijgewerkt 11 jun 2026

perf-dashboard

★3

Performance dashboard for vLLM

Python

Bijgewerkt 11 jun 2026

vllm-bnb-plugin

★1

vLLM Quantization plugin for bitsandbytes

Python

Bijgewerkt 9 jun 2026

rfcs

★1

Geen beschrijving gegeven voor deze repository.

Onbekende taal

Bijgewerkt 4 jun 2025

MSA

★0

Geen beschrijving gegeven voor deze repository.

Onbekende taal

Bijgewerkt 11 jun 2026

DeepGEMM

★0

DeepGEMM: clean and efficient FP8 GEMM kernels with fine-grained scaling

Cuda

Bijgewerkt 5 jun 2026

vllm-docs

★0

Geen beschrijving gegeven voor deze repository.

TypeScript

Bijgewerkt 21 mei 2026

llm-multimodal

★0

Standalone fork of llm-multimodal from SMG

Rust

Bijgewerkt 20 mei 2026

Veelgestelde vragen

Wat bouwt vllm-project op GitHub?

vllm-project ontwikkelt verschillende projecten gericht op inferentie en modelbeheer, waaronder vllm voor LLM's en vllm-omni voor efficiënte modelinference. Deze projecten zijn ontworpen om te voldoen aan de behoeften van de gemeenschap en de technologische vooruitgang.

Welke programmeertalen gebruikt vllm-project?

De primaire programmeertalen die vllm-project gebruikt zijn Python, C++, Rust, Go, HTML en TypeScript. Deze talen ondersteunen de ontwikkeling van hun diverse repositories en projecten die gericht zijn op machine learning en infrastructuur.

Zijn de repositories van vllm-project openbaar?

Ja, alle repositories van vllm-project zijn openbaar op GitHub. Dit zorgt ervoor dat de gemeenschap toegang heeft tot de code en bijdraagt aan de ontwikkeling van de projecten, wat transparantie en samenwerking bevordert.

Is deze blootstelling bedoeld?

Monitor vLLM met RepoGuard en krijg een waarschuwing op het moment dat er een nieuwe publieke repository verschijnt.

Monitor dit account