RepoGuard
Zaktualizowane 3 h ago
vLLM

Organization

Publiczne ślady GitHub vLLM

@vllm-project
Zobacz profil na GitHubie

42

Publiczne repozytoria

110 891

Łączna liczba gwiazdek

3436

Obserwujący

Organizacja vllm-project na GitHubie posiada szereg publicznych repozytoriów, w tym projekty takie jak vllm i vllm-omni, które koncentrują się na efektywnym wnioskowaniu modeli LLM. Ich główne języki programowania to Python, C++, Rust, Go, HTML i TypeScript, co wskazuje na różnorodność ich działań w obszarze sztucznej inteligencji.

Najpopularniejsze języki

Python 21C++ 3Rust 3Go 2HTML 2TypeScript 2JavaScript 1Shell 1

Publiczne repozytoria

vllm

82 765

A high-throughput and memory-efficient inference and serving engine for LLMs

Python
Zaktualizowane 13 cze 2026

vllm-omni

5130

A framework for efficient model inference with omni-modality models

Python
Zaktualizowane 13 cze 2026

aibrix

4875

Cost-efficient and pluggable Infrastructure components for GenAI inference

Go
Zaktualizowane 13 cze 2026

semantic-router

4349

System Level Intelligent Router for Mixture-of-Models at Cloud, Data Center and Edge

Go
Zaktualizowane 13 cze 2026

llm-compressor

3392

Transformers-compatible library for applying various compression algorithms to LLMs for optimized deployment with vLLM

Python
Zaktualizowane 13 cze 2026

production-stack

2401

vLLM’s reference system for K8S-native cluster-wide deployment with community-driven performance optimization

Python
Zaktualizowane 13 cze 2026

vllm-ascend

2237

Community maintained hardware plugin for vLLM on Ascend

C++
Zaktualizowane 13 cze 2026

vllm-metal

1315

Community maintained hardware plugin for vLLM on Apple Silicon

Python
Zaktualizowane 13 cze 2026

guidellm

1252

Evaluate and Enhance Your LLM Deployments for Real-World Inference Needs

Python
Zaktualizowane 13 cze 2026

recipes

846

Common recipes to run vLLM

JavaScript
Zaktualizowane 13 cze 2026

speculators

515

A unified library for building, evaluating, and storing speculative decoding algorithms for LLM inference in vLLM

Python
Zaktualizowane 13 cze 2026

tpu-inference

350

TPU inference for vLLM, with unified JAX and PyTorch support.

Python
Zaktualizowane 13 cze 2026

compressed-tensors

292

A safetensors extension to efficiently store sparse quantized tensors on disk

Python
Zaktualizowane 13 cze 2026

router

267

A high-performance and light-weight router for vLLM large scale deployment

Rust
Zaktualizowane 11 cze 2026

vime

234

An LLM post-training framework with vLLM for RL Scaling

Python
Zaktualizowane 13 cze 2026

flash-attention

125

Fast and memory-efficient exact attention

Python
Zaktualizowane 13 cze 2026

vllm-skills

84

Agent skills for vLLM

Shell
Zaktualizowane 13 cze 2026

vllm-openvino

54

Brak opisu dla tego repozytorium.

Python
Zaktualizowane 22 maj 2026

vllm-daily

51

vLLM Daily Summarization of Merged PRs

Nieznany język
Zaktualizowane 13 cze 2026

vllm-xpu-kernels

47

The vLLM XPU kernels for Intel GPU

C++
Zaktualizowane 13 cze 2026

vllm-project.github.io

45

Brak opisu dla tego repozytorium.

HTML
Zaktualizowane 13 cze 2026

ci-infra

43

This repo hosts code for vLLM CI & Performance Benchmark infrastructure.

HCL
Zaktualizowane 12 cze 2026

vllm-gaudi

40

Community maintained hardware plugin for vLLM on Intel Gaudi

Python
Zaktualizowane 12 cze 2026

agentic-api

33

Stateful API logic for agentic applications using vLLM

Rust
Zaktualizowane 11 cze 2026

vllm-neuron

31

Community maintained hardware plugin for vLLM on AWS Neuron

Python
Zaktualizowane 29 maj 2026

dllm-plugin

21

vLLM plugin for block-based diffusion language model (dLLM) support

Python
Zaktualizowane 10 cze 2026

vllm-nccl

18

Manages vllm-nccl dependency

Python
Zaktualizowane 14 kwi 2026

FlashMLA

14

Brak opisu dla tego repozytorium.

C++
Zaktualizowane 1 cze 2026

bart-plugin

12

vLLM Model plugin for the encoder-decoder BART model

Python
Zaktualizowane 3 cze 2026

vLLM-in-PyTorch-Conference-2025

11

Brak opisu dla tego repozytorium.

Nieznany język
Zaktualizowane 26 maj 2026

media-kit

9

vLLM Logo Assets

Nieznany język
Zaktualizowane 27 maj 2026

vllm-project.github.io-static

9

Brak opisu dla tego repozytorium.

HTML
Zaktualizowane 26 lis 2025

vllm-gguf-plugin

8

vLLM Quantization plugin for GGUF

Python
Zaktualizowane 13 cze 2026

perf-eval

7

Performance benchmark & accuracy evaluation for vLLM

Python
Zaktualizowane 12 cze 2026

vllm-dashboard

4

Brak opisu dla tego repozytorium.

TypeScript
Zaktualizowane 11 cze 2026

perf-dashboard

3

Performance dashboard for vLLM

Python
Zaktualizowane 11 cze 2026

vllm-bnb-plugin

1

vLLM Quantization plugin for bitsandbytes

Python
Zaktualizowane 9 cze 2026

rfcs

1

Brak opisu dla tego repozytorium.

Nieznany język
Zaktualizowane 4 cze 2025

MSA

0

Brak opisu dla tego repozytorium.

Nieznany język
Zaktualizowane 11 cze 2026

DeepGEMM

0

DeepGEMM: clean and efficient FP8 GEMM kernels with fine-grained scaling

Cuda
Zaktualizowane 5 cze 2026

vllm-docs

0

Brak opisu dla tego repozytorium.

TypeScript
Zaktualizowane 21 maj 2026

llm-multimodal

0

Standalone fork of llm-multimodal from SMG

Rust
Zaktualizowane 20 maj 2026

Najczęściej zadawane pytania

Co buduje vllm-project na GitHubie?

vllm-project skupia się na tworzeniu narzędzi do wnioskowania modeli sztucznej inteligencji, w tym repozytoriów takich jak vllm i vllm-omni, które wspierają różnorodne podejścia do efektywnego wnioskowania.

Jakie języki programowania wykorzystuje vllm-project?

vllm-project wykorzystuje kilka języków programowania, głównie Python, C++, Rust, Go, HTML i TypeScript, co pozwala na rozwijanie wszechstronnych projektów w dziedzinie sztucznej inteligencji.

Czy repozytoria vllm-project są publiczne?

Tak, wszystkie repozytoria vllm-project są publiczne, co umożliwia społeczności przeglądanie, używanie i przyczynianie się do ich rozwoju oraz poprawy narzędzi do wnioskowania modeli LLM.

Czy to ujawnienie jest zamierzone?

Monitoruj vLLM z RepoGuard i otrzymuj powiadomienia w momencie, gdy pojawi się nowe publiczne repozytorium.

Monitoruj to konto