Atualizado 3 h ago

Organization

Pegada pública no GitHub de vLLM

@vllm-project

Ver perfil no GitHub

Repositórios públicos

110.891

Total de estrelas

3.436

Seguidores

A organização vllm-project possui uma presença significativa no GitHub, abrindo acesso a uma ampla gama de repositórios voltados para inteligência artificial e aprendizado de máquina. Com linguagens predominantes como Python, C++, Rust e Go, projetos notáveis incluem vllm e vllm-omni, que são amplamente utilizados para inferência e servimento de modelos de LLM.

Principais linguagens

Python 21C++ 3Rust 3Go 2HTML 2TypeScript 2JavaScript 1Shell 1

Repositórios públicos

vllm

★82.765

A high-throughput and memory-efficient inference and serving engine for LLMs

Python

Atualizado 13 de jun. de 2026

vllm-omni

★5.130

A framework for efficient model inference with omni-modality models

Python

Atualizado 13 de jun. de 2026

aibrix

★4.875

Cost-efficient and pluggable Infrastructure components for GenAI inference

Atualizado 13 de jun. de 2026

semantic-router

★4.349

System Level Intelligent Router for Mixture-of-Models at Cloud, Data Center and Edge

Atualizado 13 de jun. de 2026

llm-compressor

★3.392

Transformers-compatible library for applying various compression algorithms to LLMs for optimized deployment with vLLM

Python

Atualizado 13 de jun. de 2026

production-stack

★2.401

vLLM’s reference system for K8S-native cluster-wide deployment with community-driven performance optimization

Python

Atualizado 13 de jun. de 2026

vllm-ascend

★2.237

Community maintained hardware plugin for vLLM on Ascend

C++

Atualizado 13 de jun. de 2026

vllm-metal

★1.315

Community maintained hardware plugin for vLLM on Apple Silicon

Python

Atualizado 13 de jun. de 2026

guidellm

★1.252

Evaluate and Enhance Your LLM Deployments for Real-World Inference Needs

Python

Atualizado 13 de jun. de 2026

recipes

★846

Common recipes to run vLLM

JavaScript

Atualizado 13 de jun. de 2026

speculators

★515

A unified library for building, evaluating, and storing speculative decoding algorithms for LLM inference in vLLM

Python

Atualizado 13 de jun. de 2026

tpu-inference

★350

TPU inference for vLLM, with unified JAX and PyTorch support.

Python

Atualizado 13 de jun. de 2026

compressed-tensors

★292

A safetensors extension to efficiently store sparse quantized tensors on disk

Python

Atualizado 13 de jun. de 2026

router

★267

A high-performance and light-weight router for vLLM large scale deployment

Rust

Atualizado 11 de jun. de 2026

vime

★234

An LLM post-training framework with vLLM for RL Scaling

Python

Atualizado 13 de jun. de 2026

flash-attention

★125

Fast and memory-efficient exact attention

Python

Atualizado 13 de jun. de 2026

vllm-skills

★84

Agent skills for vLLM

Shell

Atualizado 13 de jun. de 2026

vllm-openvino

★54

Nenhuma descrição fornecida para este repositório.

Python

Atualizado 22 de mai. de 2026

vllm-daily

★51

vLLM Daily Summarization of Merged PRs

Linguagem Desconhecida

Atualizado 13 de jun. de 2026

vllm-xpu-kernels

★47

The vLLM XPU kernels for Intel GPU

C++

Atualizado 13 de jun. de 2026

vllm-project.github.io

★45

Nenhuma descrição fornecida para este repositório.

HTML

Atualizado 13 de jun. de 2026

ci-infra

★43

This repo hosts code for vLLM CI & Performance Benchmark infrastructure.

HCL

Atualizado 12 de jun. de 2026

vllm-gaudi

★40

Community maintained hardware plugin for vLLM on Intel Gaudi

Python

Atualizado 12 de jun. de 2026

agentic-api

★33

Stateful API logic for agentic applications using vLLM

Rust

Atualizado 11 de jun. de 2026

vllm-neuron

★31

Community maintained hardware plugin for vLLM on AWS Neuron

Python

Atualizado 29 de mai. de 2026

dllm-plugin

★21

vLLM plugin for block-based diffusion language model (dLLM) support

Python

Atualizado 10 de jun. de 2026

vllm-nccl

★18

Manages vllm-nccl dependency

Python

Atualizado 14 de abr. de 2026

FlashMLA

★14

Nenhuma descrição fornecida para este repositório.

C++

Atualizado 1 de jun. de 2026

bart-plugin

★12

vLLM Model plugin for the encoder-decoder BART model

Python

Atualizado 3 de jun. de 2026

vLLM-in-PyTorch-Conference-2025

★11

Nenhuma descrição fornecida para este repositório.

Linguagem Desconhecida

Atualizado 26 de mai. de 2026

media-kit

★9

vLLM Logo Assets

Linguagem Desconhecida

Atualizado 27 de mai. de 2026

vllm-project.github.io-static

★9

Nenhuma descrição fornecida para este repositório.

HTML

Atualizado 26 de nov. de 2025

vllm-gguf-plugin

★8

vLLM Quantization plugin for GGUF

Python

Atualizado 13 de jun. de 2026

perf-eval

★7

Performance benchmark & accuracy evaluation for vLLM

Python

Atualizado 12 de jun. de 2026

vllm-dashboard

★4

Nenhuma descrição fornecida para este repositório.

TypeScript

Atualizado 11 de jun. de 2026

perf-dashboard

★3

Performance dashboard for vLLM

Python

Atualizado 11 de jun. de 2026

vllm-bnb-plugin

★1

vLLM Quantization plugin for bitsandbytes

Python

Atualizado 9 de jun. de 2026

rfcs

★1

Nenhuma descrição fornecida para este repositório.

Linguagem Desconhecida

Atualizado 4 de jun. de 2025

MSA

★0

Nenhuma descrição fornecida para este repositório.

Linguagem Desconhecida

Atualizado 11 de jun. de 2026

DeepGEMM

★0

DeepGEMM: clean and efficient FP8 GEMM kernels with fine-grained scaling

Cuda

Atualizado 5 de jun. de 2026

vllm-docs

★0

Nenhuma descrição fornecida para este repositório.

TypeScript

Atualizado 21 de mai. de 2026

llm-multimodal

★0

Standalone fork of llm-multimodal from SMG

Rust

Atualizado 20 de mai. de 2026

Perguntas frequentes

O que a vllm-project desenvolve no GitHub?

A vllm-project desenvolve uma variedade de ferramentas e frameworks focados em inferência e servimento de modelos de linguagem, como o vllm e o vllm-omni. Esses projetos são projetados para otimizar a performance de modelos de inteligência artificial.

Quais linguagens de programação a vllm-project utiliza?

A vllm-project utiliza várias linguagens de programação, incluindo Python, C++, Rust, Go, HTML e TypeScript. Essas linguagens são empregadas para criar suas soluções voltadas para inteligência artificial e aprendizado de máquina.

Os repositórios da vllm-project são públicos?

Sim, todos os repositórios da vllm-project são públicos. Isso permite que a comunidade acesse, utilize e contribua para projetos como vllm e aibrix, promovendo um ambiente colaborativo no desenvolvimento de tecnologias de inteligência artificial.

Essa exposição é intencional?

Monitore vLLM com o RepoGuard e receba alertas no momento em que um novo repositório público aparecer.

Monitore esta conta