vllm-project는 GitHub에서 다양한 공개 리포지토리를 운영하는 조직입니다. 주요 프로그래밍 언어로는 Python, C++, Rust, Go, HTML, TypeScript가 있으며, vllm, vllm-omni, aibrix와 같은 주목할 만한 프로젝트들이 포함되어 있습니다. 이들은 LLM 모델의 효율적인 추론 및 배포를 위한 솔루션을 제공합니다.
A high-throughput and memory-efficient inference and serving engine for LLMs
A framework for efficient model inference with omni-modality models
Cost-efficient and pluggable Infrastructure components for GenAI inference
System Level Intelligent Router for Mixture-of-Models at Cloud, Data Center and Edge
Transformers-compatible library for applying various compression algorithms to LLMs for optimized deployment with vLLM
vLLM’s reference system for K8S-native cluster-wide deployment with community-driven performance optimization
Community maintained hardware plugin for vLLM on Ascend
Community maintained hardware plugin for vLLM on Apple Silicon
Evaluate and Enhance Your LLM Deployments for Real-World Inference Needs
Common recipes to run vLLM
A unified library for building, evaluating, and storing speculative decoding algorithms for LLM inference in vLLM
TPU inference for vLLM, with unified JAX and PyTorch support.
A safetensors extension to efficiently store sparse quantized tensors on disk
A high-performance and light-weight router for vLLM large scale deployment
An LLM post-training framework with vLLM for RL Scaling
Fast and memory-efficient exact attention
Agent skills for vLLM
이 저장소에 대한 설명이 제공되지 않았습니다.
vLLM Daily Summarization of Merged PRs
The vLLM XPU kernels for Intel GPU
이 저장소에 대한 설명이 제공되지 않았습니다.
This repo hosts code for vLLM CI & Performance Benchmark infrastructure.
Community maintained hardware plugin for vLLM on Intel Gaudi
Stateful API logic for agentic applications using vLLM
Community maintained hardware plugin for vLLM on AWS Neuron
vLLM plugin for block-based diffusion language model (dLLM) support
Manages vllm-nccl dependency
이 저장소에 대한 설명이 제공되지 않았습니다.
vLLM Model plugin for the encoder-decoder BART model
이 저장소에 대한 설명이 제공되지 않았습니다.
vLLM Logo Assets
이 저장소에 대한 설명이 제공되지 않았습니다.
vLLM Quantization plugin for GGUF
Performance benchmark & accuracy evaluation for vLLM
이 저장소에 대한 설명이 제공되지 않았습니다.
Performance dashboard for vLLM
vLLM Quantization plugin for bitsandbytes
이 저장소에 대한 설명이 제공되지 않았습니다.
이 저장소에 대한 설명이 제공되지 않았습니다.
DeepGEMM: clean and efficient FP8 GEMM kernels with fine-grained scaling
이 저장소에 대한 설명이 제공되지 않았습니다.
Standalone fork of llm-multimodal from SMG
vllm-project는 LLMs를 위한 추론 및 서빙 엔진을 비롯하여 다양한 모델 추론 프레임워크와 인프라 구성 요소를 개발합니다. 이들은 AI 및 머신러닝 분야에서 널리 사용되고 있습니다.
vllm-project의 주요 프로그래밍 언어는 Python, C++, Rust, Go, HTML, TypeScript입니다. 이러한 언어들은 다양한 프로젝트에서 효율적인 성능을 발휘하는 데 사용됩니다.
네, vllm-project의 모든 리포지토리는 공개되어 있습니다. 이를 통해 사용자들은 다양한 프로젝트를 탐색하고 기여할 수 있습니다.