just now güncellendi

Organization

kvcache.ai için Kamu GitHub ayak izi

KVCache.AI is a joint research project between MADSys and top industry collaborators, focusing on efficient LLM serving.

Kamu depoları

22.973

Toplam yıldız

1.146

Takipçiler

kvcache-ai, MADSys ve sektördeki önde gelen iş ortakları arasında yürütülen bir araştırma projesidir. GitHub üzerindeki varlığı, Python, Cuda, C++, Go ve JavaScript gibi dilleri kullanarak geniş bir yelpazede projeler geliştirdiğini göstermektedir. Öne çıkan projeleri arasında ktransformers ve Mooncake gibi önemli depolar bulunmaktadır.

En popüler diller

Python 5Cuda 2C++ 1Go 1JavaScript 1

Kamu depoları

ktransformers

★17.272

A Flexible Framework for Experiencing Heterogeneous LLM Inference/Fine-tune Optimizations

Python

Güncellendi 13 Haz 2026

Mooncake

★5.567

Mooncake is the serving platform for Kimi, a leading LLM service provided by Moonshot AI.

C++

Güncellendi 13 Haz 2026

TrEnv-X

★84

Bu depo için açıklama sağlanmadı.

Güncellendi 1 Haz 2026

vllm

★15

A high-throughput and memory-efficient inference and serving engine for LLMs

Python

Güncellendi 26 May 2026

kvcache-blog

★11

Bu depo için açıklama sağlanmadı.

JavaScript

Güncellendi 12 Haz 2026

sglang

★11

SGLang is a fast serving framework for large language models and vision language models.

Python

Güncellendi 5 Haz 2026

custom_flashinfer

★7

FlashInfer: Kernel Library for LLM Serving

Cuda

Güncellendi 1 Mar 2026

DeepEP_fault_tolerance

★3

DeepEP: an efficient expert-parallel communication library that supports fault tolerance

Cuda

Güncellendi 10 Mar 2026

sglang_awq

★2

SGLang is a fast serving framework for large language models and vision language models.

Python

Güncellendi 2 Mar 2026

accelerate

★1

🚀 A simple way to launch, train, and use PyTorch models on almost any device and distributed configuration, automatic mixed precision (including fp8), and easy-to-configure FSDP and DeepSpeed support

Bilinmeyen Dil

Güncellendi 13 Nis 2026

Model-Optimizer

★0

A unified library of SOTA model optimization techniques like quantization, pruning, distillation, speculative decoding, etc. It compresses deep learning models for downstream deployment frameworks like TensorRT-LLM, TensorRT, vLLM, etc. to optimize inference speed.

Bilinmeyen Dil

Güncellendi 6 May 2026

evalscope

★0

A streamlined and customizable framework for efficient large model (LLM, VLM, AIGC) evaluation and performance benchmarking.

Python

Güncellendi 10 Nis 2026

transformers

★0

🤗 Transformers: the model-definition framework for state-of-the-art machine learning models in text, vision, audio, and multimodal models, for both inference and training.

Bilinmeyen Dil

Güncellendi 7 Nis 2026

gpustack

★0

GPU cluster manager for optimized AI model deployment

Bilinmeyen Dil

Güncellendi 8 Ara 2025

sglang-npu

★0

SGLang is a fast serving framework for large language models and vision language models.

Bilinmeyen Dil

Güncellendi 12 Ağu 2025

Sıkça sorulan sorular

kvcache-ai GitHub'da ne tür projeler geliştiriyor?

kvcache-ai, geniş bir yelpazede projeler geliştirmektedir. Özellikle LLM hizmetleri üzerine odaklanan ktransformers ve Mooncake gibi önemli depoları bulunmaktadır. Bu projeler, etkili LLM sunumu ve optimizasyonlarını hedeflemektedir.

kvcache-ai hangi programlama dillerini kullanıyor?

kvcache-ai, Python, Cuda, C++, Go ve JavaScript gibi birden fazla programlama dili kullanmaktadır. Bu diller, projelerinin çeşitliliğini ve işlevselliğini artırmaktadır.

kvcache-ai'nin depoları halka açık mı?

Evet, kvcache-ai'nin GitHub üzerindeki tüm depoları halka açıktır. Bu, projelerinin geniş bir kitle tarafından erişilebilir olmasını ve topluluk katkılarına açık olmasını sağlamaktadır.

Bu ifşa amaçlı mı?

kvcache.ai ile RepoGuard'ı izleyin ve yeni bir kamu deposu belirdiğinde anında uyarı alın.

Bu hesabı izleyin