RepoGuard
just now güncellendi
kvcache.ai

Organization

kvcache.ai için Kamu GitHub ayak izi

@kvcache-ai
GitHub'da profili görüntüle

KVCache.AI is a joint research project between MADSys and top industry collaborators, focusing on efficient LLM serving.

15

Kamu depoları

22.973

Toplam yıldız

1.146

Takipçiler

kvcache-ai, MADSys ve sektördeki önde gelen iş ortakları arasında yürütülen bir araştırma projesidir. GitHub üzerindeki varlığı, Python, Cuda, C++, Go ve JavaScript gibi dilleri kullanarak geniş bir yelpazede projeler geliştirdiğini göstermektedir. Öne çıkan projeleri arasında ktransformers ve Mooncake gibi önemli depolar bulunmaktadır.

En popüler diller

Python 5Cuda 2C++ 1Go 1JavaScript 1

Kamu depoları

ktransformers

17.272

A Flexible Framework for Experiencing Heterogeneous LLM Inference/Fine-tune Optimizations

Python
Güncellendi 13 Haz 2026

Mooncake

5.567

Mooncake is the serving platform for Kimi, a leading LLM service provided by Moonshot AI.

C++
Güncellendi 13 Haz 2026

TrEnv-X

84

Bu depo için açıklama sağlanmadı.

Go
Güncellendi 1 Haz 2026

vllm

15

A high-throughput and memory-efficient inference and serving engine for LLMs

Python
Güncellendi 26 May 2026

kvcache-blog

11

Bu depo için açıklama sağlanmadı.

JavaScript
Güncellendi 12 Haz 2026

sglang

11

SGLang is a fast serving framework for large language models and vision language models.

Python
Güncellendi 5 Haz 2026

custom_flashinfer

7

FlashInfer: Kernel Library for LLM Serving

Cuda
Güncellendi 1 Mar 2026

DeepEP_fault_tolerance

3

DeepEP: an efficient expert-parallel communication library that supports fault tolerance

Cuda
Güncellendi 10 Mar 2026

sglang_awq

2

SGLang is a fast serving framework for large language models and vision language models.

Python
Güncellendi 2 Mar 2026

accelerate

1

🚀 A simple way to launch, train, and use PyTorch models on almost any device and distributed configuration, automatic mixed precision (including fp8), and easy-to-configure FSDP and DeepSpeed support

Bilinmeyen Dil
Güncellendi 13 Nis 2026

Model-Optimizer

0

A unified library of SOTA model optimization techniques like quantization, pruning, distillation, speculative decoding, etc. It compresses deep learning models for downstream deployment frameworks like TensorRT-LLM, TensorRT, vLLM, etc. to optimize inference speed.

Bilinmeyen Dil
Güncellendi 6 May 2026

evalscope

0

A streamlined and customizable framework for efficient large model (LLM, VLM, AIGC) evaluation and performance benchmarking.

Python
Güncellendi 10 Nis 2026

transformers

0

🤗 Transformers: the model-definition framework for state-of-the-art machine learning models in text, vision, audio, and multimodal models, for both inference and training.

Bilinmeyen Dil
Güncellendi 7 Nis 2026

gpustack

0

GPU cluster manager for optimized AI model deployment

Bilinmeyen Dil
Güncellendi 8 Ara 2025

sglang-npu

0

SGLang is a fast serving framework for large language models and vision language models.

Bilinmeyen Dil
Güncellendi 12 Ağu 2025

Sıkça sorulan sorular

kvcache-ai GitHub'da ne tür projeler geliştiriyor?

kvcache-ai, geniş bir yelpazede projeler geliştirmektedir. Özellikle LLM hizmetleri üzerine odaklanan ktransformers ve Mooncake gibi önemli depoları bulunmaktadır. Bu projeler, etkili LLM sunumu ve optimizasyonlarını hedeflemektedir.

kvcache-ai hangi programlama dillerini kullanıyor?

kvcache-ai, Python, Cuda, C++, Go ve JavaScript gibi birden fazla programlama dili kullanmaktadır. Bu diller, projelerinin çeşitliliğini ve işlevselliğini artırmaktadır.

kvcache-ai'nin depoları halka açık mı?

Evet, kvcache-ai'nin GitHub üzerindeki tüm depoları halka açıktır. Bu, projelerinin geniş bir kitle tarafından erişilebilir olmasını ve topluluk katkılarına açık olmasını sağlamaktadır.

Bu ifşa amaçlı mı?

kvcache.ai ile RepoGuard'ı izleyin ve yeni bir kamu deposu belirdiğinde anında uyarı alın.

Bu hesabı izleyin