RepoGuard
Zaktualizowane just now
kvcache.ai

Organization

Publiczne ślady GitHub kvcache.ai

@kvcache-ai
Zobacz profil na GitHubie

KVCache.AI is a joint research project between MADSys and top industry collaborators, focusing on efficient LLM serving.

15

Publiczne repozytoria

22 973

Łączna liczba gwiazdek

1146

Obserwujący

Organizacja kvcache-ai na GitHubie posiada różnorodne repozytoria, w tym takie projekty jak ktransformers, Mooncake oraz vllm. Główne języki programowania używane w tych repozytoriach to Python, Cuda, C++ oraz Go. Ich prace koncentrują się na efektywnym serwowaniu modeli językowych.

Najpopularniejsze języki

Python 5Cuda 2C++ 1Go 1JavaScript 1

Publiczne repozytoria

ktransformers

17 272

A Flexible Framework for Experiencing Heterogeneous LLM Inference/Fine-tune Optimizations

Python
Zaktualizowane 13 cze 2026

Mooncake

5567

Mooncake is the serving platform for Kimi, a leading LLM service provided by Moonshot AI.

C++
Zaktualizowane 13 cze 2026

TrEnv-X

84

Brak opisu dla tego repozytorium.

Go
Zaktualizowane 1 cze 2026

vllm

15

A high-throughput and memory-efficient inference and serving engine for LLMs

Python
Zaktualizowane 26 maj 2026

kvcache-blog

11

Brak opisu dla tego repozytorium.

JavaScript
Zaktualizowane 12 cze 2026

sglang

11

SGLang is a fast serving framework for large language models and vision language models.

Python
Zaktualizowane 5 cze 2026

custom_flashinfer

7

FlashInfer: Kernel Library for LLM Serving

Cuda
Zaktualizowane 1 mar 2026

DeepEP_fault_tolerance

3

DeepEP: an efficient expert-parallel communication library that supports fault tolerance

Cuda
Zaktualizowane 10 mar 2026

sglang_awq

2

SGLang is a fast serving framework for large language models and vision language models.

Python
Zaktualizowane 2 mar 2026

accelerate

1

🚀 A simple way to launch, train, and use PyTorch models on almost any device and distributed configuration, automatic mixed precision (including fp8), and easy-to-configure FSDP and DeepSpeed support

Nieznany język
Zaktualizowane 13 kwi 2026

Model-Optimizer

0

A unified library of SOTA model optimization techniques like quantization, pruning, distillation, speculative decoding, etc. It compresses deep learning models for downstream deployment frameworks like TensorRT-LLM, TensorRT, vLLM, etc. to optimize inference speed.

Nieznany język
Zaktualizowane 6 maj 2026

evalscope

0

A streamlined and customizable framework for efficient large model (LLM, VLM, AIGC) evaluation and performance benchmarking.

Python
Zaktualizowane 10 kwi 2026

transformers

0

🤗 Transformers: the model-definition framework for state-of-the-art machine learning models in text, vision, audio, and multimodal models, for both inference and training.

Nieznany język
Zaktualizowane 7 kwi 2026

gpustack

0

GPU cluster manager for optimized AI model deployment

Nieznany język
Zaktualizowane 8 gru 2025

sglang-npu

0

SGLang is a fast serving framework for large language models and vision language models.

Nieznany język
Zaktualizowane 12 sie 2025

Najczęściej zadawane pytania

Co buduje kvcache-ai na GitHubie?

Kvcache-ai rozwija różne projekty związane z serwowaniem modeli językowych, w tym ktransformers i Mooncake. Repozytoria te koncentrują się na optymalizacji i implementacji zaawansowanych algorytmów dla LLM.

Jakie języki programowania używa kvcache-ai?

Kvcache-ai wykorzystuje kilka języków programowania, w tym Python, Cuda, C++, Go oraz JavaScript. Te języki są stosowane do tworzenia narzędzi i frameworków związanych z sztuczną inteligencją.

Czy repozytoria kvcache-ai są publiczne?

Tak, wszystkie repozytoria kvcache-ai są publiczne na GitHubie. Dzięki temu społeczność może przeglądać, korzystać i przyczyniać się do rozwoju tych projektów.

Czy to ujawnienie jest zamierzone?

Monitoruj kvcache.ai z RepoGuard i otrzymuj powiadomienia w momencie, gdy pojawi się nowe publiczne repozytorium.

Monitoruj to konto