just now에 업데이트됨

Organization

kvcache.ai의 공개 GitHub 발자국

KVCache.AI is a joint research project between MADSys and top industry collaborators, focusing on efficient LLM serving.

공개 저장소

22,973

총 별점

1,146

팔로워

kvcache-ai는 MADSys와 선도적인 산업 협력자들 간의 공동 연구 프로젝트로, GitHub에서 다양한 공개 저장소를 운영하고 있습니다. 이들은 Python, Cuda, C++, Go, JavaScript와 같은 주요 프로그래밍 언어를 사용하여 LLM 서빙을 효율적으로 수행하는 여러 프로젝트를 포함하고 있습니다. 특히, ktransformers와 Mooncake와 같은 주목할 만한 저장소가 있습니다.

주요 언어

Python 5Cuda 2C++ 1Go 1JavaScript 1

공개 저장소

ktransformers

★17,272

A Flexible Framework for Experiencing Heterogeneous LLM Inference/Fine-tune Optimizations

Python

업데이트됨 2026년 6월 13일

Mooncake

★5,567

Mooncake is the serving platform for Kimi, a leading LLM service provided by Moonshot AI.

C++

업데이트됨 2026년 6월 13일

TrEnv-X

★84

이 저장소에 대한 설명이 제공되지 않았습니다.

업데이트됨 2026년 6월 1일

vllm

★15

A high-throughput and memory-efficient inference and serving engine for LLMs

Python

업데이트됨 2026년 5월 26일

kvcache-blog

★11

이 저장소에 대한 설명이 제공되지 않았습니다.

JavaScript

업데이트됨 2026년 6월 12일

sglang

★11

SGLang is a fast serving framework for large language models and vision language models.

Python

업데이트됨 2026년 6월 5일

custom_flashinfer

★7

FlashInfer: Kernel Library for LLM Serving

Cuda

업데이트됨 2026년 3월 1일

DeepEP_fault_tolerance

★3

DeepEP: an efficient expert-parallel communication library that supports fault tolerance

Cuda

업데이트됨 2026년 3월 10일

sglang_awq

★2

SGLang is a fast serving framework for large language models and vision language models.

Python

업데이트됨 2026년 3월 2일

accelerate

★1

🚀 A simple way to launch, train, and use PyTorch models on almost any device and distributed configuration, automatic mixed precision (including fp8), and easy-to-configure FSDP and DeepSpeed support

알 수 없는 언어

업데이트됨 2026년 4월 13일

Model-Optimizer

★0

A unified library of SOTA model optimization techniques like quantization, pruning, distillation, speculative decoding, etc. It compresses deep learning models for downstream deployment frameworks like TensorRT-LLM, TensorRT, vLLM, etc. to optimize inference speed.

알 수 없는 언어

업데이트됨 2026년 5월 6일

evalscope

★0

A streamlined and customizable framework for efficient large model (LLM, VLM, AIGC) evaluation and performance benchmarking.

Python

업데이트됨 2026년 4월 10일

transformers

★0

🤗 Transformers: the model-definition framework for state-of-the-art machine learning models in text, vision, audio, and multimodal models, for both inference and training.

알 수 없는 언어

업데이트됨 2026년 4월 7일

gpustack

★0

GPU cluster manager for optimized AI model deployment

알 수 없는 언어

업데이트됨 2025년 12월 8일

sglang-npu

★0

SGLang is a fast serving framework for large language models and vision language models.

알 수 없는 언어

업데이트됨 2025년 8월 12일

자주 묻는 질문

kvcache-ai는 GitHub에서 무엇을 개발하나요?

kvcache-ai는 LLM 서빙과 관련된 다양한 프로젝트를 개발합니다. 주요 저장소로는 ktransformers와 Mooncake가 있으며, 이들은 효율적인 LLM 추론 및 최적화를 위한 프레임워크를 제공합니다.

kvcache-ai는 어떤 프로그래밍 언어를 사용하나요?

kvcache-ai는 Python, Cuda, C++, Go, JavaScript 등 다양한 프로그래밍 언어를 사용하여 프로젝트를 진행합니다. 이러한 언어들은 LLM 서빙과 관련된 효율적인 솔루션을 구현하는 데 중점을 두고 있습니다.

kvcache-ai의 저장소는 공개인가요?

네, kvcache-ai의 모든 저장소는 공개적으로 운영됩니다. 이를 통해 연구자들과 개발자들이 LLM 서빙 관련 기술을 공유하고 협업할 수 있는 기회를 제공합니다.

이 노출이 의도된 것인가요?

kvcache.ai을 RepoGuard로 모니터링하고 새로운 공개 저장소가 나타나는 순간 알림을 받으세요.

이 계정 모니터링하기