9 min ago को अपडेट किया गया

Organization

kvcache.ai का सार्वजनिक GitHub फुटप्रिंट

KVCache.AI is a joint research project between MADSys and top industry collaborators, focusing on efficient LLM serving.

सार्वजनिक रिपोजिटरी

22,973

कुल सितारे

1,146

अनुयायी

kvcache.ai एक संयुक्त शोध परियोजना है जो MADSys और उद्योग के शीर्ष सहयोगियों के बीच काम करती है। इस संगठन का GitHub प्रोफाइल कई सार्वजनिक रिपॉजिटरीज़ से भरा हुआ है, जिसमें Python, Cuda, C++, Go, और JavaScript जैसी भाषाएँ शामिल हैं। प्रमुख रिपॉजिटरीज़ में ktransformers और Mooncake जैसे प्रोजेक्ट शामिल हैं, जो LLM सर्विंग के लिए महत्वपूर्ण हैं।

शीर्ष भाषाएँ

Python 5Cuda 2C++ 1Go 1JavaScript 1

सार्वजनिक रिपोजिटरी

ktransformers

★17,272

A Flexible Framework for Experiencing Heterogeneous LLM Inference/Fine-tune Optimizations

Python

अपडेट किया गया 13 जून 2026

Mooncake

★5,567

Mooncake is the serving platform for Kimi, a leading LLM service provided by Moonshot AI.

C++

अपडेट किया गया 13 जून 2026

TrEnv-X

★84

इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।

अपडेट किया गया 1 जून 2026

vllm

★15

A high-throughput and memory-efficient inference and serving engine for LLMs

Python

अपडेट किया गया 26 मई 2026

kvcache-blog

★11

इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।

JavaScript

अपडेट किया गया 12 जून 2026

sglang

★11

SGLang is a fast serving framework for large language models and vision language models.

Python

अपडेट किया गया 5 जून 2026

custom_flashinfer

★7

FlashInfer: Kernel Library for LLM Serving

Cuda

अपडेट किया गया 1 मार्च 2026

DeepEP_fault_tolerance

★3

DeepEP: an efficient expert-parallel communication library that supports fault tolerance

Cuda

अपडेट किया गया 10 मार्च 2026

sglang_awq

★2

SGLang is a fast serving framework for large language models and vision language models.

Python

अपडेट किया गया 2 मार्च 2026

accelerate

★1

🚀 A simple way to launch, train, and use PyTorch models on almost any device and distributed configuration, automatic mixed precision (including fp8), and easy-to-configure FSDP and DeepSpeed support

अज्ञात भाषा

अपडेट किया गया 13 अप्रैल 2026

Model-Optimizer

★0

A unified library of SOTA model optimization techniques like quantization, pruning, distillation, speculative decoding, etc. It compresses deep learning models for downstream deployment frameworks like TensorRT-LLM, TensorRT, vLLM, etc. to optimize inference speed.

अज्ञात भाषा

अपडेट किया गया 6 मई 2026

evalscope

★0

A streamlined and customizable framework for efficient large model (LLM, VLM, AIGC) evaluation and performance benchmarking.

Python

अपडेट किया गया 10 अप्रैल 2026

transformers

★0

🤗 Transformers: the model-definition framework for state-of-the-art machine learning models in text, vision, audio, and multimodal models, for both inference and training.

अज्ञात भाषा

अपडेट किया गया 7 अप्रैल 2026

gpustack

★0

GPU cluster manager for optimized AI model deployment

अज्ञात भाषा

अपडेट किया गया 8 दिस॰ 2025

sglang-npu

★0

SGLang is a fast serving framework for large language models and vision language models.

अज्ञात भाषा

अपडेट किया गया 12 अग॰ 2025

अक्सर पूछे जाने वाले प्रश्न

kvcache-ai GitHub पर क्या बनाता है?

kvcache-ai GitHub पर LLM सर्विंग से संबंधित कई रिपॉजिटरीज़ बनाता है। इनमें ktransformers और Mooncake जैसे प्रमुख प्रोजेक्ट शामिल हैं, जो विभिन्न LLM इन्फ़ेरेंस और ऑप्टिमाइज़ेशन पर केंद्रित हैं।

kvcache-ai कौन सी प्रोग्रामिंग भाषाएँ उपयोग करता है?

kvcache-ai मुख्य रूप से Python, Cuda, C++, Go, और JavaScript जैसी प्रोग्रामिंग भाषाओं का उपयोग करता है। ये भाषाएँ उनके विभिन्न प्रोजेक्ट्स और रिपॉजिटरीज़ में महत्वपूर्ण भूमिका निभाती हैं।

क्या kvcache-ai के रिपॉजिटरीज़ सार्वजनिक हैं?

हाँ, kvcache-ai के सभी रिपॉजिटरीज़ सार्वजनिक हैं। यह उपयोगकर्ताओं और विकासकर्ताओं को उनके LLM सर्विंग प्रोजेक्ट्स और संबंधित कार्यों का अध्ययन करने और सहयोग करने की अनुमति देता है।

क्या यह एक्सपोजर इरादा है?

RepoGuard के साथ kvcache.ai की निगरानी करें और जैसे ही एक नया सार्वजनिक रिपोजिटरी बनता है, सूचित हों।

इस खाते की निगरानी करें