KVCache.AI is a joint research project between MADSys and top industry collaborators, focusing on efficient LLM serving.
15
Kamu depoları
22.973
Toplam yıldız
1.146
Takipçiler
kvcache-ai, MADSys ve sektördeki önde gelen iş ortakları arasında yürütülen bir araştırma projesidir. GitHub üzerindeki varlığı, Python, Cuda, C++, Go ve JavaScript gibi dilleri kullanarak geniş bir yelpazede projeler geliştirdiğini göstermektedir. Öne çıkan projeleri arasında ktransformers ve Mooncake gibi önemli depolar bulunmaktadır.
A Flexible Framework for Experiencing Heterogeneous LLM Inference/Fine-tune Optimizations
Mooncake is the serving platform for Kimi, a leading LLM service provided by Moonshot AI.
Bu depo için açıklama sağlanmadı.
A high-throughput and memory-efficient inference and serving engine for LLMs
Bu depo için açıklama sağlanmadı.
SGLang is a fast serving framework for large language models and vision language models.
FlashInfer: Kernel Library for LLM Serving
DeepEP: an efficient expert-parallel communication library that supports fault tolerance
SGLang is a fast serving framework for large language models and vision language models.
🚀 A simple way to launch, train, and use PyTorch models on almost any device and distributed configuration, automatic mixed precision (including fp8), and easy-to-configure FSDP and DeepSpeed support
A unified library of SOTA model optimization techniques like quantization, pruning, distillation, speculative decoding, etc. It compresses deep learning models for downstream deployment frameworks like TensorRT-LLM, TensorRT, vLLM, etc. to optimize inference speed.
A streamlined and customizable framework for efficient large model (LLM, VLM, AIGC) evaluation and performance benchmarking.
🤗 Transformers: the model-definition framework for state-of-the-art machine learning models in text, vision, audio, and multimodal models, for both inference and training.
GPU cluster manager for optimized AI model deployment
SGLang is a fast serving framework for large language models and vision language models.
kvcache-ai, geniş bir yelpazede projeler geliştirmektedir. Özellikle LLM hizmetleri üzerine odaklanan ktransformers ve Mooncake gibi önemli depoları bulunmaktadır. Bu projeler, etkili LLM sunumu ve optimizasyonlarını hedeflemektedir.
kvcache-ai, Python, Cuda, C++, Go ve JavaScript gibi birden fazla programlama dili kullanmaktadır. Bu diller, projelerinin çeşitliliğini ve işlevselliğini artırmaktadır.
Evet, kvcache-ai'nin GitHub üzerindeki tüm depoları halka açıktır. Bu, projelerinin geniş bir kitle tarafından erişilebilir olmasını ve topluluk katkılarına açık olmasını sağlamaktadır.
kvcache.ai ile RepoGuard'ı izleyin ve yeni bir kamu deposu belirdiğinde anında uyarı alın.
Bu hesabı izleyin