KVCache.AI is a joint research project between MADSys and top industry collaborators, focusing on efficient LLM serving.
15
Repositórios públicos
22.973
Total de estrelas
1.146
Seguidores
A presença pública do kvcache-ai no GitHub inclui uma variedade de repositórios focados em serviços eficientes de modelos de linguagem. Os principais idiomas de programação utilizados são Python, Cuda, C++, Go e JavaScript, com repositórios notáveis como ktransformers e Mooncake, que são amplamente utilizados na pesquisa e implementação de otimizações para LLMs.
A Flexible Framework for Experiencing Heterogeneous LLM Inference/Fine-tune Optimizations
Mooncake is the serving platform for Kimi, a leading LLM service provided by Moonshot AI.
Nenhuma descrição fornecida para este repositório.
A high-throughput and memory-efficient inference and serving engine for LLMs
Nenhuma descrição fornecida para este repositório.
SGLang is a fast serving framework for large language models and vision language models.
FlashInfer: Kernel Library for LLM Serving
DeepEP: an efficient expert-parallel communication library that supports fault tolerance
SGLang is a fast serving framework for large language models and vision language models.
🚀 A simple way to launch, train, and use PyTorch models on almost any device and distributed configuration, automatic mixed precision (including fp8), and easy-to-configure FSDP and DeepSpeed support
A unified library of SOTA model optimization techniques like quantization, pruning, distillation, speculative decoding, etc. It compresses deep learning models for downstream deployment frameworks like TensorRT-LLM, TensorRT, vLLM, etc. to optimize inference speed.
A streamlined and customizable framework for efficient large model (LLM, VLM, AIGC) evaluation and performance benchmarking.
🤗 Transformers: the model-definition framework for state-of-the-art machine learning models in text, vision, audio, and multimodal models, for both inference and training.
GPU cluster manager for optimized AI model deployment
SGLang is a fast serving framework for large language models and vision language models.
O kvcache-ai desenvolve repositórios relacionados a otimizações e serviços de modelos de linguagem, incluindo projetos como ktransformers e Mooncake, que visam melhorar a eficiência no uso de LLMs.
O kvcache-ai utiliza uma variedade de linguagens de programação em seus repositórios, incluindo Python, Cuda, C++, Go e JavaScript, refletindo a diversidade de suas aplicações em pesquisa e desenvolvimento.
Sim, todos os repositórios do kvcache-ai são públicos no GitHub, permitindo que outros pesquisadores e desenvolvedores acessem e colaborem em projetos focados em modelos de linguagem e suas otimizações.
Monitore kvcache.ai com o RepoGuard e receba alertas no momento em que um novo repositório público aparecer.
Monitore esta conta