KVCache.AI is a joint research project between MADSys and top industry collaborators, focusing on efficient LLM serving.
15
Kho lưu trữ công khai
22.973
Tổng số sao
1.146
Người theo dõi
kvcache-ai là một tổ chức nghiên cứu hợp tác giữa MADSys và các đối tác công nghiệp hàng đầu, tập trung vào việc phục vụ hiệu quả cho các mô hình ngôn ngữ lớn (LLM). Tổ chức này có nhiều kho mã nguồn công khai, bao gồm các dự án nổi bật như ktransformers, Mooncake và vllm, sử dụng các ngôn ngữ lập trình như Python, Cuda, và C++.
A Flexible Framework for Experiencing Heterogeneous LLM Inference/Fine-tune Optimizations
Mooncake is the serving platform for Kimi, a leading LLM service provided by Moonshot AI.
Không có mô tả nào được cung cấp cho kho lưu trữ này.
A high-throughput and memory-efficient inference and serving engine for LLMs
Không có mô tả nào được cung cấp cho kho lưu trữ này.
SGLang is a fast serving framework for large language models and vision language models.
FlashInfer: Kernel Library for LLM Serving
DeepEP: an efficient expert-parallel communication library that supports fault tolerance
SGLang is a fast serving framework for large language models and vision language models.
🚀 A simple way to launch, train, and use PyTorch models on almost any device and distributed configuration, automatic mixed precision (including fp8), and easy-to-configure FSDP and DeepSpeed support
A unified library of SOTA model optimization techniques like quantization, pruning, distillation, speculative decoding, etc. It compresses deep learning models for downstream deployment frameworks like TensorRT-LLM, TensorRT, vLLM, etc. to optimize inference speed.
A streamlined and customizable framework for efficient large model (LLM, VLM, AIGC) evaluation and performance benchmarking.
🤗 Transformers: the model-definition framework for state-of-the-art machine learning models in text, vision, audio, and multimodal models, for both inference and training.
GPU cluster manager for optimized AI model deployment
SGLang is a fast serving framework for large language models and vision language models.
kvcache-ai phát triển một loạt các dự án mã nguồn mở liên quan đến việc phục vụ và tối ưu hóa mô hình ngôn ngữ lớn, bao gồm các dự án nổi bật như ktransformers và Mooncake.
kvcache-ai sử dụng nhiều ngôn ngữ lập trình như Python, Cuda, C++, Go và JavaScript để phát triển các dự án và công cụ phục vụ cho các mô hình ngôn ngữ lớn.
Có, tất cả các kho mã nguồn của kvcache-ai đều công khai trên GitHub, cho phép cộng đồng truy cập và đóng góp cho các dự án liên quan đến mô hình ngôn ngữ lớn.
Theo dõi kvcache.ai với RepoGuard và nhận cảnh báo ngay khi có kho lưu trữ công khai mới xuất hiện.
Theo dõi tài khoản này