Đã cập nhật 4 min ago

Organization

Dấu chân GitHub công khai của kvcache.ai

KVCache.AI is a joint research project between MADSys and top industry collaborators, focusing on efficient LLM serving.

Kho lưu trữ công khai

22.973

Tổng số sao

1.146

Người theo dõi

kvcache-ai là một tổ chức nghiên cứu hợp tác giữa MADSys và các đối tác công nghiệp hàng đầu, tập trung vào việc phục vụ hiệu quả cho các mô hình ngôn ngữ lớn (LLM). Tổ chức này có nhiều kho mã nguồn công khai, bao gồm các dự án nổi bật như ktransformers, Mooncake và vllm, sử dụng các ngôn ngữ lập trình như Python, Cuda, và C++.

Ngôn ngữ hàng đầu

Python 5Cuda 2C++ 1Go 1JavaScript 1

Kho lưu trữ công khai

ktransformers

★17.272

A Flexible Framework for Experiencing Heterogeneous LLM Inference/Fine-tune Optimizations

Python

Đã cập nhật 13 thg 6, 2026

Mooncake

★5.567

Mooncake is the serving platform for Kimi, a leading LLM service provided by Moonshot AI.

C++

Đã cập nhật 13 thg 6, 2026

TrEnv-X

★84

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Đã cập nhật 1 thg 6, 2026

vllm

★15

A high-throughput and memory-efficient inference and serving engine for LLMs

Python

Đã cập nhật 26 thg 5, 2026

kvcache-blog

★11

Không có mô tả nào được cung cấp cho kho lưu trữ này.

JavaScript

Đã cập nhật 12 thg 6, 2026

sglang

★11

SGLang is a fast serving framework for large language models and vision language models.

Python

Đã cập nhật 5 thg 6, 2026

custom_flashinfer

★7

FlashInfer: Kernel Library for LLM Serving

Cuda

Đã cập nhật 1 thg 3, 2026

DeepEP_fault_tolerance

★3

DeepEP: an efficient expert-parallel communication library that supports fault tolerance

Cuda

Đã cập nhật 10 thg 3, 2026

sglang_awq

★2

SGLang is a fast serving framework for large language models and vision language models.

Python

Đã cập nhật 2 thg 3, 2026

accelerate

★1

🚀 A simple way to launch, train, and use PyTorch models on almost any device and distributed configuration, automatic mixed precision (including fp8), and easy-to-configure FSDP and DeepSpeed support

Ngôn ngữ không xác định

Đã cập nhật 13 thg 4, 2026

Model-Optimizer

★0

A unified library of SOTA model optimization techniques like quantization, pruning, distillation, speculative decoding, etc. It compresses deep learning models for downstream deployment frameworks like TensorRT-LLM, TensorRT, vLLM, etc. to optimize inference speed.

Ngôn ngữ không xác định

Đã cập nhật 6 thg 5, 2026

evalscope

★0

A streamlined and customizable framework for efficient large model (LLM, VLM, AIGC) evaluation and performance benchmarking.

Python

Đã cập nhật 10 thg 4, 2026

transformers

★0

🤗 Transformers: the model-definition framework for state-of-the-art machine learning models in text, vision, audio, and multimodal models, for both inference and training.

Ngôn ngữ không xác định

Đã cập nhật 7 thg 4, 2026

gpustack

★0

GPU cluster manager for optimized AI model deployment

Ngôn ngữ không xác định

Đã cập nhật 8 thg 12, 2025

sglang-npu

★0

SGLang is a fast serving framework for large language models and vision language models.

Ngôn ngữ không xác định

Đã cập nhật 12 thg 8, 2025

Câu hỏi thường gặp

kvcache-ai xây dựng gì trên GitHub?

kvcache-ai phát triển một loạt các dự án mã nguồn mở liên quan đến việc phục vụ và tối ưu hóa mô hình ngôn ngữ lớn, bao gồm các dự án nổi bật như ktransformers và Mooncake.

Ngôn ngữ lập trình nào được kvcache-ai sử dụng?

kvcache-ai sử dụng nhiều ngôn ngữ lập trình như Python, Cuda, C++, Go và JavaScript để phát triển các dự án và công cụ phục vụ cho các mô hình ngôn ngữ lớn.

Các kho mã nguồn của kvcache-ai có công khai không?

Có, tất cả các kho mã nguồn của kvcache-ai đều công khai trên GitHub, cho phép cộng đồng truy cập và đóng góp cho các dự án liên quan đến mô hình ngôn ngữ lớn.

Liệu việc lộ thông tin này có dự định không?

Theo dõi kvcache.ai với RepoGuard và nhận cảnh báo ngay khi có kho lưu trữ công khai mới xuất hiện.

Theo dõi tài khoản này