RepoGuard
Обновлено 4 min ago
kvcache.ai

Organization

Публичный след на GitHub kvcache.ai

@kvcache-ai
Просмотреть профиль на GitHub

KVCache.AI is a joint research project between MADSys and top industry collaborators, focusing on efficient LLM serving.

15

Публичные репозитории

22 973

Всего звезд

1 146

Подписчики

Организация kvcache-ai активно ведет свою деятельность на GitHub, создавая разнообразные репозитории, в том числе такие проекты, как ktransformers и Mooncake. Основные языки программирования, используемые в их репозиториях, включают Python, Cuda, C++, Go и JavaScript, что подчеркивает их фокус на эффективном обслуживании LLM.

Основные языки

Python 5Cuda 2C++ 1Go 1JavaScript 1

Публичные репозитории

ktransformers

17 272

A Flexible Framework for Experiencing Heterogeneous LLM Inference/Fine-tune Optimizations

Python
Обновлено 13 июн. 2026 г.

Mooncake

5 567

Mooncake is the serving platform for Kimi, a leading LLM service provided by Moonshot AI.

C++
Обновлено 13 июн. 2026 г.

TrEnv-X

84

Описание для этого репозитория не предоставлено.

Go
Обновлено 1 июн. 2026 г.

vllm

15

A high-throughput and memory-efficient inference and serving engine for LLMs

Python
Обновлено 26 мая 2026 г.

kvcache-blog

11

Описание для этого репозитория не предоставлено.

JavaScript
Обновлено 12 июн. 2026 г.

sglang

11

SGLang is a fast serving framework for large language models and vision language models.

Python
Обновлено 5 июн. 2026 г.

custom_flashinfer

7

FlashInfer: Kernel Library for LLM Serving

Cuda
Обновлено 1 мар. 2026 г.

DeepEP_fault_tolerance

3

DeepEP: an efficient expert-parallel communication library that supports fault tolerance

Cuda
Обновлено 10 мар. 2026 г.

sglang_awq

2

SGLang is a fast serving framework for large language models and vision language models.

Python
Обновлено 2 мар. 2026 г.

accelerate

1

🚀 A simple way to launch, train, and use PyTorch models on almost any device and distributed configuration, automatic mixed precision (including fp8), and easy-to-configure FSDP and DeepSpeed support

Неизвестный язык
Обновлено 13 апр. 2026 г.

Model-Optimizer

0

A unified library of SOTA model optimization techniques like quantization, pruning, distillation, speculative decoding, etc. It compresses deep learning models for downstream deployment frameworks like TensorRT-LLM, TensorRT, vLLM, etc. to optimize inference speed.

Неизвестный язык
Обновлено 6 мая 2026 г.

evalscope

0

A streamlined and customizable framework for efficient large model (LLM, VLM, AIGC) evaluation and performance benchmarking.

Python
Обновлено 10 апр. 2026 г.

transformers

0

🤗 Transformers: the model-definition framework for state-of-the-art machine learning models in text, vision, audio, and multimodal models, for both inference and training.

Неизвестный язык
Обновлено 7 апр. 2026 г.

gpustack

0

GPU cluster manager for optimized AI model deployment

Неизвестный язык
Обновлено 8 дек. 2025 г.

sglang-npu

0

SGLang is a fast serving framework for large language models and vision language models.

Неизвестный язык
Обновлено 12 авг. 2025 г.

Часто задаваемые вопросы

Что разрабатывает kvcache-ai на GitHub?

kvcache-ai разрабатывает ряд проектов, включая ktransformers и Mooncake, которые сосредоточены на оптимизации и обслуживании языковых моделей. Эти работы способствуют развитию технологий LLM и их практическому применению.

Какие языки программирования использует kvcache-ai?

kvcache-ai использует несколько языков программирования, включая Python, Cuda, C++, Go и JavaScript. Это разнообразие позволяет им разрабатывать высокоэффективные решения для обслуживания языковых моделей.

Являются ли репозитории kvcache-ai публичными?

Да, репозитории kvcache-ai являются публичными. Это позволяет другим разработчикам и исследователям изучать их код и вносить вклад в проекты, связанные с обслуживанием и оптимизацией языковых моделей.

Это раскрытие намеренно?

Следите за kvcache.ai с помощью RepoGuard и получайте уведомления в момент появления нового публичного репозитория.

Следить за этим аккаунтом