Atualizado 2 min ago

Organization

Pegada pública no GitHub de kvcache.ai

KVCache.AI is a joint research project between MADSys and top industry collaborators, focusing on efficient LLM serving.

Repositórios públicos

22.973

Total de estrelas

1.146

Seguidores

A presença pública do kvcache-ai no GitHub inclui uma variedade de repositórios focados em serviços eficientes de modelos de linguagem. Os principais idiomas de programação utilizados são Python, Cuda, C++, Go e JavaScript, com repositórios notáveis como ktransformers e Mooncake, que são amplamente utilizados na pesquisa e implementação de otimizações para LLMs.

Principais linguagens

Python 5Cuda 2C++ 1Go 1JavaScript 1

Repositórios públicos

ktransformers

★17.272

A Flexible Framework for Experiencing Heterogeneous LLM Inference/Fine-tune Optimizations

Python

Atualizado 13 de jun. de 2026

Mooncake

★5.567

Mooncake is the serving platform for Kimi, a leading LLM service provided by Moonshot AI.

C++

Atualizado 13 de jun. de 2026

TrEnv-X

★84

Nenhuma descrição fornecida para este repositório.

Atualizado 1 de jun. de 2026

vllm

★15

A high-throughput and memory-efficient inference and serving engine for LLMs

Python

Atualizado 26 de mai. de 2026

kvcache-blog

★11

Nenhuma descrição fornecida para este repositório.

JavaScript

Atualizado 12 de jun. de 2026

sglang

★11

SGLang is a fast serving framework for large language models and vision language models.

Python

Atualizado 5 de jun. de 2026

custom_flashinfer

★7

FlashInfer: Kernel Library for LLM Serving

Cuda

Atualizado 1 de mar. de 2026

DeepEP_fault_tolerance

★3

DeepEP: an efficient expert-parallel communication library that supports fault tolerance

Cuda

Atualizado 10 de mar. de 2026

sglang_awq

★2

SGLang is a fast serving framework for large language models and vision language models.

Python

Atualizado 2 de mar. de 2026

accelerate

★1

🚀 A simple way to launch, train, and use PyTorch models on almost any device and distributed configuration, automatic mixed precision (including fp8), and easy-to-configure FSDP and DeepSpeed support

Linguagem Desconhecida

Atualizado 13 de abr. de 2026

Model-Optimizer

★0

A unified library of SOTA model optimization techniques like quantization, pruning, distillation, speculative decoding, etc. It compresses deep learning models for downstream deployment frameworks like TensorRT-LLM, TensorRT, vLLM, etc. to optimize inference speed.

Linguagem Desconhecida

Atualizado 6 de mai. de 2026

evalscope

★0

A streamlined and customizable framework for efficient large model (LLM, VLM, AIGC) evaluation and performance benchmarking.

Python

Atualizado 10 de abr. de 2026

transformers

★0

🤗 Transformers: the model-definition framework for state-of-the-art machine learning models in text, vision, audio, and multimodal models, for both inference and training.

Linguagem Desconhecida

Atualizado 7 de abr. de 2026

gpustack

★0

GPU cluster manager for optimized AI model deployment

Linguagem Desconhecida

Atualizado 8 de dez. de 2025

sglang-npu

★0

SGLang is a fast serving framework for large language models and vision language models.

Linguagem Desconhecida

Atualizado 12 de ago. de 2025

Perguntas frequentes

O que o kvcache-ai constrói no GitHub?

O kvcache-ai desenvolve repositórios relacionados a otimizações e serviços de modelos de linguagem, incluindo projetos como ktransformers e Mooncake, que visam melhorar a eficiência no uso de LLMs.

Quais linguagens de programação o kvcache-ai utiliza?

O kvcache-ai utiliza uma variedade de linguagens de programação em seus repositórios, incluindo Python, Cuda, C++, Go e JavaScript, refletindo a diversidade de suas aplicações em pesquisa e desenvolvimento.

Os repositórios do kvcache-ai são públicos?

Sim, todos os repositórios do kvcache-ai são públicos no GitHub, permitindo que outros pesquisadores e desenvolvedores acessem e colaborem em projetos focados em modelos de linguagem e suas otimizações.

Essa exposição é intencional?

Monitore kvcache.ai com o RepoGuard e receba alertas no momento em que um novo repositório público aparecer.

Monitore esta conta