wird aktualisiert…

Organization

Öffentlicher GitHub-Footprint von kvcache.ai

KVCache.AI is a joint research project between MADSys and top industry collaborators, focusing on efficient LLM serving.

Öffentliche Repositories

22.965

Sterne gesamt

1.146

Follower

Die öffentliche GitHub-Präsenz von kvcache.ai umfasst eine Vielzahl von Repositories, die sich auf effizientes LLM-Serving konzentrieren. Zu den Hauptprogrammiersprachen gehören Python, Cuda, C++, Go und JavaScript. Bedeutende Repositories wie ktransformers und Mooncake sind in der Community weit verbreitet und bieten innovative Lösungen im Bereich der Sprachmodelloptimierung.

Top-Sprachen

Python 5Cuda 2C++ 1Go 1JavaScript 1

Öffentliche Repositories

ktransformers

★17.268

A Flexible Framework for Experiencing Heterogeneous LLM Inference/Fine-tune Optimizations

Python

Aktualisiert 12. Juni 2026

Mooncake

★5.563

Mooncake is the serving platform for Kimi, a leading LLM service provided by Moonshot AI.

C++

Aktualisiert 12. Juni 2026

TrEnv-X

★84

Keine Beschreibung für dieses Repository vorhanden.

Aktualisiert 1. Juni 2026

vllm

★15

A high-throughput and memory-efficient inference and serving engine for LLMs

Python

Aktualisiert 26. Mai 2026

kvcache-blog

★11

Keine Beschreibung für dieses Repository vorhanden.

JavaScript

Aktualisiert 12. Juni 2026

sglang

★11

SGLang is a fast serving framework for large language models and vision language models.

Python

Aktualisiert 5. Juni 2026

custom_flashinfer

★7

FlashInfer: Kernel Library for LLM Serving

Cuda

Aktualisiert 1. März 2026

DeepEP_fault_tolerance

★3

DeepEP: an efficient expert-parallel communication library that supports fault tolerance

Cuda

Aktualisiert 10. März 2026

sglang_awq

★2

SGLang is a fast serving framework for large language models and vision language models.

Python

Aktualisiert 2. März 2026

accelerate

★1

🚀 A simple way to launch, train, and use PyTorch models on almost any device and distributed configuration, automatic mixed precision (including fp8), and easy-to-configure FSDP and DeepSpeed support

Unbekannte Sprache

Aktualisiert 13. Apr. 2026

Model-Optimizer

★0

A unified library of SOTA model optimization techniques like quantization, pruning, distillation, speculative decoding, etc. It compresses deep learning models for downstream deployment frameworks like TensorRT-LLM, TensorRT, vLLM, etc. to optimize inference speed.

Unbekannte Sprache

Aktualisiert 6. Mai 2026

evalscope

★0

A streamlined and customizable framework for efficient large model (LLM, VLM, AIGC) evaluation and performance benchmarking.

Python

Aktualisiert 10. Apr. 2026

transformers

★0

🤗 Transformers: the model-definition framework for state-of-the-art machine learning models in text, vision, audio, and multimodal models, for both inference and training.

Unbekannte Sprache

Aktualisiert 7. Apr. 2026

gpustack

★0

GPU cluster manager for optimized AI model deployment

Unbekannte Sprache

Aktualisiert 8. Dez. 2025

sglang-npu

★0

SGLang is a fast serving framework for large language models and vision language models.

Unbekannte Sprache

Aktualisiert 12. Aug. 2025

Häufige Fragen

Was entwickelt kvcache-ai auf GitHub?

kvcache-ai entwickelt eine Reihe von Projekten, die sich mit dem Serving und der Optimierung von großen Sprachmodellen beschäftigen. Zu den bemerkenswerten Repositories gehören ktransformers und Mooncake, die innovative Ansätze in diesem Bereich bieten.

Welche Programmiersprachen verwendet kvcache-ai?

Die Hauptprogrammiersprachen von kvcache-ai sind Python, Cuda, C++, Go und JavaScript. Diese Sprachen werden in verschiedenen Repositories eingesetzt, um effiziente Lösungen für LLM-Serving zu entwickeln.

Sind die Repositories von kvcache-ai öffentlich?

Ja, die Repositories von kvcache-ai sind öffentlich zugänglich. Dies ermöglicht es der Entwicklergemeinschaft, auf die Ressourcen zuzugreifen und zur Weiterentwicklung von Projekten wie ktransformers und Mooncake beizutragen.

Ist diese Sichtbarkeit gewollt?

Überwache kvcache.ai mit RepoGuard und werde benachrichtigt, sobald ein neues öffentliches Repository auftaucht.

Diesen Account überwachen