RepoGuard
2 min agoに更新されました
kvcache.ai

Organization

kvcache.aiの公開GitHubフットプリント

@kvcache-ai
GitHubでプロフィールを見る

KVCache.AI is a joint research project between MADSys and top industry collaborators, focusing on efficient LLM serving.

15

公開リポジトリ

22,973

合計スター

1,146

フォロワー

kvcache-aiは、MADSysと業界の主要なコラボレーターによる共同研究プロジェクトで、効率的なLLMサービングに焦点を当てています。GitHub上では、Python、Cuda、C++、Go、JavaScriptを使用した多様なリポジトリを公開しており、特にktransformersやMooncakeなどの注目プロジェクトがあります。

主要な言語

Python 5Cuda 2C++ 1Go 1JavaScript 1

公開リポジトリ

ktransformers

17,272

A Flexible Framework for Experiencing Heterogeneous LLM Inference/Fine-tune Optimizations

Python
更新済み 2026年6月13日

Mooncake

5,567

Mooncake is the serving platform for Kimi, a leading LLM service provided by Moonshot AI.

C++
更新済み 2026年6月13日

TrEnv-X

84

このリポジトリに関する説明は提供されていません。

Go
更新済み 2026年6月1日

vllm

15

A high-throughput and memory-efficient inference and serving engine for LLMs

Python
更新済み 2026年5月26日

kvcache-blog

11

このリポジトリに関する説明は提供されていません。

JavaScript
更新済み 2026年6月12日

sglang

11

SGLang is a fast serving framework for large language models and vision language models.

Python
更新済み 2026年6月5日

custom_flashinfer

7

FlashInfer: Kernel Library for LLM Serving

Cuda
更新済み 2026年3月1日

DeepEP_fault_tolerance

3

DeepEP: an efficient expert-parallel communication library that supports fault tolerance

Cuda
更新済み 2026年3月10日

sglang_awq

2

SGLang is a fast serving framework for large language models and vision language models.

Python
更新済み 2026年3月2日

accelerate

1

🚀 A simple way to launch, train, and use PyTorch models on almost any device and distributed configuration, automatic mixed precision (including fp8), and easy-to-configure FSDP and DeepSpeed support

不明な言語
更新済み 2026年4月13日

Model-Optimizer

0

A unified library of SOTA model optimization techniques like quantization, pruning, distillation, speculative decoding, etc. It compresses deep learning models for downstream deployment frameworks like TensorRT-LLM, TensorRT, vLLM, etc. to optimize inference speed.

不明な言語
更新済み 2026年5月6日

evalscope

0

A streamlined and customizable framework for efficient large model (LLM, VLM, AIGC) evaluation and performance benchmarking.

Python
更新済み 2026年4月10日

transformers

0

🤗 Transformers: the model-definition framework for state-of-the-art machine learning models in text, vision, audio, and multimodal models, for both inference and training.

不明な言語
更新済み 2026年4月7日

gpustack

0

GPU cluster manager for optimized AI model deployment

不明な言語
更新済み 2025年12月8日

sglang-npu

0

SGLang is a fast serving framework for large language models and vision language models.

不明な言語
更新済み 2025年8月12日

よくある質問

kvcache-aiはGitHubで何を構築していますか?

kvcache-aiは、LLMの効率的なサービングを目的としたさまざまなツールとフレームワークを開発しています。特にktransformersやMooncakeなどのリポジトリが注目されています。

kvcache-aiはどのプログラミング言語を使用していますか?

kvcache-aiは、主にPython、Cuda、C++、Go、JavaScriptを使用しています。これらの言語は、彼らのプロジェクトにおける効率的なLLMサービングに重要な役割を果たしています。

kvcache-aiのリポジトリは公開されていますか?

はい、kvcache-aiのリポジトリはすべて公開されています。これにより、他の開発者や研究者が彼らのプロジェクトにアクセスし、貢献することが可能です。

この露出は意図的ですか?

RepoGuardでkvcache.aiを監視し、新しい公開リポジトリが現れた瞬間に警告を受け取ります。

このアカウントを監視する