Model-as-a-Service in the making: bring accessible AI to all.
50
Kho lưu trữ công khai
94.085
Tổng số sao
6.110
Người theo dõi
ModelScope là một tổ chức trên GitHub với nhiều kho mã nguồn công khai, tập trung vào việc phát triển các công cụ AI thân thiện với người dùng. Với các ngôn ngữ chính như Python, Jupyter Notebook và HTML, ModelScope có nhiều dự án nổi bật như FunASR và ms-swift, phục vụ cho các ứng dụng nhận diện giọng nói và mô hình học máy.
Industrial-grade speech recognition toolkit: 170x realtime, 50+ languages, speaker diarization, emotion detection, streaming, and OpenAI-compatible API.
Use PEFT or Full-parameter to CPT/SFT/DPO/GRPO 600+ LLMs (Qwen3.6, DeepSeek-V4, GLM-5.1, InternLM3, Llama4, ...) and 300+ MLLMs (Qwen3-VL, Qwen3-Omni, InternVL3.5, Ovis2.5, GLM4.5v, Gemma4, Llava, Phi4, ...) (AAAI 2025).
Enjoy the magic of Diffusion models!
FaceChain is a deep-learning toolchain for generating your Digital-Twin.
ModelScope: bring the notion of Model-as-a-Service to life.
Open-source, accurate and easy-to-use video speech recognition & clipping tool. LLM-based AI clipping integrated.
MS-Agent: a lightweight framework to empower agentic execution of complex tasks
An AI-Powered Speech Processing Toolkit and Open Source SOTA Pretrained Models, Supporting Speech Enhancement, Separation, and Target Speaker Extraction, etc.
A Repository for Single- and Multi-modal Speaker Verification, Speaker Recognition and Speaker Diarization
A streamlined and customizable framework for efficient large model (LLM, VLM, AIGC) evaluation and performance benchmarking.
AgentEvolver: Towards Efficient Self-Evolving Agent System
Không có mô tả nào được cung cấp cho kho lưu trữ này.
🐿️ Sirchmunk: Raw data to self-evolving intelligence, real-time.
SCEPTER is an open-source framework used for training, fine-tuning, and inference with generative models.
KAN-TTS is a speech-synthesis training framework, please try the demos we have posted at https://modelscope.cn/models?page=1&tasks=text-to-speech
[CVPR2024 (Highlight)] RichDreamer: A Generalizable Normal-Depth Diffusion Model for Detail Richness in Text-to-3D. Live Demo:https://modelscope.cn/studios/Damo_XR_Lab/3D_AIGC
AdaSeq: An All-in-One Library for Developing State-of-the-Art Sequence Understanding Models
FunCodec is a research-oriented toolkit for audio quantization and downstream applications, such as text-to-speech synthesis, music generation et.al.
Collect every awesome work about r1!
Không có mô tả nào được cung cấp cho kho lưu trữ này.
a toolkit on knowledge distillation for large language models
MotionAgent is your AI assistent to convert ideas into motion pictures.
Không có mô tả nào được cung cấp cho kho lưu trữ này.
DashInfer is a native LLM inference engine aiming to deliver industry-leading performance atop various hardware architectures, including CUDA, x86 and ARMv9.
The evaluation benchmark on MCP servers
Twinkle✨: Training workbench to make your model glow.
Cutting-edge platform for LLM agent tuning. Deliver RL tuning with flexibility, reliability, speed, multi-agent optimization and realtime community benchmarking.
Không có mô tả nào được cung cấp cho kho lưu trữ này.
Ultron: Collective Intelligence System — Shared Memories, Skills, and Harnesses Across Every Agent
A third-party component library based on Gradio. Integrates Ant Design, Ant Design X, Monaco Editor and more advanced components to help you build applications efficiently.
Không có mô tả nào được cung cấp cho kho lưu trữ này.
An initiative to replicate Sora
MCore-Bridge: Providing Megatron-Core model definitions for state-of-the-art large models and making Megatron training as simple as Transformers — with support for 300+ large language models (Qwen3-Next, GLM-5.1, Deepseek-V4, MiniMax-2.7, ...) and 200+ multimodal large models (Qwen3.5, Qwen3-Omni, Gemma4, ...).
Không có mô tả nào được cung cấp cho kho lưu trữ này.
A modular and stable agent sandbox runtime environment.
Open Image Curation Tools
Enjoy easier conversations with LLM
Collection of model-centric MCP servers
[ATC'25] Katz is a high-performance serving system designed specifically for diffusion model workflows with multiple adapters.
ModelScope's official MCP Server (in active development).
The source code for: https://modelscope.github.io/sirchmunk-web/
Không có mô tả nào được cung cấp cho kho lưu trữ này.
Không có mô tả nào được cung cấp cho kho lưu trữ này.
Langchain integration for ModelScope
面向 AI 辅助科研的开放共建仓库 收集和沉淀科研全流程中的 agents、skills、workflows、tools 与最佳实践
The official Python client to connect with ModelScope Hub.
Collection of various Comfy components.
The github website for twinkle-kit
Equip your agents with skills to interact with ModelScope
Không có mô tả nào được cung cấp cho kho lưu trữ này.
ModelScope phát triển một loạt các công cụ và thư viện AI, bao gồm nhận diện giọng nói và các mô hình học máy. Một số kho mã nổi bật như FunASR và ms-swift tập trung vào ứng dụng thực tiễn của AI trong các lĩnh vực khác nhau.
ModelScope chủ yếu sử dụng các ngôn ngữ lập trình như Python, Jupyter Notebook, HTML, C, JavaScript và CSS. Điều này cho phép tổ chức phát triển các ứng dụng đa dạng và mạnh mẽ cho cộng đồng lập trình viên.
Có, tất cả các kho mã của ModelScope đều được công khai trên GitHub. Điều này cho phép người dùng và nhà phát triển tiếp cận và sử dụng các công cụ mà tổ chức phát triển, đồng thời khuyến khích sự hợp tác trong cộng đồng.
Theo dõi ModelScope với RepoGuard và nhận cảnh báo ngay khi có kho lưu trữ công khai mới xuất hiện.
Theo dõi tài khoản này