Model-as-a-Service in the making: bring accessible AI to all.
50
सार्वजनिक रिपोजिटरी
94,085
कुल सितारे
6,110
अनुयायी
ModelScope का सार्वजनिक GitHub उपस्थिति विविधता से भरी हुई है, जिसमें कई महत्वपूर्ण प्रोजेक्ट शामिल हैं, जैसे FunASR और ms-swift। ये प्रोजेक्ट मुख्य रूप से Python, Jupyter Notebook, HTML, C, JavaScript, और CSS में विकसित किए गए हैं। ModelScope का लक्ष्य AI को सभी के लिए सुलभ बनाना है।
Industrial-grade speech recognition toolkit: 170x realtime, 50+ languages, speaker diarization, emotion detection, streaming, and OpenAI-compatible API.
Use PEFT or Full-parameter to CPT/SFT/DPO/GRPO 600+ LLMs (Qwen3.6, DeepSeek-V4, GLM-5.1, InternLM3, Llama4, ...) and 300+ MLLMs (Qwen3-VL, Qwen3-Omni, InternVL3.5, Ovis2.5, GLM4.5v, Gemma4, Llava, Phi4, ...) (AAAI 2025).
Enjoy the magic of Diffusion models!
FaceChain is a deep-learning toolchain for generating your Digital-Twin.
ModelScope: bring the notion of Model-as-a-Service to life.
Open-source, accurate and easy-to-use video speech recognition & clipping tool. LLM-based AI clipping integrated.
MS-Agent: a lightweight framework to empower agentic execution of complex tasks
An AI-Powered Speech Processing Toolkit and Open Source SOTA Pretrained Models, Supporting Speech Enhancement, Separation, and Target Speaker Extraction, etc.
A Repository for Single- and Multi-modal Speaker Verification, Speaker Recognition and Speaker Diarization
A streamlined and customizable framework for efficient large model (LLM, VLM, AIGC) evaluation and performance benchmarking.
AgentEvolver: Towards Efficient Self-Evolving Agent System
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
🐿️ Sirchmunk: Raw data to self-evolving intelligence, real-time.
SCEPTER is an open-source framework used for training, fine-tuning, and inference with generative models.
KAN-TTS is a speech-synthesis training framework, please try the demos we have posted at https://modelscope.cn/models?page=1&tasks=text-to-speech
[CVPR2024 (Highlight)] RichDreamer: A Generalizable Normal-Depth Diffusion Model for Detail Richness in Text-to-3D. Live Demo:https://modelscope.cn/studios/Damo_XR_Lab/3D_AIGC
AdaSeq: An All-in-One Library for Developing State-of-the-Art Sequence Understanding Models
FunCodec is a research-oriented toolkit for audio quantization and downstream applications, such as text-to-speech synthesis, music generation et.al.
Collect every awesome work about r1!
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
a toolkit on knowledge distillation for large language models
MotionAgent is your AI assistent to convert ideas into motion pictures.
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
DashInfer is a native LLM inference engine aiming to deliver industry-leading performance atop various hardware architectures, including CUDA, x86 and ARMv9.
The evaluation benchmark on MCP servers
Twinkle✨: Training workbench to make your model glow.
Cutting-edge platform for LLM agent tuning. Deliver RL tuning with flexibility, reliability, speed, multi-agent optimization and realtime community benchmarking.
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
Ultron: Collective Intelligence System — Shared Memories, Skills, and Harnesses Across Every Agent
A third-party component library based on Gradio. Integrates Ant Design, Ant Design X, Monaco Editor and more advanced components to help you build applications efficiently.
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
An initiative to replicate Sora
MCore-Bridge: Providing Megatron-Core model definitions for state-of-the-art large models and making Megatron training as simple as Transformers — with support for 300+ large language models (Qwen3-Next, GLM-5.1, Deepseek-V4, MiniMax-2.7, ...) and 200+ multimodal large models (Qwen3.5, Qwen3-Omni, Gemma4, ...).
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
A modular and stable agent sandbox runtime environment.
Open Image Curation Tools
Enjoy easier conversations with LLM
Collection of model-centric MCP servers
[ATC'25] Katz is a high-performance serving system designed specifically for diffusion model workflows with multiple adapters.
ModelScope's official MCP Server (in active development).
The source code for: https://modelscope.github.io/sirchmunk-web/
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
Langchain integration for ModelScope
面向 AI 辅助科研的开放共建仓库 收集和沉淀科研全流程中的 agents、skills、workflows、tools 与最佳实践
The official Python client to connect with ModelScope Hub.
Collection of various Comfy components.
The github website for twinkle-kit
Equip your agents with skills to interact with ModelScope
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
ModelScope GitHub पर विभिन्न AI टूल्स और मॉडल विकसित करता है, जिसमें आवाज पहचान, वीडियो क्लिपिंग, और डीप-लर्निंग टूलचेन शामिल हैं। इसके प्रमुख प्रोजेक्ट्स में FunASR और DiffSynth-Studio शामिल हैं।
ModelScope मुख्य रूप से Python, Jupyter Notebook, HTML, C, JavaScript, और CSS जैसी प्रोग्रामिंग भाषाओं का उपयोग करता है। ये भाषाएँ उनके प्रोजेक्ट्स की तकनीकी आधारशिला हैं।
हाँ, modelscope के सभी रिपोजिटरी सार्वजनिक हैं। यह उनके GitHub पृष्ठ पर उपलब्ध हैं, जिससे उपयोगकर्ता इनका उपयोग और योगदान कर सकते हैं।
RepoGuard के साथ ModelScope की निगरानी करें और जैसे ही एक नया सार्वजनिक रिपोजिटरी बनता है, सूचित हों।
इस खाते की निगरानी करें