Fish Audio在GitHub上拥有丰富的公共代码库,专注于语音和文本之间的交互。其主要编程语言包括Python、TypeScript和C#,并且拥有多个广泛使用的项目,如fish-speech和Bert-VITS2。这些项目为开发者提供了强大的工具,推动语音合成和处理技术的发展。
SOTA Open Source TTS
vits2 backbone with multilingual-bert
An easy to understand TTS / SVS / SVC framework
Preprocess Audio for training
The official Python library for the Fish Audio API.
此仓库未提供描述。
RTVC: Real-Time Voice Conversion GUI
OpenUTAU renderer for diffsinger / 适用于diffsinger的OpenUTAU渲染器,使用方法:https://github.com/xunmengshe/OpenUtau/wiki/%E4%BD%BF%E7%94%A8%E6%96%B9%E6%B3%95%EF%BC%88%E4%B8%AD%E6%96%87%EF%BC%89
此仓库未提供描述。
A simple svs labeling tool
此仓库未提供描述。
此仓库未提供描述。
Dify is an open-source LLM app development platform. Dify's intuitive interface combines AI workflow, RAG pipeline, agent capabilities, model management, observability features and more, letting you quickly go from prototype to production.
Official documentation for products, services, and projects by Fish Audio
The official n8n node for the Fish Audio API.
The official Go SDK for the Fish Audio API.
此仓库未提供描述。
⚡ A Simple / Speedy / Secure Link Shortener with Analytics, 100% run on Cloudflare.
Actix Web is a powerful, pragmatic, and extremely fast web framework for Rust.
Build cross-platform Native Progressive Web Apps for iOS, Android, and the Web ⚡️
此仓库未提供描述。
An open framework and intermediary model for converters among project files of various singing voice synthesizers
Use PEFT or Full-parameter to CPT/SFT/DPO/GRPO 600+ LLMs (Qwen3.5, DeepSeek-R1, GLM-5, InternLM3, Llama4, ...) and 300+ MLLMs (Qwen3-VL, Qwen3-Omni, InternVL3.5, Ovis2.5, GLM4.5v, Llava, Phi4, ...) (AAAI 2025).
Hanabi interview demo
fishaudio在GitHub上构建了一系列与语音合成和处理相关的项目,包括fish-speech和Bert-VITS2等。这些项目为开发者提供了开源工具,促进了相关领域的研究和应用。
fishaudio的主要编程语言包括Python、TypeScript、C#和C++。这些语言使得其项目能够在多种平台上运行,并支持开发者在实际应用中的灵活使用。
是的,fishaudio的所有代码库都是公开的。开发者可以访问其GitHub页面,查看和使用其项目,如audio-preprocess和fish-audio-python,以便进行语音合成和其他相关开发。