A Spark Between Voice and Text
24
Publiczne repozytoria
41 163
Łączna liczba gwiazdek
3457
Obserwujący
Fish Audio to organizacja na GitHubie, która koncentruje się na tworzeniu projektów związanych z syntezą mowy i przetwarzaniem dźwięku. Główne języki programowania to Python, TypeScript oraz C#. Wśród ich repozytoriów znajdują się takie projekty jak fish-speech, Bert-VITS2 i fish-diffusion, które są szeroko używane w społeczności deweloperów.
SOTA Open Source TTS
vits2 backbone with multilingual-bert
An easy to understand TTS / SVS / SVC framework
Preprocess Audio for training
The official Python library for the Fish Audio API.
Brak opisu dla tego repozytorium.
RTVC: Real-Time Voice Conversion GUI
OpenUTAU renderer for diffsinger / 适用于diffsinger的OpenUTAU渲染器,使用方法:https://github.com/xunmengshe/OpenUtau/wiki/%E4%BD%BF%E7%94%A8%E6%96%B9%E6%B3%95%EF%BC%88%E4%B8%AD%E6%96%87%EF%BC%89
Brak opisu dla tego repozytorium.
A simple svs labeling tool
Brak opisu dla tego repozytorium.
Brak opisu dla tego repozytorium.
Dify is an open-source LLM app development platform. Dify's intuitive interface combines AI workflow, RAG pipeline, agent capabilities, model management, observability features and more, letting you quickly go from prototype to production.
Official documentation for products, services, and projects by Fish Audio
The official n8n node for the Fish Audio API.
The official Go SDK for the Fish Audio API.
Brak opisu dla tego repozytorium.
⚡ A Simple / Speedy / Secure Link Shortener with Analytics, 100% run on Cloudflare.
Actix Web is a powerful, pragmatic, and extremely fast web framework for Rust.
Build cross-platform Native Progressive Web Apps for iOS, Android, and the Web ⚡️
Brak opisu dla tego repozytorium.
An open framework and intermediary model for converters among project files of various singing voice synthesizers
Use PEFT or Full-parameter to CPT/SFT/DPO/GRPO 600+ LLMs (Qwen3.5, DeepSeek-R1, GLM-5, InternLM3, Llama4, ...) and 300+ MLLMs (Qwen3-VL, Qwen3-Omni, InternVL3.5, Ovis2.5, GLM4.5v, Llava, Phi4, ...) (AAAI 2025).
Hanabi interview demo
Fish Audio tworzy projekty związane z syntezą mowy, przetwarzaniem dźwięku oraz interfejsami API. Ich popularne repozytoria obejmują fish-speech i Bert-VITS2, które są używane do zaawansowanej syntezy mowy.
Fish Audio korzysta głównie z języków Python, TypeScript i C#. Te języki są wykorzystywane w ich różnych projektach, co umożliwia elastyczne podejście do rozwoju oprogramowania.
Tak, wszystkie repozytoria Fish Audio są publiczne. Dzięki temu społeczność może przeglądać, korzystać i przyczyniać się do ich projektów, co sprzyja współpracy i innowacji w dziedzinie syntez mowy.
Monitoruj Fish Audio z RepoGuard i otrzymuj powiadomienia w momencie, gdy pojawi się nowe publiczne repozytorium.
Monitoruj to konto