A Spark Between Voice and Text
24
Öffentliche Repositories
41.163
Sterne gesamt
3.457
Follower
Der GitHub-Account von Fish Audio, einer Organisation, die sich auf die Schnittstelle zwischen Sprache und Text spezialisiert hat, umfasst eine Vielzahl öffentlicher Repositories. Die Hauptprogrammiersprachen sind Python, TypeScript und C#. Zu den bemerkenswerten Projekten zählen fish-speech, Bert-VITS2 und fish-diffusion, die sich mit Text-to-Speech-Technologien befassen.
SOTA Open Source TTS
vits2 backbone with multilingual-bert
An easy to understand TTS / SVS / SVC framework
Preprocess Audio for training
The official Python library for the Fish Audio API.
Keine Beschreibung für dieses Repository vorhanden.
RTVC: Real-Time Voice Conversion GUI
OpenUTAU renderer for diffsinger / 适用于diffsinger的OpenUTAU渲染器,使用方法:https://github.com/xunmengshe/OpenUtau/wiki/%E4%BD%BF%E7%94%A8%E6%96%B9%E6%B3%95%EF%BC%88%E4%B8%AD%E6%96%87%EF%BC%89
Keine Beschreibung für dieses Repository vorhanden.
A simple svs labeling tool
Keine Beschreibung für dieses Repository vorhanden.
Keine Beschreibung für dieses Repository vorhanden.
Dify is an open-source LLM app development platform. Dify's intuitive interface combines AI workflow, RAG pipeline, agent capabilities, model management, observability features and more, letting you quickly go from prototype to production.
Official documentation for products, services, and projects by Fish Audio
The official n8n node for the Fish Audio API.
The official Go SDK for the Fish Audio API.
Keine Beschreibung für dieses Repository vorhanden.
⚡ A Simple / Speedy / Secure Link Shortener with Analytics, 100% run on Cloudflare.
Actix Web is a powerful, pragmatic, and extremely fast web framework for Rust.
Build cross-platform Native Progressive Web Apps for iOS, Android, and the Web ⚡️
Keine Beschreibung für dieses Repository vorhanden.
An open framework and intermediary model for converters among project files of various singing voice synthesizers
Use PEFT or Full-parameter to CPT/SFT/DPO/GRPO 600+ LLMs (Qwen3.5, DeepSeek-R1, GLM-5, InternLM3, Llama4, ...) and 300+ MLLMs (Qwen3-VL, Qwen3-Omni, InternVL3.5, Ovis2.5, GLM4.5v, Llava, Phi4, ...) (AAAI 2025).
Hanabi interview demo
fishaudio entwickelt auf GitHub eine Reihe von Projekten, die sich hauptsächlich mit Text-to-Speech und Sprachverarbeitung beschäftigen. Zu den bekanntesten Repositories zählen fish-speech und Bert-VITS2, die innovative Ansätze in diesen Bereichen bieten.
Die Hauptprogrammiersprachen, die fishaudio nutzt, sind Python, TypeScript, C# und C++. Diese Sprachen ermöglichen die Entwicklung komplexer audiobezogener Anwendungen und Frameworks, die in der Community weit verbreitet sind.
Ja, alle Repositories von fishaudio sind öffentlich zugänglich. Dies ermöglicht es anderen Entwicklern, die Projekte zu nutzen, zu studieren und zur Weiterentwicklung beizutragen, was die Transparenz und Zusammenarbeit innerhalb der Entwicklergemeinschaft fördert.
Überwache Fish Audio mit RepoGuard und werde benachrichtigt, sobald ein neues öffentliches Repository auftaucht.
Diesen Account überwachen