A Spark Between Voice and Text
24
Публичные репозитории
41 163
Всего звезд
3 457
Подписчики
Организация Fish Audio активно ведет свою деятельность на GitHub, имея широкий спектр публичных репозиториев. В их числе находятся проекты на Python, такие как fish-speech и Bert-VITS2, а также репозитории на других языках, включая C# и TypeScript. Эти проекты фокусируются на преобразовании речи и обработке аудио, отражая область их экспертизы.
SOTA Open Source TTS
vits2 backbone with multilingual-bert
An easy to understand TTS / SVS / SVC framework
Preprocess Audio for training
The official Python library for the Fish Audio API.
Описание для этого репозитория не предоставлено.
RTVC: Real-Time Voice Conversion GUI
OpenUTAU renderer for diffsinger / 适用于diffsinger的OpenUTAU渲染器,使用方法:https://github.com/xunmengshe/OpenUtau/wiki/%E4%BD%BF%E7%94%A8%E6%96%B9%E6%B3%95%EF%BC%88%E4%B8%AD%E6%96%87%EF%BC%89
Описание для этого репозитория не предоставлено.
A simple svs labeling tool
Описание для этого репозитория не предоставлено.
Описание для этого репозитория не предоставлено.
Dify is an open-source LLM app development platform. Dify's intuitive interface combines AI workflow, RAG pipeline, agent capabilities, model management, observability features and more, letting you quickly go from prototype to production.
Official documentation for products, services, and projects by Fish Audio
The official n8n node for the Fish Audio API.
The official Go SDK for the Fish Audio API.
Описание для этого репозитория не предоставлено.
⚡ A Simple / Speedy / Secure Link Shortener with Analytics, 100% run on Cloudflare.
Actix Web is a powerful, pragmatic, and extremely fast web framework for Rust.
Build cross-platform Native Progressive Web Apps for iOS, Android, and the Web ⚡️
Описание для этого репозитория не предоставлено.
An open framework and intermediary model for converters among project files of various singing voice synthesizers
Use PEFT or Full-parameter to CPT/SFT/DPO/GRPO 600+ LLMs (Qwen3.5, DeepSeek-R1, GLM-5, InternLM3, Llama4, ...) and 300+ MLLMs (Qwen3-VL, Qwen3-Omni, InternVL3.5, Ovis2.5, GLM4.5v, Llava, Phi4, ...) (AAAI 2025).
Hanabi interview demo
Fish Audio разрабатывает различные проекты, связанные с обработкой речи и аудио. К их основным репозиториям относятся такие, как fish-speech и fish-diffusion, которые предлагают решения для TTS и SVS.
Основными языками программирования, используемыми организацией Fish Audio, являются Python, TypeScript, C# и C++. Это позволяет им создавать разнообразные инструменты и библиотеки для работы с аудио.
Да, все репозитории Fish Audio являются публичными. Это значит, что любой желающий может получить к ним доступ и использовать их для своих нужд, что способствует открытому обмену знаниями в сообществе разработчиков.
Следите за Fish Audio с помощью RepoGuard и получайте уведомления в момент появления нового публичного репозитория.
Следить за этим аккаунтом