Fish Audioは、音声とテキストの間の架け橋を提供するオープンソースプロジェクトを多数展開しています。主にPythonやTypeScriptを使用しており、fish-speechやBert-VITS2などの著名なリポジトリがあります。これらのプロジェクトは、音声合成やデータ処理に関連する幅広い機能を提供しています。
SOTA Open Source TTS
vits2 backbone with multilingual-bert
An easy to understand TTS / SVS / SVC framework
Preprocess Audio for training
The official Python library for the Fish Audio API.
このリポジトリに関する説明は提供されていません。
RTVC: Real-Time Voice Conversion GUI
OpenUTAU renderer for diffsinger / 适用于diffsinger的OpenUTAU渲染器,使用方法:https://github.com/xunmengshe/OpenUtau/wiki/%E4%BD%BF%E7%94%A8%E6%96%B9%E6%B3%95%EF%BC%88%E4%B8%AD%E6%96%87%EF%BC%89
このリポジトリに関する説明は提供されていません。
A simple svs labeling tool
このリポジトリに関する説明は提供されていません。
このリポジトリに関する説明は提供されていません。
Dify is an open-source LLM app development platform. Dify's intuitive interface combines AI workflow, RAG pipeline, agent capabilities, model management, observability features and more, letting you quickly go from prototype to production.
Official documentation for products, services, and projects by Fish Audio
The official n8n node for the Fish Audio API.
The official Go SDK for the Fish Audio API.
このリポジトリに関する説明は提供されていません。
⚡ A Simple / Speedy / Secure Link Shortener with Analytics, 100% run on Cloudflare.
Actix Web is a powerful, pragmatic, and extremely fast web framework for Rust.
Build cross-platform Native Progressive Web Apps for iOS, Android, and the Web ⚡️
このリポジトリに関する説明は提供されていません。
An open framework and intermediary model for converters among project files of various singing voice synthesizers
Use PEFT or Full-parameter to CPT/SFT/DPO/GRPO 600+ LLMs (Qwen3.5, DeepSeek-R1, GLM-5, InternLM3, Llama4, ...) and 300+ MLLMs (Qwen3-VL, Qwen3-Omni, InternVL3.5, Ovis2.5, GLM4.5v, Llava, Phi4, ...) (AAAI 2025).
Hanabi interview demo
Fish Audioは、音声合成や音声処理に関するさまざまなオープンソースプロジェクトを構築しています。主なリポジトリには、fish-speechやBert-VITS2などがあります。
Fish Audioは主にPython、TypeScript、C#、C++、MDX、Goを使用しています。これにより、音声処理や関連のフレームワークを効率的に開発しています。
はい、Fish Audioのリポジトリはすべて公開されています。ユーザーは、GitHub上でこれらのプロジェクトにアクセスし、ソースコードを確認したり、貢献したりすることができます。