Generative Speech Synthesis with AI Voices
55
공개 저장소
32,445
총 별점
892
팔로워
Resemble AI는 GitHub에서 다양한 공개 리포지토리를 운영하고 있으며, 주로 Python과 TypeScript를 사용하여 생성 음성 합성 기술을 개발하고 있습니다. 주요 프로젝트에는 SoTA 오픈 소스 TTS인 chatterbox와 음성 분석을 위한 Resemblyzer가 포함되어 있습니다. 이들은 AI 음성의 품질 향상과 비교를 위한 도구를 제공합니다.
SoTA open-source TTS
A python package to analyze and compare voices with deep learning
AI powered speech denoising and enhancement
Open Audio Watermarking Tool
super expressive prompting model based on ltx2.3
WIP: Open Source Implementation of "MelNet: A Generative Model for Audio in the Frequency Domain"
Resemble's voice cloning engine within Unity
Monotonic Alignment Search
This is sample code for an Alexa skill that uses realistic voice cloning powered by Resemble AI's text-to-speech API, and Open AI’s GPT-3 AI engine.
[ICASSP 2025] "FLowHigh: Towards efficient and high-quality audio super-resolution with single-step flow matching"
Simple text to phonemes converter for multiple languages
이 저장소에 대한 설명이 제공되지 않았습니다.
이 저장소에 대한 설명이 제공되지 않았습니다.
이 저장소에 대한 설명이 제공되지 않았습니다.
resemble.ai API SDK
Build real-time multimodal AI applications 🤖🎙️📹
NeMo: a toolkit for conversational AI
A module for normalising text.
이 저장소에 대한 설명이 제공되지 않았습니다.
An open-source Python library for audio time-scale modification.
Agent skill for deepfake detection & media safety — detect AI-generated audio, images, and video with Resemble AI
Unsupervised Language Modeling at scale for robust sentiment classification
This utility allows one to cut multiple clips from a single or multiple audio files.
이 저장소에 대한 설명이 제공되지 않았습니다.
이 저장소에 대한 설명이 제공되지 않았습니다.
Benchmark Arabic text diacritization dataset
eSpeak NG is an open source speech synthesizer that supports more than hundred languages and accents.
Deep Learning Examples
Build realtime multimodal AI agents with Node.js
🤗 Transformers: the model-definition framework for state-of-the-art machine learning models in text, vision, audio, and multimodal models, for both inference and training.
Run OpenAI Whisper as a Cog model
GitHub Action to run kubectl
이 저장소에 대한 설명이 제공되지 않았습니다.
Official MCP server for Resemble AI — vibe code with instant API docs in your coding assistant (Cursor, Claude Code, etc.)
State-of-the-art Machine Learning for the web. Run 🤗 Transformers directly in your browser, with no need for a server!
🤗 PEFT: State-of-the-art Parameter-Efficient Fine-Tuning.
Supplementary materials of Synthesizing Personalized Non-speech Vocalization from Discrete Speech Representations
Robust Speech Recognition via Large-Scale Weak Supervision
Github Action for executing Helm commands on EKS (using aws-iam-authenticator)
n8n community node for Resemble AI: deepfake detection, media intelligence, and invisible watermarking
Rivet plugin for Resemble AI deepfake detection, intelligence, and watermarking
Documentation for Resemble AI's Live VC websocket server
Resemble Examples — Quick start examples for the Resemble AI API in Python and JavaScript, with and without SDKs.
maximal update parametrization (µP)
Hackable and optimized Transformers building blocks, supporting a composable construction.
Facebook AI Research Sequence-to-Sequence Toolkit written in Python.
A python package for calculating the PESQ.
Efficient, scalable and enterprise-grade CPU/GPU inference server for 🤗 Hugging Face transformer models 🚀
WebRTC and ORTC implementation for Python using asyncio
asyncio-based Interactive Connectivity Establishment (RFC 5245)
A Heroku buildpack for ffmpeg that always downloads the latest static build
Chinese Mandarin Grapheme-to-Phoneme Converter. 中文轉注音或拼音 (INTERSPEECH 2022)
Unofficial PyTorch Implementation of UnivNet Vocoder (https://arxiv.org/abs/2106.07889)
Automatically deploy your project to GitHub Pages using GitHub Actions. This action can be configured to push your production-ready code into any branch you'd like.
이 저장소에 대한 설명이 제공되지 않았습니다.
Resemble AI는 GitHub에서 음성 합성과 관련된 여러 프로젝트를 개발하고 있습니다. 주요 리포지토리로는 chatterbox, Resemblyzer, resemble-enhance 등이 있으며, 이는 AI 음성 생성 및 분석에 중점을 두고 있습니다.
Resemble AI는 주로 Python과 TypeScript를 사용하여 리포지토리를 개발합니다. 또한, C#, Cython 및 Dockerfile과 같은 다양한 언어도 사용하여 프로젝트를 확장하고 있습니다.
예, Resemble AI의 모든 리포지토리는 공개적으로 접근 가능합니다. 이는 사용자가 AI 음성 합성과 관련된 도구를 자유롭게 이용하고 기여할 수 있도록 합니다.