Обновлено 3 h ago

Organization

Публичный след на GitHub LAION AI

@LAION-AI

Просмотреть профиль на GitHub

This is the repo of LAION, a non-profit organization to liberate machine learning research, models and datasets.

Germany

126

Публичные репозитории

47 159

Всего звезд

4 257

Подписчики

Организация LAION-AI активно ведет свою деятельность на GitHub, где представлено множество репозиториев, посвященных исследованиям в области машинного обучения. Основные языки программирования, используемые в проектах, включают Python и Jupyter Notebook. Среди заметных репозиториев можно выделить Open-Assistant, CLAP и CLIP_benchmark.

Основные языки

Python 50Jupyter Notebook 12TypeScript 6HTML 4Dart 2JavaScript 1

Публичные репозитории

Open-Assistant

★37 397

OpenAssistant is a chat-based assistant that understands tasks, can interact with third-party systems, and retrieve information dynamically to do so.

Python

Обновлено 12 июн. 2026 г.

CLAP

★2 178

Contrastive Language-Audio Pretraining

Python

Обновлено 12 июн. 2026 г.

CLIP_benchmark

★812

CLIP-like model evaluation

Python

Обновлено 11 июн. 2026 г.

audio-dataset

★740

Audio Dataset for training CLAP and other models

Python

Обновлено 29 мая 2026 г.

aesthetic-predictor

★708

A linear estimator on top of clip to predict the aesthetic quality of pictures

Jupyter Notebook

Обновлено 12 июн. 2026 г.

dalle2-laion

★504

Pretrained Dalle2 from laion

Python

Обновлено 28 мая 2026 г.

natural_voice_assistant

★499

Описание для этого репозитория не предоставлено.

Python

Обновлено 10 июн. 2026 г.

CLIP-based-NSFW-Detector

★466

Описание для этого репозитория не предоставлено.

Python

Обновлено 10 июн. 2026 г.

lucidrains-projects

★357

A summary of all lucidrains repositores and links to training / research approaches by LAION or other communities.

Jupyter Notebook

Обновлено 6 июн. 2026 г.

laion-3d

★296

Collect large 3d dataset and build models

Неизвестный язык

Обновлено 12 июн. 2026 г.

laion-datasets

★255

Description and pointers of laion datasets

HTML

Обновлено 26 мар. 2026 г.

phenaki

★220

A phenaki reproduction using pytorch.

Python

Обновлено 10 мар. 2026 г.

Open-Instruction-Generalist

★210

Open Instruction Generalist is an assistant trained on massive synthetic instructions to perform many millions of tasks

Python

Обновлено 3 апр. 2026 г.

scaling-laws-openclip

★195

Reproducible scaling laws for contrastive language-image learning (https://arxiv.org/abs/2212.07143)

Jupyter Notebook

Обновлено 25 мая 2026 г.

ldm-finetune

★181

Home of `erlich` and `ongo`. Finetune latent-diffusion/glid-3-xl text2image on your own data.

Python

Обновлено 19 нояб. 2025 г.

laion-dreams

★167

Aim for the moon. If you miss, you may hit a star.

Неизвестный язык

Обновлено 29 мая 2026 г.

LAION-5B-WatermarkDetection

★132

Описание для этого репозитория не предоставлено.

Python

Обновлено 11 июн. 2026 г.

AIW

★129

Alice in Wonderland code base for experiments and raw experiments data

Python

Обновлено 12 июн. 2026 г.

laion.ai

★123

Описание для этого репозитория не предоставлено.

HTML

Обновлено 12 июн. 2026 г.

emotion-annotations

★110

Описание для этого репозитория не предоставлено.

Python

Обновлено 12 июн. 2026 г.

Discord-Scrapers

★106

Implementation of a discord channel scraper to generate datasets.

Python

Обновлено 23 мая 2026 г.

video-clip

★97

Let's make a video clip

Неизвестный язык

Обновлено 9 апр. 2026 г.

Open-GIA

★87

O-GIA is an umbrella for research, infrastructure and projects ecosystem that should provide open source, reproducible datasets, models, applications & safety tools for Open Generalist Interactive Agents (O-GIA). O-GIA systems will act in collaboration with human or autonomously, supporting various kind of validated decision making and assistance.

Неизвестный язык

Обновлено 2 дек. 2025 г.

watermark-detection

★74

A repository containing datasets and tools to train a watermark classifier.

Python

Обновлено 30 мая 2026 г.

LAION-SAFETY

★65

An open toolbox for NSFW & toxicity detection

Jupyter Notebook

Обновлено 30 мар. 2026 г.

General-GPT

★65

Описание для этого репозитория не предоставлено.

Jupyter Notebook

Обновлено 16 июл. 2025 г.

Text-to-speech

★61

Описание для этого репозитория не предоставлено.

Python

Обновлено 19 нояб. 2025 г.

Big-Interleaved-Dataset

★59

Big-Interleaved-Dataset

Python

Обновлено 3 апр. 2026 г.

interesting-text-datasets

★45

Описание для этого репозитория не предоставлено.

Неизвестный язык

Обновлено 21 мая 2026 г.

riverbed

★45

Tools for content datamining and NLP at scale

Python

Обновлено 3 апр. 2026 г.

Desktop_BUD-E

★42

BUD-E (Buddy) is an open-source voice assistant framework that facilitates seamless interaction with AI models and APIs, enabling the creation and integration of diverse skills for educational and research applications.

Python

Обновлено 16 февр. 2026 г.

OCR-ensemble

★42

Описание для этого репозитория не предоставлено.

Jupyter Notebook

Обновлено 28 дек. 2025 г.

blade2blade

★41

Adversarial Training and SFT for Bot Safety Models

Python

Обновлено 3 апр. 2026 г.

Conditional-Pretraining-of-Large-Language-Models

★37

Описание для этого репозитория не предоставлено.

Python

Обновлено 2 янв. 2025 г.

deep-image-diffusion-prior

★36

Inverts CLIP text embeds to image embeds and visualizes with deep-image-prior.

Jupyter Notebook

Обновлено 28 апр. 2026 г.

laion5B-paper

★36

Building the laion5B paper

Неизвестный язык

Обновлено 4 сент. 2025 г.

emotional-speech-annotations

★35

This repository contains prompts & best practices to annotate audio clips with a very high degree of details using Audio-Language-Models

Неизвестный язык

Обновлено 1 июл. 2025 г.

temporal-embedding-aggregation

★32

Aggregating embeddings over time

Python

Обновлено 23 июн. 2025 г.

medical

★30

This repository will be a summary and outlook on all our open, medical, AI advancements.

Jupyter Notebook

Обновлено 13 февр. 2026 г.

conditioned-prior

★29

(wip) Use LAION-AI's CLIP "conditoned prior" to generate CLIP image embeds from CLIP text embeds.

Python

Обновлено 13 окт. 2025 г.

Anh

★28

Anh - LAION's multilingual assistant datasets and models

Python

Обновлено 3 апр. 2026 г.

scaled-echo-tts

★24

Scaled diffusion transformer for text-to-speech synthesis (DiT + T5Gemma2 conditioning, TorchTitan & Megatron backends, tested up to 1024 GPUs)

Python

Обновлено 28 мая 2026 г.

Desktop-BUD-E_V1.0

★24

Python

Обновлено 7 апр. 2026 г.

laion50BU

★24

Un-*** 50 billions multimodality dataset

Неизвестный язык

Обновлено 3 апр. 2026 г.

scaling-laws-for-comparison

★22

Описание для этого репозитория не предоставлено.

Jupyter Notebook

Обновлено 13 мая 2026 г.

school-bud-e-frontend-old

★22

A frontend that is compatible to the school-bud-e-backend.

TypeScript

Обновлено 9 окт. 2025 г.

math_problems-step-by-step_solutions

★19

Here we provide and collect many functions to generate math problem and step by step solutions for LLM training

Python

Обновлено 31 мая 2026 г.

laion-dedup

★18

Описание для этого репозитория не предоставлено.

Python

Обновлено 10 июн. 2026 г.

bud-e

★18

A general human-ai interaction platform.

Dart

Обновлено 27 мая 2026 г.

univeral-audio-annotation-pipeline

★14

Описание для этого репозитория не предоставлено.

Python

Обновлено 11 июн. 2026 г.

Vocalino-V0.1-Voice-Acting-Pipeline

★14

Open-weights voice acting pipeline combining zero-shot voice cloning with natural-language direction. Provide a reference voice (or generate one) and describe how the line should be performed. Produces speech that keeps the voice identity while following emotional and stylistic prompts—no training required.

HTML

Обновлено 25 мая 2026 г.

opendream

★14

Frontend (and soon also midleware and backend) for a new, opensource image generation platform.

TypeScript

Обновлено 19 нояб. 2025 г.

LAION-PEOPLE

★14

This project provides a data set with bounding boxes, body poses, 3D face meshes & captions of people from our LAION-2.2B. Additionally it provides clusters based on the poses and face meshes and pose-related captions based on these cluster assignments.

Неизвестный язык

Обновлено 14 апр. 2025 г.

worldsim

★13

Описание для этого репозитория не предоставлено.

Неизвестный язык

Обновлено 21 дек. 2025 г.

super-resolution

★13

This is the LAION repository for creating open super-resolution models with the help of LAION-5B subsets.

Неизвестный язык

Обновлено 20 июл. 2025 г.

laionide

★12

This repository contains training code and checkpoitns for finetuning glide.

Python

Обновлено 3 апр. 2026 г.

project-menu

★12

Projects at LAION

Неизвестный язык

Обновлено 25 авг. 2025 г.

model-retrieval

★11

Easily compute model embeddings and save the embeddings.

Неизвестный язык

Обновлено 3 апр. 2026 г.

project-alexandria

★9

Official repo for Project Alexandria

Неизвестный язык

Обновлено 17 мар. 2026 г.

open-sci-ref-0.01

★8

Описание для этого репозитория не предоставлено.

Неизвестный язык

Обновлено 24 февр. 2026 г.

image-deduplication-testset

★8

Описание для этого репозитория не предоставлено.

HTML

Обновлено 4 янв. 2024 г.

KAISER

★7

Knowledge Acquisition and Interlinking via Semantic Embeddings and Reasoning

Неизвестный язык

Обновлено 3 апр. 2026 г.

Megatron-LM-Open-Sci

★7

MegaTron open-sci fork

Python

Обновлено 3 апр. 2026 г.

voice-taxonomies

★5

Collection of three complementary voice taxonomies: VoiceNet (59 speech dimensions), EmoNet (40 emotion categories), VocalBurst (82 non-speech sounds)

Неизвестный язык

Обновлено 9 июн. 2026 г.

Retrieval-Augmented-Voice-Cloning

★5

Retrieval-augmented voice cloning and emotion conditioning data generation pipeline. Combines Echo TTS, ChatterboxVC, and Empathic Insight Voice+ to generate large-scale datasets of emotionally conditioned speech with disentangled speaker identity and emotional prosody.

Python

Обновлено 9 июн. 2026 г.

open_clip_mammut

★5

OpenCLIP fork with MaMMUT support

Python

Обновлено 26 нояб. 2025 г.

safety-pipeline

★5

A collection of safety classifiers and models to process image and texts.

Python

Обновлено 14 мая 2025 г.

Dream-E

★4

Описание для этого репозитория не предоставлено.

TypeScript

Обновлено 11 июн. 2026 г.

emonet-face

★4

Official repository for the NeurIPS 2025 paper “EmoNet-Face: An Expert-Annotated Benchmark for Synthetic Emotion Recognition.” Includes a 40-category emotion taxonomy, balanced synthetic datasets, expert annotations, and baseline models for fair and reproducible evaluation.

Jupyter Notebook

Обновлено 28 мая 2026 г.

annotate-collection

★3

A repository with data for annotation.

Python

Обновлено 13 мая 2025 г.

decentralized-learning

★3

A basic setup for decentralized-learning that can be used for training future DALLE/CLIP/CLAP models.

Неизвестный язык

Обновлено 8 сент. 2024 г.

chatterbox-voice-conversion

★2

High-level Python library for zero-shot voice conversion using Resemble AI's Chatterbox S3Gen model

Python

Обновлено 9 июн. 2026 г.

BVD

★2

Описание для этого репозитория не предоставлено.

Python

Обновлено 3 июн. 2026 г.

agent-bud-e

★2

Building an agentic voice assistant for mobile & desktop devices with episodic, semantic & procedural memories

Неизвестный язык

Обновлено 16 апр. 2026 г.

llm-template

★2

A template for procedural template generation using JSON outputs form LLMs.

TypeScript

Обновлено 3 апр. 2026 г.

AIW_webpage

★2

Alice in Wonderland project and initiative webpage

Неизвестный язык

Обновлено 3 апр. 2026 г.

laion5b-subsets

★2

Creating subsets from laion5b via embeddings search

Jupyter Notebook

Обновлено 2 дек. 2025 г.

Open-Sci-hf

★2

Описание для этого репозитория не предоставлено.

Python

Обновлено 18 авг. 2025 г.

curiosit-e

★2

File server for curiosit-e content.

TypeScript

Обновлено 17 апр. 2025 г.

images-for-slideshows

★2

Описание для этого репозитория не предоставлено.

Неизвестный язык

Обновлено 4 апр. 2025 г.

django-htmx-llm-streaming

★2

A prototype showing how to stream using Django x htmx.

JavaScript

Обновлено 4 апр. 2025 г.

crawlingathome

★2

A client library for Crawling@Home's effort to filter CommonCrawl with CLIP, building a large scale image-text dataset.

Python

Обновлено 19 июн. 2024 г.

school-bud-e-frontend

★1

School Bud-E is an intelligent and empathetic learning assistant designed to revolutionize the educational experience.

Dart

Обновлено 27 мая 2026 г.

Admin_Bud-E

★1

Admin Bud-E is a lightweight, privacy-first control center for AI chat, speech-to-text, and text-to-speech. Manage providers, routing, and costs with a simple Admin Console. Give users per-period credits, prices per model, and a shared Common Pool. EU-friendly via OpenAI-Format endpoints or our optional Google Cloud Vertex proxy.

Python

Обновлено 18 мая 2026 г.

transformers

★1

🤗 Transformers: the model-definition framework for state-of-the-art machine learning models in text, vision, audio, and multimodal models, for both inference and training.

Python

Обновлено 3 апр. 2026 г.

snac-to-llama3

★1

Описание для этого репозитория не предоставлено.

Jupyter Notebook

Обновлено 4 апр. 2025 г.

bud-e-mobile

★1

Mobile app development of all bud-e derivatives.

Неизвестный язык

Обновлено 4 апр. 2025 г.

laionbox

★0

LaionBox: Fine-tuned DramaBox TTS with Multi-Auxiliary Differentiable Losses

Python

Обновлено 13 июн. 2026 г.

open-sci-ref

★0

Описание для этого репозитория не предоставлено.

Python

Обновлено 12 июн. 2026 г.

Voice-Acting-Pipeline

★0

Self-contained DramaBox voice acting pipeline: VoiceNet taxonomy, multi-GPU prompt generation, TTS synthesis, and audio refinement

Python

Обновлено 5 июн. 2026 г.

emolia-bench

★0

Benchmark analysis

Python

Обновлено 13 мая 2026 г.

jax-dacvae-echotts

★0

JAX/TPU training code for EchoTTS with DACVAE latent codec

Python

Обновлено 8 мая 2026 г.

tunes

★0

Описание для этого репозитория не предоставлено.

Python

Обновлено 7 мая 2026 г.

scientific-summaries

★0

Описание для этого репозитория не предоставлено.

Python

Обновлено 7 мая 2026 г.

open-clap-scaling

★0

Multi-node scaling benchmarks for CLAP contrastive audio-language models on HPC clusters

Python

Обновлено 29 мар. 2026 г.

vocolino

★0

Описание для этого репозитория не предоставлено.

Неизвестный язык

Обновлено 27 мар. 2026 г.

helden-bud-e-frontend

★0

Описание для этого репозитория не предоставлено.

TypeScript

Обновлено 6 сент. 2025 г.

DSA-Wissen-BM25-Server

★0

Описание для этого репозитория не предоставлено.

Python

Обновлено 6 сент. 2025 г.

StoryBuddy-frontend

★0

Описание для этого репозитория не предоставлено.

Неизвестный язык

Обновлено 31 авг. 2025 г.

Open-Sci-moe-hf

★0

Описание для этого репозитория не предоставлено.

Неизвестный язык

Обновлено 11 июн. 2025 г.

Часто задаваемые вопросы

Что разрабатывает LAION-AI на GitHub?

LAION-AI разрабатывает инструменты и модели для исследований в области машинного обучения. Среди их проектов можно найти Open-Assistant, CLAP и другие, которые помогают в обработке аудио и визуальных данных.

Какие языки программирования использует LAION-AI?

LAION-AI использует несколько языков программирования, включая Python, Jupyter Notebook и TypeScript. Эти языки позволяют создавать разнообразные проекты и проводить исследования в области ИИ.

Являются ли репозитории LAION-AI публичными?

Да, все репозитории LAION-AI являются публичными. Это обеспечивает доступ к их коду и моделям для исследователей и разработчиков, желающих использовать или улучшать их разработки.

Это раскрытие намеренно?

Следите за LAION AI с помощью RepoGuard и получайте уведомления в момент появления нового публичного репозитория.

Следить за этим аккаунтом