RepoGuard
Обновлено 3 h ago
LAION AI

Organization

Публичный след на GitHub LAION AI

@LAION-AI
Просмотреть профиль на GitHub

This is the repo of LAION, a non-profit organization to liberate machine learning research, models and datasets.

Germany

126

Публичные репозитории

47 159

Всего звезд

4 257

Подписчики

Организация LAION-AI активно ведет свою деятельность на GitHub, где представлено множество репозиториев, посвященных исследованиям в области машинного обучения. Основные языки программирования, используемые в проектах, включают Python и Jupyter Notebook. Среди заметных репозиториев можно выделить Open-Assistant, CLAP и CLIP_benchmark.

Основные языки

Python 50Jupyter Notebook 12TypeScript 6HTML 4Dart 2JavaScript 1

Публичные репозитории

Open-Assistant

37 397

OpenAssistant is a chat-based assistant that understands tasks, can interact with third-party systems, and retrieve information dynamically to do so.

Python
Обновлено 12 июн. 2026 г.

CLAP

2 178

Contrastive Language-Audio Pretraining

Python
Обновлено 12 июн. 2026 г.

CLIP_benchmark

812

CLIP-like model evaluation

Python
Обновлено 11 июн. 2026 г.

audio-dataset

740

Audio Dataset for training CLAP and other models

Python
Обновлено 29 мая 2026 г.

aesthetic-predictor

708

A linear estimator on top of clip to predict the aesthetic quality of pictures

Jupyter Notebook
Обновлено 12 июн. 2026 г.

dalle2-laion

504

Pretrained Dalle2 from laion

Python
Обновлено 28 мая 2026 г.

natural_voice_assistant

499

Описание для этого репозитория не предоставлено.

Python
Обновлено 10 июн. 2026 г.

CLIP-based-NSFW-Detector

466

Описание для этого репозитория не предоставлено.

Python
Обновлено 10 июн. 2026 г.

lucidrains-projects

357

A summary of all lucidrains repositores and links to training / research approaches by LAION or other communities.

Jupyter Notebook
Обновлено 6 июн. 2026 г.

laion-3d

296

Collect large 3d dataset and build models

Неизвестный язык
Обновлено 12 июн. 2026 г.

laion-datasets

255

Description and pointers of laion datasets

HTML
Обновлено 26 мар. 2026 г.

phenaki

220

A phenaki reproduction using pytorch.

Python
Обновлено 10 мар. 2026 г.

Open-Instruction-Generalist

210

Open Instruction Generalist is an assistant trained on massive synthetic instructions to perform many millions of tasks

Python
Обновлено 3 апр. 2026 г.

scaling-laws-openclip

195

Reproducible scaling laws for contrastive language-image learning (https://arxiv.org/abs/2212.07143)

Jupyter Notebook
Обновлено 25 мая 2026 г.

ldm-finetune

181

Home of `erlich` and `ongo`. Finetune latent-diffusion/glid-3-xl text2image on your own data.

Python
Обновлено 19 нояб. 2025 г.

laion-dreams

167

Aim for the moon. If you miss, you may hit a star.

Неизвестный язык
Обновлено 29 мая 2026 г.

LAION-5B-WatermarkDetection

132

Описание для этого репозитория не предоставлено.

Python
Обновлено 11 июн. 2026 г.

AIW

129

Alice in Wonderland code base for experiments and raw experiments data

Python
Обновлено 12 июн. 2026 г.

laion.ai

123

Описание для этого репозитория не предоставлено.

HTML
Обновлено 12 июн. 2026 г.

emotion-annotations

110

Описание для этого репозитория не предоставлено.

Python
Обновлено 12 июн. 2026 г.

Discord-Scrapers

106

Implementation of a discord channel scraper to generate datasets.

Python
Обновлено 23 мая 2026 г.

video-clip

97

Let's make a video clip

Неизвестный язык
Обновлено 9 апр. 2026 г.

Open-GIA

87

O-GIA is an umbrella for research, infrastructure and projects ecosystem that should provide open source, reproducible datasets, models, applications & safety tools for Open Generalist Interactive Agents (O-GIA). O-GIA systems will act in collaboration with human or autonomously, supporting various kind of validated decision making and assistance.

Неизвестный язык
Обновлено 2 дек. 2025 г.

watermark-detection

74

A repository containing datasets and tools to train a watermark classifier.

Python
Обновлено 30 мая 2026 г.

LAION-SAFETY

65

An open toolbox for NSFW & toxicity detection

Jupyter Notebook
Обновлено 30 мар. 2026 г.

General-GPT

65

Описание для этого репозитория не предоставлено.

Jupyter Notebook
Обновлено 16 июл. 2025 г.

Text-to-speech

61

Описание для этого репозитория не предоставлено.

Python
Обновлено 19 нояб. 2025 г.

Big-Interleaved-Dataset

59

Big-Interleaved-Dataset

Python
Обновлено 3 апр. 2026 г.

interesting-text-datasets

45

Описание для этого репозитория не предоставлено.

Неизвестный язык
Обновлено 21 мая 2026 г.

riverbed

45

Tools for content datamining and NLP at scale

Python
Обновлено 3 апр. 2026 г.

Desktop_BUD-E

42

BUD-E (Buddy) is an open-source voice assistant framework that facilitates seamless interaction with AI models and APIs, enabling the creation and integration of diverse skills for educational and research applications.

Python
Обновлено 16 февр. 2026 г.

OCR-ensemble

42

Описание для этого репозитория не предоставлено.

Jupyter Notebook
Обновлено 28 дек. 2025 г.

blade2blade

41

Adversarial Training and SFT for Bot Safety Models

Python
Обновлено 3 апр. 2026 г.

Conditional-Pretraining-of-Large-Language-Models

37

Описание для этого репозитория не предоставлено.

Python
Обновлено 2 янв. 2025 г.

deep-image-diffusion-prior

36

Inverts CLIP text embeds to image embeds and visualizes with deep-image-prior.

Jupyter Notebook
Обновлено 28 апр. 2026 г.

laion5B-paper

36

Building the laion5B paper

Неизвестный язык
Обновлено 4 сент. 2025 г.

emotional-speech-annotations

35

This repository contains prompts & best practices to annotate audio clips with a very high degree of details using Audio-Language-Models

Неизвестный язык
Обновлено 1 июл. 2025 г.

temporal-embedding-aggregation

32

Aggregating embeddings over time

Python
Обновлено 23 июн. 2025 г.

medical

30

This repository will be a summary and outlook on all our open, medical, AI advancements.

Jupyter Notebook
Обновлено 13 февр. 2026 г.

conditioned-prior

29

(wip) Use LAION-AI's CLIP "conditoned prior" to generate CLIP image embeds from CLIP text embeds.

Python
Обновлено 13 окт. 2025 г.

Anh

28

Anh - LAION's multilingual assistant datasets and models

Python
Обновлено 3 апр. 2026 г.

scaled-echo-tts

24

Scaled diffusion transformer for text-to-speech synthesis (DiT + T5Gemma2 conditioning, TorchTitan & Megatron backends, tested up to 1024 GPUs)

Python
Обновлено 28 мая 2026 г.

Desktop-BUD-E_V1.0

24

BUD-E (Buddy) is an open-source voice assistant framework that facilitates seamless interaction with AI models and APIs, enabling the creation and integration of diverse skills for educational and research applications.

Python
Обновлено 7 апр. 2026 г.

laion50BU

24

Un-*** 50 billions multimodality dataset

Неизвестный язык
Обновлено 3 апр. 2026 г.

scaling-laws-for-comparison

22

Описание для этого репозитория не предоставлено.

Jupyter Notebook
Обновлено 13 мая 2026 г.

school-bud-e-frontend-old

22

A frontend that is compatible to the school-bud-e-backend.

TypeScript
Обновлено 9 окт. 2025 г.

math_problems-step-by-step_solutions

19

Here we provide and collect many functions to generate math problem and step by step solutions for LLM training

Python
Обновлено 31 мая 2026 г.

laion-dedup

18

Описание для этого репозитория не предоставлено.

Python
Обновлено 10 июн. 2026 г.

bud-e

18

A general human-ai interaction platform.

Dart
Обновлено 27 мая 2026 г.

univeral-audio-annotation-pipeline

14

Описание для этого репозитория не предоставлено.

Python
Обновлено 11 июн. 2026 г.

Vocalino-V0.1-Voice-Acting-Pipeline

14

Open-weights voice acting pipeline combining zero-shot voice cloning with natural-language direction. Provide a reference voice (or generate one) and describe how the line should be performed. Produces speech that keeps the voice identity while following emotional and stylistic prompts—no training required.

HTML
Обновлено 25 мая 2026 г.

opendream

14

Frontend (and soon also midleware and backend) for a new, opensource image generation platform.

TypeScript
Обновлено 19 нояб. 2025 г.

LAION-PEOPLE

14

This project provides a data set with bounding boxes, body poses, 3D face meshes & captions of people from our LAION-2.2B. Additionally it provides clusters based on the poses and face meshes and pose-related captions based on these cluster assignments.

Неизвестный язык
Обновлено 14 апр. 2025 г.

worldsim

13

Описание для этого репозитория не предоставлено.

Неизвестный язык
Обновлено 21 дек. 2025 г.

super-resolution

13

This is the LAION repository for creating open super-resolution models with the help of LAION-5B subsets.

Неизвестный язык
Обновлено 20 июл. 2025 г.

laionide

12

This repository contains training code and checkpoitns for finetuning glide.

Python
Обновлено 3 апр. 2026 г.

project-menu

12

Projects at LAION

Неизвестный язык
Обновлено 25 авг. 2025 г.

model-retrieval

11

Easily compute model embeddings and save the embeddings.

Неизвестный язык
Обновлено 3 апр. 2026 г.

project-alexandria

9

Official repo for Project Alexandria

Неизвестный язык
Обновлено 17 мар. 2026 г.

open-sci-ref-0.01

8

Описание для этого репозитория не предоставлено.

Неизвестный язык
Обновлено 24 февр. 2026 г.

image-deduplication-testset

8

Описание для этого репозитория не предоставлено.

HTML
Обновлено 4 янв. 2024 г.

KAISER

7

Knowledge Acquisition and Interlinking via Semantic Embeddings and Reasoning

Неизвестный язык
Обновлено 3 апр. 2026 г.

Megatron-LM-Open-Sci

7

MegaTron open-sci fork

Python
Обновлено 3 апр. 2026 г.

voice-taxonomies

5

Collection of three complementary voice taxonomies: VoiceNet (59 speech dimensions), EmoNet (40 emotion categories), VocalBurst (82 non-speech sounds)

Неизвестный язык
Обновлено 9 июн. 2026 г.

Retrieval-Augmented-Voice-Cloning

5

Retrieval-augmented voice cloning and emotion conditioning data generation pipeline. Combines Echo TTS, ChatterboxVC, and Empathic Insight Voice+ to generate large-scale datasets of emotionally conditioned speech with disentangled speaker identity and emotional prosody.

Python
Обновлено 9 июн. 2026 г.

open_clip_mammut

5

OpenCLIP fork with MaMMUT support

Python
Обновлено 26 нояб. 2025 г.

safety-pipeline

5

A collection of safety classifiers and models to process image and texts.

Python
Обновлено 14 мая 2025 г.

Dream-E

4

Описание для этого репозитория не предоставлено.

TypeScript
Обновлено 11 июн. 2026 г.

emonet-face

4

Official repository for the NeurIPS 2025 paper “EmoNet-Face: An Expert-Annotated Benchmark for Synthetic Emotion Recognition.” Includes a 40-category emotion taxonomy, balanced synthetic datasets, expert annotations, and baseline models for fair and reproducible evaluation.

Jupyter Notebook
Обновлено 28 мая 2026 г.

annotate-collection

3

A repository with data for annotation.

Python
Обновлено 13 мая 2025 г.

decentralized-learning

3

A basic setup for decentralized-learning that can be used for training future DALLE/CLIP/CLAP models.

Неизвестный язык
Обновлено 8 сент. 2024 г.

chatterbox-voice-conversion

2

High-level Python library for zero-shot voice conversion using Resemble AI's Chatterbox S3Gen model

Python
Обновлено 9 июн. 2026 г.

BVD

2

Описание для этого репозитория не предоставлено.

Python
Обновлено 3 июн. 2026 г.

agent-bud-e

2

Building an agentic voice assistant for mobile & desktop devices with episodic, semantic & procedural memories

Неизвестный язык
Обновлено 16 апр. 2026 г.

llm-template

2

A template for procedural template generation using JSON outputs form LLMs.

TypeScript
Обновлено 3 апр. 2026 г.

AIW_webpage

2

Alice in Wonderland project and initiative webpage

Неизвестный язык
Обновлено 3 апр. 2026 г.

laion5b-subsets

2

Creating subsets from laion5b via embeddings search

Jupyter Notebook
Обновлено 2 дек. 2025 г.

Open-Sci-hf

2

Описание для этого репозитория не предоставлено.

Python
Обновлено 18 авг. 2025 г.

curiosit-e

2

File server for curiosit-e content.

TypeScript
Обновлено 17 апр. 2025 г.

images-for-slideshows

2

Описание для этого репозитория не предоставлено.

Неизвестный язык
Обновлено 4 апр. 2025 г.

django-htmx-llm-streaming

2

A prototype showing how to stream using Django x htmx.

JavaScript
Обновлено 4 апр. 2025 г.

crawlingathome

2

A client library for Crawling@Home's effort to filter CommonCrawl with CLIP, building a large scale image-text dataset.

Python
Обновлено 19 июн. 2024 г.

school-bud-e-frontend

1

School Bud-E is an intelligent and empathetic learning assistant designed to revolutionize the educational experience.

Dart
Обновлено 27 мая 2026 г.

Admin_Bud-E

1

Admin Bud-E is a lightweight, privacy-first control center for AI chat, speech-to-text, and text-to-speech. Manage providers, routing, and costs with a simple Admin Console. Give users per-period credits, prices per model, and a shared Common Pool. EU-friendly via OpenAI-Format endpoints or our optional Google Cloud Vertex proxy.

Python
Обновлено 18 мая 2026 г.

transformers

1

🤗 Transformers: the model-definition framework for state-of-the-art machine learning models in text, vision, audio, and multimodal models, for both inference and training.

Python
Обновлено 3 апр. 2026 г.

snac-to-llama3

1

Описание для этого репозитория не предоставлено.

Jupyter Notebook
Обновлено 4 апр. 2025 г.

bud-e-mobile

1

Mobile app development of all bud-e derivatives.

Неизвестный язык
Обновлено 4 апр. 2025 г.

laionbox

0

LaionBox: Fine-tuned DramaBox TTS with Multi-Auxiliary Differentiable Losses

Python
Обновлено 13 июн. 2026 г.

open-sci-ref

0

Описание для этого репозитория не предоставлено.

Python
Обновлено 12 июн. 2026 г.

Voice-Acting-Pipeline

0

Self-contained DramaBox voice acting pipeline: VoiceNet taxonomy, multi-GPU prompt generation, TTS synthesis, and audio refinement

Python
Обновлено 5 июн. 2026 г.

emolia-bench

0

Benchmark analysis

Python
Обновлено 13 мая 2026 г.

jax-dacvae-echotts

0

JAX/TPU training code for EchoTTS with DACVAE latent codec

Python
Обновлено 8 мая 2026 г.

tunes

0

Описание для этого репозитория не предоставлено.

Python
Обновлено 7 мая 2026 г.

scientific-summaries

0

Описание для этого репозитория не предоставлено.

Python
Обновлено 7 мая 2026 г.

open-clap-scaling

0

Multi-node scaling benchmarks for CLAP contrastive audio-language models on HPC clusters

Python
Обновлено 29 мар. 2026 г.

vocolino

0

Описание для этого репозитория не предоставлено.

Неизвестный язык
Обновлено 27 мар. 2026 г.

helden-bud-e-frontend

0

Описание для этого репозитория не предоставлено.

TypeScript
Обновлено 6 сент. 2025 г.

DSA-Wissen-BM25-Server

0

Описание для этого репозитория не предоставлено.

Python
Обновлено 6 сент. 2025 г.

StoryBuddy-frontend

0

Описание для этого репозитория не предоставлено.

Неизвестный язык
Обновлено 31 авг. 2025 г.

Open-Sci-moe-hf

0

Описание для этого репозитория не предоставлено.

Неизвестный язык
Обновлено 11 июн. 2025 г.

Часто задаваемые вопросы

Что разрабатывает LAION-AI на GitHub?

LAION-AI разрабатывает инструменты и модели для исследований в области машинного обучения. Среди их проектов можно найти Open-Assistant, CLAP и другие, которые помогают в обработке аудио и визуальных данных.

Какие языки программирования использует LAION-AI?

LAION-AI использует несколько языков программирования, включая Python, Jupyter Notebook и TypeScript. Эти языки позволяют создавать разнообразные проекты и проводить исследования в области ИИ.

Являются ли репозитории LAION-AI публичными?

Да, все репозитории LAION-AI являются публичными. Это обеспечивает доступ к их коду и моделям для исследователей и разработчиков, желающих использовать или улучшать их разработки.

Это раскрытие намеренно?

Следите за LAION AI с помощью RepoGuard и получайте уведомления в момент появления нового публичного репозитория.

Следить за этим аккаунтом