RepoGuard
3 h ago güncellendi
LAION AI

Organization

LAION AI için Kamu GitHub ayak izi

@LAION-AI
GitHub'da profili görüntüle

This is the repo of LAION, a non-profit organization to liberate machine learning research, models and datasets.

Germany

126

Kamu depoları

47.159

Toplam yıldız

4.257

Takipçiler

LAION-AI, makine öğrenimi araştırmalarını, modellerini ve veri setlerini özgürleştirmeyi amaçlayan kar amacı gütmeyen bir organizasyondur. GitHub'daki kamuya açık varlıkları arasında Python, Jupyter Notebook ve TypeScript gibi dillerde geliştirilmiş çeşitli projeler bulunmaktadır. Öne çıkan depoları arasında Open-Assistant ve CLAP gibi önemli çalışmalar yer almaktadır.

En popüler diller

Python 50Jupyter Notebook 12TypeScript 6HTML 4Dart 2JavaScript 1

Kamu depoları

Open-Assistant

37.397

OpenAssistant is a chat-based assistant that understands tasks, can interact with third-party systems, and retrieve information dynamically to do so.

Python
Güncellendi 12 Haz 2026

CLAP

2.178

Contrastive Language-Audio Pretraining

Python
Güncellendi 12 Haz 2026

CLIP_benchmark

812

CLIP-like model evaluation

Python
Güncellendi 11 Haz 2026

audio-dataset

740

Audio Dataset for training CLAP and other models

Python
Güncellendi 29 May 2026

aesthetic-predictor

708

A linear estimator on top of clip to predict the aesthetic quality of pictures

Jupyter Notebook
Güncellendi 12 Haz 2026

dalle2-laion

504

Pretrained Dalle2 from laion

Python
Güncellendi 28 May 2026

natural_voice_assistant

499

Bu depo için açıklama sağlanmadı.

Python
Güncellendi 10 Haz 2026

CLIP-based-NSFW-Detector

466

Bu depo için açıklama sağlanmadı.

Python
Güncellendi 10 Haz 2026

lucidrains-projects

357

A summary of all lucidrains repositores and links to training / research approaches by LAION or other communities.

Jupyter Notebook
Güncellendi 6 Haz 2026

laion-3d

296

Collect large 3d dataset and build models

Bilinmeyen Dil
Güncellendi 12 Haz 2026

laion-datasets

255

Description and pointers of laion datasets

HTML
Güncellendi 26 Mar 2026

phenaki

220

A phenaki reproduction using pytorch.

Python
Güncellendi 10 Mar 2026

Open-Instruction-Generalist

210

Open Instruction Generalist is an assistant trained on massive synthetic instructions to perform many millions of tasks

Python
Güncellendi 3 Nis 2026

scaling-laws-openclip

195

Reproducible scaling laws for contrastive language-image learning (https://arxiv.org/abs/2212.07143)

Jupyter Notebook
Güncellendi 25 May 2026

ldm-finetune

181

Home of `erlich` and `ongo`. Finetune latent-diffusion/glid-3-xl text2image on your own data.

Python
Güncellendi 19 Kas 2025

laion-dreams

167

Aim for the moon. If you miss, you may hit a star.

Bilinmeyen Dil
Güncellendi 29 May 2026

LAION-5B-WatermarkDetection

132

Bu depo için açıklama sağlanmadı.

Python
Güncellendi 11 Haz 2026

AIW

129

Alice in Wonderland code base for experiments and raw experiments data

Python
Güncellendi 12 Haz 2026

laion.ai

123

Bu depo için açıklama sağlanmadı.

HTML
Güncellendi 12 Haz 2026

emotion-annotations

110

Bu depo için açıklama sağlanmadı.

Python
Güncellendi 12 Haz 2026

Discord-Scrapers

106

Implementation of a discord channel scraper to generate datasets.

Python
Güncellendi 23 May 2026

video-clip

97

Let's make a video clip

Bilinmeyen Dil
Güncellendi 9 Nis 2026

Open-GIA

87

O-GIA is an umbrella for research, infrastructure and projects ecosystem that should provide open source, reproducible datasets, models, applications & safety tools for Open Generalist Interactive Agents (O-GIA). O-GIA systems will act in collaboration with human or autonomously, supporting various kind of validated decision making and assistance.

Bilinmeyen Dil
Güncellendi 2 Ara 2025

watermark-detection

74

A repository containing datasets and tools to train a watermark classifier.

Python
Güncellendi 30 May 2026

LAION-SAFETY

65

An open toolbox for NSFW & toxicity detection

Jupyter Notebook
Güncellendi 30 Mar 2026

General-GPT

65

Bu depo için açıklama sağlanmadı.

Jupyter Notebook
Güncellendi 16 Tem 2025

Text-to-speech

61

Bu depo için açıklama sağlanmadı.

Python
Güncellendi 19 Kas 2025

Big-Interleaved-Dataset

59

Big-Interleaved-Dataset

Python
Güncellendi 3 Nis 2026

interesting-text-datasets

45

Bu depo için açıklama sağlanmadı.

Bilinmeyen Dil
Güncellendi 21 May 2026

riverbed

45

Tools for content datamining and NLP at scale

Python
Güncellendi 3 Nis 2026

Desktop_BUD-E

42

BUD-E (Buddy) is an open-source voice assistant framework that facilitates seamless interaction with AI models and APIs, enabling the creation and integration of diverse skills for educational and research applications.

Python
Güncellendi 16 Şub 2026

OCR-ensemble

42

Bu depo için açıklama sağlanmadı.

Jupyter Notebook
Güncellendi 28 Ara 2025

blade2blade

41

Adversarial Training and SFT for Bot Safety Models

Python
Güncellendi 3 Nis 2026

Conditional-Pretraining-of-Large-Language-Models

37

Bu depo için açıklama sağlanmadı.

Python
Güncellendi 2 Oca 2025

deep-image-diffusion-prior

36

Inverts CLIP text embeds to image embeds and visualizes with deep-image-prior.

Jupyter Notebook
Güncellendi 28 Nis 2026

laion5B-paper

36

Building the laion5B paper

Bilinmeyen Dil
Güncellendi 4 Eyl 2025

emotional-speech-annotations

35

This repository contains prompts & best practices to annotate audio clips with a very high degree of details using Audio-Language-Models

Bilinmeyen Dil
Güncellendi 1 Tem 2025

temporal-embedding-aggregation

32

Aggregating embeddings over time

Python
Güncellendi 23 Haz 2025

medical

30

This repository will be a summary and outlook on all our open, medical, AI advancements.

Jupyter Notebook
Güncellendi 13 Şub 2026

conditioned-prior

29

(wip) Use LAION-AI's CLIP "conditoned prior" to generate CLIP image embeds from CLIP text embeds.

Python
Güncellendi 13 Eki 2025

Anh

28

Anh - LAION's multilingual assistant datasets and models

Python
Güncellendi 3 Nis 2026

scaled-echo-tts

24

Scaled diffusion transformer for text-to-speech synthesis (DiT + T5Gemma2 conditioning, TorchTitan & Megatron backends, tested up to 1024 GPUs)

Python
Güncellendi 28 May 2026

Desktop-BUD-E_V1.0

24

BUD-E (Buddy) is an open-source voice assistant framework that facilitates seamless interaction with AI models and APIs, enabling the creation and integration of diverse skills for educational and research applications.

Python
Güncellendi 7 Nis 2026

laion50BU

24

Un-*** 50 billions multimodality dataset

Bilinmeyen Dil
Güncellendi 3 Nis 2026

scaling-laws-for-comparison

22

Bu depo için açıklama sağlanmadı.

Jupyter Notebook
Güncellendi 13 May 2026

school-bud-e-frontend-old

22

A frontend that is compatible to the school-bud-e-backend.

TypeScript
Güncellendi 9 Eki 2025

math_problems-step-by-step_solutions

19

Here we provide and collect many functions to generate math problem and step by step solutions for LLM training

Python
Güncellendi 31 May 2026

laion-dedup

18

Bu depo için açıklama sağlanmadı.

Python
Güncellendi 10 Haz 2026

bud-e

18

A general human-ai interaction platform.

Dart
Güncellendi 27 May 2026

univeral-audio-annotation-pipeline

14

Bu depo için açıklama sağlanmadı.

Python
Güncellendi 11 Haz 2026

Vocalino-V0.1-Voice-Acting-Pipeline

14

Open-weights voice acting pipeline combining zero-shot voice cloning with natural-language direction. Provide a reference voice (or generate one) and describe how the line should be performed. Produces speech that keeps the voice identity while following emotional and stylistic prompts—no training required.

HTML
Güncellendi 25 May 2026

opendream

14

Frontend (and soon also midleware and backend) for a new, opensource image generation platform.

TypeScript
Güncellendi 19 Kas 2025

LAION-PEOPLE

14

This project provides a data set with bounding boxes, body poses, 3D face meshes & captions of people from our LAION-2.2B. Additionally it provides clusters based on the poses and face meshes and pose-related captions based on these cluster assignments.

Bilinmeyen Dil
Güncellendi 14 Nis 2025

worldsim

13

Bu depo için açıklama sağlanmadı.

Bilinmeyen Dil
Güncellendi 21 Ara 2025

super-resolution

13

This is the LAION repository for creating open super-resolution models with the help of LAION-5B subsets.

Bilinmeyen Dil
Güncellendi 20 Tem 2025

laionide

12

This repository contains training code and checkpoitns for finetuning glide.

Python
Güncellendi 3 Nis 2026

project-menu

12

Projects at LAION

Bilinmeyen Dil
Güncellendi 25 Ağu 2025

model-retrieval

11

Easily compute model embeddings and save the embeddings.

Bilinmeyen Dil
Güncellendi 3 Nis 2026

project-alexandria

9

Official repo for Project Alexandria

Bilinmeyen Dil
Güncellendi 17 Mar 2026

open-sci-ref-0.01

8

Bu depo için açıklama sağlanmadı.

Bilinmeyen Dil
Güncellendi 24 Şub 2026

image-deduplication-testset

8

Bu depo için açıklama sağlanmadı.

HTML
Güncellendi 4 Oca 2024

KAISER

7

Knowledge Acquisition and Interlinking via Semantic Embeddings and Reasoning

Bilinmeyen Dil
Güncellendi 3 Nis 2026

Megatron-LM-Open-Sci

7

MegaTron open-sci fork

Python
Güncellendi 3 Nis 2026

voice-taxonomies

5

Collection of three complementary voice taxonomies: VoiceNet (59 speech dimensions), EmoNet (40 emotion categories), VocalBurst (82 non-speech sounds)

Bilinmeyen Dil
Güncellendi 9 Haz 2026

Retrieval-Augmented-Voice-Cloning

5

Retrieval-augmented voice cloning and emotion conditioning data generation pipeline. Combines Echo TTS, ChatterboxVC, and Empathic Insight Voice+ to generate large-scale datasets of emotionally conditioned speech with disentangled speaker identity and emotional prosody.

Python
Güncellendi 9 Haz 2026

open_clip_mammut

5

OpenCLIP fork with MaMMUT support

Python
Güncellendi 26 Kas 2025

safety-pipeline

5

A collection of safety classifiers and models to process image and texts.

Python
Güncellendi 14 May 2025

Dream-E

4

Bu depo için açıklama sağlanmadı.

TypeScript
Güncellendi 11 Haz 2026

emonet-face

4

Official repository for the NeurIPS 2025 paper “EmoNet-Face: An Expert-Annotated Benchmark for Synthetic Emotion Recognition.” Includes a 40-category emotion taxonomy, balanced synthetic datasets, expert annotations, and baseline models for fair and reproducible evaluation.

Jupyter Notebook
Güncellendi 28 May 2026

annotate-collection

3

A repository with data for annotation.

Python
Güncellendi 13 May 2025

decentralized-learning

3

A basic setup for decentralized-learning that can be used for training future DALLE/CLIP/CLAP models.

Bilinmeyen Dil
Güncellendi 8 Eyl 2024

chatterbox-voice-conversion

2

High-level Python library for zero-shot voice conversion using Resemble AI's Chatterbox S3Gen model

Python
Güncellendi 9 Haz 2026

BVD

2

Bu depo için açıklama sağlanmadı.

Python
Güncellendi 3 Haz 2026

agent-bud-e

2

Building an agentic voice assistant for mobile & desktop devices with episodic, semantic & procedural memories

Bilinmeyen Dil
Güncellendi 16 Nis 2026

llm-template

2

A template for procedural template generation using JSON outputs form LLMs.

TypeScript
Güncellendi 3 Nis 2026

AIW_webpage

2

Alice in Wonderland project and initiative webpage

Bilinmeyen Dil
Güncellendi 3 Nis 2026

laion5b-subsets

2

Creating subsets from laion5b via embeddings search

Jupyter Notebook
Güncellendi 2 Ara 2025

Open-Sci-hf

2

Bu depo için açıklama sağlanmadı.

Python
Güncellendi 18 Ağu 2025

curiosit-e

2

File server for curiosit-e content.

TypeScript
Güncellendi 17 Nis 2025

images-for-slideshows

2

Bu depo için açıklama sağlanmadı.

Bilinmeyen Dil
Güncellendi 4 Nis 2025

django-htmx-llm-streaming

2

A prototype showing how to stream using Django x htmx.

JavaScript
Güncellendi 4 Nis 2025

crawlingathome

2

A client library for Crawling@Home's effort to filter CommonCrawl with CLIP, building a large scale image-text dataset.

Python
Güncellendi 19 Haz 2024

school-bud-e-frontend

1

School Bud-E is an intelligent and empathetic learning assistant designed to revolutionize the educational experience.

Dart
Güncellendi 27 May 2026

Admin_Bud-E

1

Admin Bud-E is a lightweight, privacy-first control center for AI chat, speech-to-text, and text-to-speech. Manage providers, routing, and costs with a simple Admin Console. Give users per-period credits, prices per model, and a shared Common Pool. EU-friendly via OpenAI-Format endpoints or our optional Google Cloud Vertex proxy.

Python
Güncellendi 18 May 2026

transformers

1

🤗 Transformers: the model-definition framework for state-of-the-art machine learning models in text, vision, audio, and multimodal models, for both inference and training.

Python
Güncellendi 3 Nis 2026

snac-to-llama3

1

Bu depo için açıklama sağlanmadı.

Jupyter Notebook
Güncellendi 4 Nis 2025

bud-e-mobile

1

Mobile app development of all bud-e derivatives.

Bilinmeyen Dil
Güncellendi 4 Nis 2025

laionbox

0

LaionBox: Fine-tuned DramaBox TTS with Multi-Auxiliary Differentiable Losses

Python
Güncellendi 13 Haz 2026

open-sci-ref

0

Bu depo için açıklama sağlanmadı.

Python
Güncellendi 12 Haz 2026

Voice-Acting-Pipeline

0

Self-contained DramaBox voice acting pipeline: VoiceNet taxonomy, multi-GPU prompt generation, TTS synthesis, and audio refinement

Python
Güncellendi 5 Haz 2026

emolia-bench

0

Benchmark analysis

Python
Güncellendi 13 May 2026

jax-dacvae-echotts

0

JAX/TPU training code for EchoTTS with DACVAE latent codec

Python
Güncellendi 8 May 2026

tunes

0

Bu depo için açıklama sağlanmadı.

Python
Güncellendi 7 May 2026

scientific-summaries

0

Bu depo için açıklama sağlanmadı.

Python
Güncellendi 7 May 2026

open-clap-scaling

0

Multi-node scaling benchmarks for CLAP contrastive audio-language models on HPC clusters

Python
Güncellendi 29 Mar 2026

vocolino

0

Bu depo için açıklama sağlanmadı.

Bilinmeyen Dil
Güncellendi 27 Mar 2026

helden-bud-e-frontend

0

Bu depo için açıklama sağlanmadı.

TypeScript
Güncellendi 6 Eyl 2025

DSA-Wissen-BM25-Server

0

Bu depo için açıklama sağlanmadı.

Python
Güncellendi 6 Eyl 2025

StoryBuddy-frontend

0

Bu depo için açıklama sağlanmadı.

Bilinmeyen Dil
Güncellendi 31 Ağu 2025

Open-Sci-moe-hf

0

Bu depo için açıklama sağlanmadı.

Bilinmeyen Dil
Güncellendi 11 Haz 2025

Sıkça sorulan sorular

LAION-AI GitHub'da ne tür projeler geliştiriyor?

LAION-AI, makine öğrenimi alanında çeşitli projeler geliştiriyor. Özellikle Open-Assistant gibi sohbet tabanlı asistanlar ve CLAP gibi dil-audio ön eğitim projeleri dikkat çekiyor.

LAION-AI hangi programlama dillerini kullanıyor?

LAION-AI, ana olarak Python, Jupyter Notebook, TypeScript, HTML, Dart ve JavaScript dillerini kullanarak projelerini geliştirmektedir. Bu diller, organizasyonun araştırma odaklı çalışmalarında yaygın bir şekilde kullanılmaktadır.

LAION-AI'nin depoları kamuya açık mı?

Evet, LAION-AI'nin tüm depoları kamuya açıktır. Bu, araştırmacıların ve geliştiricilerin bu kaynaklardan faydalanabilmesini ve topluluk tarafından katkıda bulunulabilmesini sağlar.

Bu ifşa amaçlı mı?

LAION AI ile RepoGuard'ı izleyin ve yeni bir kamu deposu belirdiğinde anında uyarı alın.

Bu hesabı izleyin