RepoGuard
3 h ago에 업데이트됨
LAION AI

Organization

LAION AI의 공개 GitHub 발자국

@LAION-AI
GitHub에서 프로필 보기

This is the repo of LAION, a non-profit organization to liberate machine learning research, models and datasets.

Germany

126

공개 저장소

47,159

총 별점

4,257

팔로워

LAION-AI는 기계 학습 연구와 모델, 데이터 세트를 자유롭게 하기 위한 비영리 조직으로, GitHub에서 다양한 공개 리포지토리를 운영하고 있습니다. 주요 프로그래밍 언어로는 Python, Jupyter Notebook, TypeScript가 있으며, Open-Assistant와 CLAP 같은 여러 주목할만한 프로젝트가 포함되어 있습니다.

주요 언어

Python 50Jupyter Notebook 12TypeScript 6HTML 4Dart 2JavaScript 1

공개 저장소

Open-Assistant

37,397

OpenAssistant is a chat-based assistant that understands tasks, can interact with third-party systems, and retrieve information dynamically to do so.

Python
업데이트됨 2026년 6월 12일

CLAP

2,178

Contrastive Language-Audio Pretraining

Python
업데이트됨 2026년 6월 12일

CLIP_benchmark

812

CLIP-like model evaluation

Python
업데이트됨 2026년 6월 11일

audio-dataset

740

Audio Dataset for training CLAP and other models

Python
업데이트됨 2026년 5월 29일

aesthetic-predictor

708

A linear estimator on top of clip to predict the aesthetic quality of pictures

Jupyter Notebook
업데이트됨 2026년 6월 12일

dalle2-laion

504

Pretrained Dalle2 from laion

Python
업데이트됨 2026년 5월 28일

natural_voice_assistant

499

이 저장소에 대한 설명이 제공되지 않았습니다.

Python
업데이트됨 2026년 6월 10일

CLIP-based-NSFW-Detector

466

이 저장소에 대한 설명이 제공되지 않았습니다.

Python
업데이트됨 2026년 6월 10일

lucidrains-projects

357

A summary of all lucidrains repositores and links to training / research approaches by LAION or other communities.

Jupyter Notebook
업데이트됨 2026년 6월 6일

laion-3d

296

Collect large 3d dataset and build models

알 수 없는 언어
업데이트됨 2026년 6월 12일

laion-datasets

255

Description and pointers of laion datasets

HTML
업데이트됨 2026년 3월 26일

phenaki

220

A phenaki reproduction using pytorch.

Python
업데이트됨 2026년 3월 10일

Open-Instruction-Generalist

210

Open Instruction Generalist is an assistant trained on massive synthetic instructions to perform many millions of tasks

Python
업데이트됨 2026년 4월 3일

scaling-laws-openclip

195

Reproducible scaling laws for contrastive language-image learning (https://arxiv.org/abs/2212.07143)

Jupyter Notebook
업데이트됨 2026년 5월 25일

ldm-finetune

181

Home of `erlich` and `ongo`. Finetune latent-diffusion/glid-3-xl text2image on your own data.

Python
업데이트됨 2025년 11월 19일

laion-dreams

167

Aim for the moon. If you miss, you may hit a star.

알 수 없는 언어
업데이트됨 2026년 5월 29일

LAION-5B-WatermarkDetection

132

이 저장소에 대한 설명이 제공되지 않았습니다.

Python
업데이트됨 2026년 6월 11일

AIW

129

Alice in Wonderland code base for experiments and raw experiments data

Python
업데이트됨 2026년 6월 12일

laion.ai

123

이 저장소에 대한 설명이 제공되지 않았습니다.

HTML
업데이트됨 2026년 6월 12일

emotion-annotations

110

이 저장소에 대한 설명이 제공되지 않았습니다.

Python
업데이트됨 2026년 6월 12일

Discord-Scrapers

106

Implementation of a discord channel scraper to generate datasets.

Python
업데이트됨 2026년 5월 23일

video-clip

97

Let's make a video clip

알 수 없는 언어
업데이트됨 2026년 4월 9일

Open-GIA

87

O-GIA is an umbrella for research, infrastructure and projects ecosystem that should provide open source, reproducible datasets, models, applications & safety tools for Open Generalist Interactive Agents (O-GIA). O-GIA systems will act in collaboration with human or autonomously, supporting various kind of validated decision making and assistance.

알 수 없는 언어
업데이트됨 2025년 12월 2일

watermark-detection

74

A repository containing datasets and tools to train a watermark classifier.

Python
업데이트됨 2026년 5월 30일

LAION-SAFETY

65

An open toolbox for NSFW & toxicity detection

Jupyter Notebook
업데이트됨 2026년 3월 30일

General-GPT

65

이 저장소에 대한 설명이 제공되지 않았습니다.

Jupyter Notebook
업데이트됨 2025년 7월 16일

Text-to-speech

61

이 저장소에 대한 설명이 제공되지 않았습니다.

Python
업데이트됨 2025년 11월 19일

Big-Interleaved-Dataset

59

Big-Interleaved-Dataset

Python
업데이트됨 2026년 4월 3일

interesting-text-datasets

45

이 저장소에 대한 설명이 제공되지 않았습니다.

알 수 없는 언어
업데이트됨 2026년 5월 21일

riverbed

45

Tools for content datamining and NLP at scale

Python
업데이트됨 2026년 4월 3일

Desktop_BUD-E

42

BUD-E (Buddy) is an open-source voice assistant framework that facilitates seamless interaction with AI models and APIs, enabling the creation and integration of diverse skills for educational and research applications.

Python
업데이트됨 2026년 2월 16일

OCR-ensemble

42

이 저장소에 대한 설명이 제공되지 않았습니다.

Jupyter Notebook
업데이트됨 2025년 12월 28일

blade2blade

41

Adversarial Training and SFT for Bot Safety Models

Python
업데이트됨 2026년 4월 3일

Conditional-Pretraining-of-Large-Language-Models

37

이 저장소에 대한 설명이 제공되지 않았습니다.

Python
업데이트됨 2025년 1월 2일

deep-image-diffusion-prior

36

Inverts CLIP text embeds to image embeds and visualizes with deep-image-prior.

Jupyter Notebook
업데이트됨 2026년 4월 28일

laion5B-paper

36

Building the laion5B paper

알 수 없는 언어
업데이트됨 2025년 9월 4일

emotional-speech-annotations

35

This repository contains prompts & best practices to annotate audio clips with a very high degree of details using Audio-Language-Models

알 수 없는 언어
업데이트됨 2025년 7월 1일

temporal-embedding-aggregation

32

Aggregating embeddings over time

Python
업데이트됨 2025년 6월 23일

medical

30

This repository will be a summary and outlook on all our open, medical, AI advancements.

Jupyter Notebook
업데이트됨 2026년 2월 13일

conditioned-prior

29

(wip) Use LAION-AI's CLIP "conditoned prior" to generate CLIP image embeds from CLIP text embeds.

Python
업데이트됨 2025년 10월 13일

Anh

28

Anh - LAION's multilingual assistant datasets and models

Python
업데이트됨 2026년 4월 3일

scaled-echo-tts

24

Scaled diffusion transformer for text-to-speech synthesis (DiT + T5Gemma2 conditioning, TorchTitan & Megatron backends, tested up to 1024 GPUs)

Python
업데이트됨 2026년 5월 28일

Desktop-BUD-E_V1.0

24

BUD-E (Buddy) is an open-source voice assistant framework that facilitates seamless interaction with AI models and APIs, enabling the creation and integration of diverse skills for educational and research applications.

Python
업데이트됨 2026년 4월 7일

laion50BU

24

Un-*** 50 billions multimodality dataset

알 수 없는 언어
업데이트됨 2026년 4월 3일

scaling-laws-for-comparison

22

이 저장소에 대한 설명이 제공되지 않았습니다.

Jupyter Notebook
업데이트됨 2026년 5월 13일

school-bud-e-frontend-old

22

A frontend that is compatible to the school-bud-e-backend.

TypeScript
업데이트됨 2025년 10월 9일

math_problems-step-by-step_solutions

19

Here we provide and collect many functions to generate math problem and step by step solutions for LLM training

Python
업데이트됨 2026년 5월 31일

laion-dedup

18

이 저장소에 대한 설명이 제공되지 않았습니다.

Python
업데이트됨 2026년 6월 10일

bud-e

18

A general human-ai interaction platform.

Dart
업데이트됨 2026년 5월 27일

univeral-audio-annotation-pipeline

14

이 저장소에 대한 설명이 제공되지 않았습니다.

Python
업데이트됨 2026년 6월 11일

Vocalino-V0.1-Voice-Acting-Pipeline

14

Open-weights voice acting pipeline combining zero-shot voice cloning with natural-language direction. Provide a reference voice (or generate one) and describe how the line should be performed. Produces speech that keeps the voice identity while following emotional and stylistic prompts—no training required.

HTML
업데이트됨 2026년 5월 25일

opendream

14

Frontend (and soon also midleware and backend) for a new, opensource image generation platform.

TypeScript
업데이트됨 2025년 11월 19일

LAION-PEOPLE

14

This project provides a data set with bounding boxes, body poses, 3D face meshes & captions of people from our LAION-2.2B. Additionally it provides clusters based on the poses and face meshes and pose-related captions based on these cluster assignments.

알 수 없는 언어
업데이트됨 2025년 4월 14일

worldsim

13

이 저장소에 대한 설명이 제공되지 않았습니다.

알 수 없는 언어
업데이트됨 2025년 12월 21일

super-resolution

13

This is the LAION repository for creating open super-resolution models with the help of LAION-5B subsets.

알 수 없는 언어
업데이트됨 2025년 7월 20일

laionide

12

This repository contains training code and checkpoitns for finetuning glide.

Python
업데이트됨 2026년 4월 3일

project-menu

12

Projects at LAION

알 수 없는 언어
업데이트됨 2025년 8월 25일

model-retrieval

11

Easily compute model embeddings and save the embeddings.

알 수 없는 언어
업데이트됨 2026년 4월 3일

project-alexandria

9

Official repo for Project Alexandria

알 수 없는 언어
업데이트됨 2026년 3월 17일

open-sci-ref-0.01

8

이 저장소에 대한 설명이 제공되지 않았습니다.

알 수 없는 언어
업데이트됨 2026년 2월 24일

image-deduplication-testset

8

이 저장소에 대한 설명이 제공되지 않았습니다.

HTML
업데이트됨 2024년 1월 4일

KAISER

7

Knowledge Acquisition and Interlinking via Semantic Embeddings and Reasoning

알 수 없는 언어
업데이트됨 2026년 4월 3일

Megatron-LM-Open-Sci

7

MegaTron open-sci fork

Python
업데이트됨 2026년 4월 3일

voice-taxonomies

5

Collection of three complementary voice taxonomies: VoiceNet (59 speech dimensions), EmoNet (40 emotion categories), VocalBurst (82 non-speech sounds)

알 수 없는 언어
업데이트됨 2026년 6월 9일

Retrieval-Augmented-Voice-Cloning

5

Retrieval-augmented voice cloning and emotion conditioning data generation pipeline. Combines Echo TTS, ChatterboxVC, and Empathic Insight Voice+ to generate large-scale datasets of emotionally conditioned speech with disentangled speaker identity and emotional prosody.

Python
업데이트됨 2026년 6월 9일

open_clip_mammut

5

OpenCLIP fork with MaMMUT support

Python
업데이트됨 2025년 11월 26일

safety-pipeline

5

A collection of safety classifiers and models to process image and texts.

Python
업데이트됨 2025년 5월 14일

Dream-E

4

이 저장소에 대한 설명이 제공되지 않았습니다.

TypeScript
업데이트됨 2026년 6월 11일

emonet-face

4

Official repository for the NeurIPS 2025 paper “EmoNet-Face: An Expert-Annotated Benchmark for Synthetic Emotion Recognition.” Includes a 40-category emotion taxonomy, balanced synthetic datasets, expert annotations, and baseline models for fair and reproducible evaluation.

Jupyter Notebook
업데이트됨 2026년 5월 28일

annotate-collection

3

A repository with data for annotation.

Python
업데이트됨 2025년 5월 13일

decentralized-learning

3

A basic setup for decentralized-learning that can be used for training future DALLE/CLIP/CLAP models.

알 수 없는 언어
업데이트됨 2024년 9월 8일

chatterbox-voice-conversion

2

High-level Python library for zero-shot voice conversion using Resemble AI's Chatterbox S3Gen model

Python
업데이트됨 2026년 6월 9일

BVD

2

이 저장소에 대한 설명이 제공되지 않았습니다.

Python
업데이트됨 2026년 6월 3일

agent-bud-e

2

Building an agentic voice assistant for mobile & desktop devices with episodic, semantic & procedural memories

알 수 없는 언어
업데이트됨 2026년 4월 16일

llm-template

2

A template for procedural template generation using JSON outputs form LLMs.

TypeScript
업데이트됨 2026년 4월 3일

AIW_webpage

2

Alice in Wonderland project and initiative webpage

알 수 없는 언어
업데이트됨 2026년 4월 3일

laion5b-subsets

2

Creating subsets from laion5b via embeddings search

Jupyter Notebook
업데이트됨 2025년 12월 2일

Open-Sci-hf

2

이 저장소에 대한 설명이 제공되지 않았습니다.

Python
업데이트됨 2025년 8월 18일

curiosit-e

2

File server for curiosit-e content.

TypeScript
업데이트됨 2025년 4월 17일

images-for-slideshows

2

이 저장소에 대한 설명이 제공되지 않았습니다.

알 수 없는 언어
업데이트됨 2025년 4월 4일

django-htmx-llm-streaming

2

A prototype showing how to stream using Django x htmx.

JavaScript
업데이트됨 2025년 4월 4일

crawlingathome

2

A client library for Crawling@Home's effort to filter CommonCrawl with CLIP, building a large scale image-text dataset.

Python
업데이트됨 2024년 6월 19일

school-bud-e-frontend

1

School Bud-E is an intelligent and empathetic learning assistant designed to revolutionize the educational experience.

Dart
업데이트됨 2026년 5월 27일

Admin_Bud-E

1

Admin Bud-E is a lightweight, privacy-first control center for AI chat, speech-to-text, and text-to-speech. Manage providers, routing, and costs with a simple Admin Console. Give users per-period credits, prices per model, and a shared Common Pool. EU-friendly via OpenAI-Format endpoints or our optional Google Cloud Vertex proxy.

Python
업데이트됨 2026년 5월 18일

transformers

1

🤗 Transformers: the model-definition framework for state-of-the-art machine learning models in text, vision, audio, and multimodal models, for both inference and training.

Python
업데이트됨 2026년 4월 3일

snac-to-llama3

1

이 저장소에 대한 설명이 제공되지 않았습니다.

Jupyter Notebook
업데이트됨 2025년 4월 4일

bud-e-mobile

1

Mobile app development of all bud-e derivatives.

알 수 없는 언어
업데이트됨 2025년 4월 4일

laionbox

0

LaionBox: Fine-tuned DramaBox TTS with Multi-Auxiliary Differentiable Losses

Python
업데이트됨 2026년 6월 13일

open-sci-ref

0

이 저장소에 대한 설명이 제공되지 않았습니다.

Python
업데이트됨 2026년 6월 12일

Voice-Acting-Pipeline

0

Self-contained DramaBox voice acting pipeline: VoiceNet taxonomy, multi-GPU prompt generation, TTS synthesis, and audio refinement

Python
업데이트됨 2026년 6월 5일

emolia-bench

0

Benchmark analysis

Python
업데이트됨 2026년 5월 13일

jax-dacvae-echotts

0

JAX/TPU training code for EchoTTS with DACVAE latent codec

Python
업데이트됨 2026년 5월 8일

tunes

0

이 저장소에 대한 설명이 제공되지 않았습니다.

Python
업데이트됨 2026년 5월 7일

scientific-summaries

0

이 저장소에 대한 설명이 제공되지 않았습니다.

Python
업데이트됨 2026년 5월 7일

open-clap-scaling

0

Multi-node scaling benchmarks for CLAP contrastive audio-language models on HPC clusters

Python
업데이트됨 2026년 3월 29일

vocolino

0

이 저장소에 대한 설명이 제공되지 않았습니다.

알 수 없는 언어
업데이트됨 2026년 3월 27일

helden-bud-e-frontend

0

이 저장소에 대한 설명이 제공되지 않았습니다.

TypeScript
업데이트됨 2025년 9월 6일

DSA-Wissen-BM25-Server

0

이 저장소에 대한 설명이 제공되지 않았습니다.

Python
업데이트됨 2025년 9월 6일

StoryBuddy-frontend

0

이 저장소에 대한 설명이 제공되지 않았습니다.

알 수 없는 언어
업데이트됨 2025년 8월 31일

Open-Sci-moe-hf

0

이 저장소에 대한 설명이 제공되지 않았습니다.

알 수 없는 언어
업데이트됨 2025년 6월 11일

자주 묻는 질문

LAION-AI는 GitHub에서 어떤 것을 개발하나요?

LAION-AI는 기계 학습 관련 프로젝트와 데이터 세트를 개발하고 있습니다. Open-Assistant와 CLAP 같은 리포지토리를 통해 다양한 연구와 모델을 지원합니다.

LAION-AI에서 사용하는 프로그래밍 언어는 무엇인가요?

LAION-AI는 주로 Python, Jupyter Notebook, TypeScript, HTML, Dart, JavaScript와 같은 여러 프로그래밍 언어를 사용하여 리포지토리를 개발하고 있습니다.

LAION-AI의 리포지토리는 공개인가요?

네, LAION-AI의 모든 리포지토리는 공개되어 있어 누구나 접근하고 사용할 수 있습니다. 이는 기계 학습 연구의 개방성을 촉진하기 위한 목적입니다.

이 노출이 의도된 것인가요?

LAION AI을 RepoGuard로 모니터링하고 새로운 공개 저장소가 나타나는 순간 알림을 받으세요.

이 계정 모니터링하기