RepoGuard
3 h agoに更新されました
LAION AI

Organization

LAION AIの公開GitHubフットプリント

@LAION-AI
GitHubでプロフィールを見る

This is the repo of LAION, a non-profit organization to liberate machine learning research, models and datasets.

Germany

126

公開リポジトリ

47,159

合計スター

4,257

フォロワー

LAION-AIは、機械学習研究、モデル、データセットを解放するための非営利組織です。GitHub上では、Python、Jupyter Notebook、TypeScriptなどのプログラミング言語を使用して、多くのリポジトリを公開しています。特に、Open-AssistantやCLAPなどのプロジェクトが注目されています。

主要な言語

Python 50Jupyter Notebook 12TypeScript 6HTML 4Dart 2JavaScript 1

公開リポジトリ

Open-Assistant

37,397

OpenAssistant is a chat-based assistant that understands tasks, can interact with third-party systems, and retrieve information dynamically to do so.

Python
更新済み 2026年6月12日

CLAP

2,178

Contrastive Language-Audio Pretraining

Python
更新済み 2026年6月12日

CLIP_benchmark

812

CLIP-like model evaluation

Python
更新済み 2026年6月11日

audio-dataset

740

Audio Dataset for training CLAP and other models

Python
更新済み 2026年5月29日

aesthetic-predictor

708

A linear estimator on top of clip to predict the aesthetic quality of pictures

Jupyter Notebook
更新済み 2026年6月12日

dalle2-laion

504

Pretrained Dalle2 from laion

Python
更新済み 2026年5月28日

natural_voice_assistant

499

このリポジトリに関する説明は提供されていません。

Python
更新済み 2026年6月10日

CLIP-based-NSFW-Detector

466

このリポジトリに関する説明は提供されていません。

Python
更新済み 2026年6月10日

lucidrains-projects

357

A summary of all lucidrains repositores and links to training / research approaches by LAION or other communities.

Jupyter Notebook
更新済み 2026年6月6日

laion-3d

296

Collect large 3d dataset and build models

不明な言語
更新済み 2026年6月12日

laion-datasets

255

Description and pointers of laion datasets

HTML
更新済み 2026年3月26日

phenaki

220

A phenaki reproduction using pytorch.

Python
更新済み 2026年3月10日

Open-Instruction-Generalist

210

Open Instruction Generalist is an assistant trained on massive synthetic instructions to perform many millions of tasks

Python
更新済み 2026年4月3日

scaling-laws-openclip

195

Reproducible scaling laws for contrastive language-image learning (https://arxiv.org/abs/2212.07143)

Jupyter Notebook
更新済み 2026年5月25日

ldm-finetune

181

Home of `erlich` and `ongo`. Finetune latent-diffusion/glid-3-xl text2image on your own data.

Python
更新済み 2025年11月19日

laion-dreams

167

Aim for the moon. If you miss, you may hit a star.

不明な言語
更新済み 2026年5月29日

LAION-5B-WatermarkDetection

132

このリポジトリに関する説明は提供されていません。

Python
更新済み 2026年6月11日

AIW

129

Alice in Wonderland code base for experiments and raw experiments data

Python
更新済み 2026年6月12日

laion.ai

123

このリポジトリに関する説明は提供されていません。

HTML
更新済み 2026年6月12日

emotion-annotations

110

このリポジトリに関する説明は提供されていません。

Python
更新済み 2026年6月12日

Discord-Scrapers

106

Implementation of a discord channel scraper to generate datasets.

Python
更新済み 2026年5月23日

video-clip

97

Let's make a video clip

不明な言語
更新済み 2026年4月9日

Open-GIA

87

O-GIA is an umbrella for research, infrastructure and projects ecosystem that should provide open source, reproducible datasets, models, applications & safety tools for Open Generalist Interactive Agents (O-GIA). O-GIA systems will act in collaboration with human or autonomously, supporting various kind of validated decision making and assistance.

不明な言語
更新済み 2025年12月2日

watermark-detection

74

A repository containing datasets and tools to train a watermark classifier.

Python
更新済み 2026年5月30日

LAION-SAFETY

65

An open toolbox for NSFW & toxicity detection

Jupyter Notebook
更新済み 2026年3月30日

General-GPT

65

このリポジトリに関する説明は提供されていません。

Jupyter Notebook
更新済み 2025年7月16日

Text-to-speech

61

このリポジトリに関する説明は提供されていません。

Python
更新済み 2025年11月19日

Big-Interleaved-Dataset

59

Big-Interleaved-Dataset

Python
更新済み 2026年4月3日

interesting-text-datasets

45

このリポジトリに関する説明は提供されていません。

不明な言語
更新済み 2026年5月21日

riverbed

45

Tools for content datamining and NLP at scale

Python
更新済み 2026年4月3日

Desktop_BUD-E

42

BUD-E (Buddy) is an open-source voice assistant framework that facilitates seamless interaction with AI models and APIs, enabling the creation and integration of diverse skills for educational and research applications.

Python
更新済み 2026年2月16日

OCR-ensemble

42

このリポジトリに関する説明は提供されていません。

Jupyter Notebook
更新済み 2025年12月28日

blade2blade

41

Adversarial Training and SFT for Bot Safety Models

Python
更新済み 2026年4月3日

Conditional-Pretraining-of-Large-Language-Models

37

このリポジトリに関する説明は提供されていません。

Python
更新済み 2025年1月2日

deep-image-diffusion-prior

36

Inverts CLIP text embeds to image embeds and visualizes with deep-image-prior.

Jupyter Notebook
更新済み 2026年4月28日

laion5B-paper

36

Building the laion5B paper

不明な言語
更新済み 2025年9月4日

emotional-speech-annotations

35

This repository contains prompts & best practices to annotate audio clips with a very high degree of details using Audio-Language-Models

不明な言語
更新済み 2025年7月1日

temporal-embedding-aggregation

32

Aggregating embeddings over time

Python
更新済み 2025年6月23日

medical

30

This repository will be a summary and outlook on all our open, medical, AI advancements.

Jupyter Notebook
更新済み 2026年2月13日

conditioned-prior

29

(wip) Use LAION-AI's CLIP "conditoned prior" to generate CLIP image embeds from CLIP text embeds.

Python
更新済み 2025年10月13日

Anh

28

Anh - LAION's multilingual assistant datasets and models

Python
更新済み 2026年4月3日

scaled-echo-tts

24

Scaled diffusion transformer for text-to-speech synthesis (DiT + T5Gemma2 conditioning, TorchTitan & Megatron backends, tested up to 1024 GPUs)

Python
更新済み 2026年5月28日

Desktop-BUD-E_V1.0

24

BUD-E (Buddy) is an open-source voice assistant framework that facilitates seamless interaction with AI models and APIs, enabling the creation and integration of diverse skills for educational and research applications.

Python
更新済み 2026年4月7日

laion50BU

24

Un-*** 50 billions multimodality dataset

不明な言語
更新済み 2026年4月3日

scaling-laws-for-comparison

22

このリポジトリに関する説明は提供されていません。

Jupyter Notebook
更新済み 2026年5月13日

school-bud-e-frontend-old

22

A frontend that is compatible to the school-bud-e-backend.

TypeScript
更新済み 2025年10月9日

math_problems-step-by-step_solutions

19

Here we provide and collect many functions to generate math problem and step by step solutions for LLM training

Python
更新済み 2026年5月31日

laion-dedup

18

このリポジトリに関する説明は提供されていません。

Python
更新済み 2026年6月10日

bud-e

18

A general human-ai interaction platform.

Dart
更新済み 2026年5月27日

univeral-audio-annotation-pipeline

14

このリポジトリに関する説明は提供されていません。

Python
更新済み 2026年6月11日

Vocalino-V0.1-Voice-Acting-Pipeline

14

Open-weights voice acting pipeline combining zero-shot voice cloning with natural-language direction. Provide a reference voice (or generate one) and describe how the line should be performed. Produces speech that keeps the voice identity while following emotional and stylistic prompts—no training required.

HTML
更新済み 2026年5月25日

opendream

14

Frontend (and soon also midleware and backend) for a new, opensource image generation platform.

TypeScript
更新済み 2025年11月19日

LAION-PEOPLE

14

This project provides a data set with bounding boxes, body poses, 3D face meshes & captions of people from our LAION-2.2B. Additionally it provides clusters based on the poses and face meshes and pose-related captions based on these cluster assignments.

不明な言語
更新済み 2025年4月14日

worldsim

13

このリポジトリに関する説明は提供されていません。

不明な言語
更新済み 2025年12月21日

super-resolution

13

This is the LAION repository for creating open super-resolution models with the help of LAION-5B subsets.

不明な言語
更新済み 2025年7月20日

laionide

12

This repository contains training code and checkpoitns for finetuning glide.

Python
更新済み 2026年4月3日

project-menu

12

Projects at LAION

不明な言語
更新済み 2025年8月25日

model-retrieval

11

Easily compute model embeddings and save the embeddings.

不明な言語
更新済み 2026年4月3日

project-alexandria

9

Official repo for Project Alexandria

不明な言語
更新済み 2026年3月17日

open-sci-ref-0.01

8

このリポジトリに関する説明は提供されていません。

不明な言語
更新済み 2026年2月24日

image-deduplication-testset

8

このリポジトリに関する説明は提供されていません。

HTML
更新済み 2024年1月4日

KAISER

7

Knowledge Acquisition and Interlinking via Semantic Embeddings and Reasoning

不明な言語
更新済み 2026年4月3日

Megatron-LM-Open-Sci

7

MegaTron open-sci fork

Python
更新済み 2026年4月3日

voice-taxonomies

5

Collection of three complementary voice taxonomies: VoiceNet (59 speech dimensions), EmoNet (40 emotion categories), VocalBurst (82 non-speech sounds)

不明な言語
更新済み 2026年6月9日

Retrieval-Augmented-Voice-Cloning

5

Retrieval-augmented voice cloning and emotion conditioning data generation pipeline. Combines Echo TTS, ChatterboxVC, and Empathic Insight Voice+ to generate large-scale datasets of emotionally conditioned speech with disentangled speaker identity and emotional prosody.

Python
更新済み 2026年6月9日

open_clip_mammut

5

OpenCLIP fork with MaMMUT support

Python
更新済み 2025年11月26日

safety-pipeline

5

A collection of safety classifiers and models to process image and texts.

Python
更新済み 2025年5月14日

Dream-E

4

このリポジトリに関する説明は提供されていません。

TypeScript
更新済み 2026年6月11日

emonet-face

4

Official repository for the NeurIPS 2025 paper “EmoNet-Face: An Expert-Annotated Benchmark for Synthetic Emotion Recognition.” Includes a 40-category emotion taxonomy, balanced synthetic datasets, expert annotations, and baseline models for fair and reproducible evaluation.

Jupyter Notebook
更新済み 2026年5月28日

annotate-collection

3

A repository with data for annotation.

Python
更新済み 2025年5月13日

decentralized-learning

3

A basic setup for decentralized-learning that can be used for training future DALLE/CLIP/CLAP models.

不明な言語
更新済み 2024年9月8日

chatterbox-voice-conversion

2

High-level Python library for zero-shot voice conversion using Resemble AI's Chatterbox S3Gen model

Python
更新済み 2026年6月9日

BVD

2

このリポジトリに関する説明は提供されていません。

Python
更新済み 2026年6月3日

agent-bud-e

2

Building an agentic voice assistant for mobile & desktop devices with episodic, semantic & procedural memories

不明な言語
更新済み 2026年4月16日

llm-template

2

A template for procedural template generation using JSON outputs form LLMs.

TypeScript
更新済み 2026年4月3日

AIW_webpage

2

Alice in Wonderland project and initiative webpage

不明な言語
更新済み 2026年4月3日

laion5b-subsets

2

Creating subsets from laion5b via embeddings search

Jupyter Notebook
更新済み 2025年12月2日

Open-Sci-hf

2

このリポジトリに関する説明は提供されていません。

Python
更新済み 2025年8月18日

curiosit-e

2

File server for curiosit-e content.

TypeScript
更新済み 2025年4月17日

images-for-slideshows

2

このリポジトリに関する説明は提供されていません。

不明な言語
更新済み 2025年4月4日

django-htmx-llm-streaming

2

A prototype showing how to stream using Django x htmx.

JavaScript
更新済み 2025年4月4日

crawlingathome

2

A client library for Crawling@Home's effort to filter CommonCrawl with CLIP, building a large scale image-text dataset.

Python
更新済み 2024年6月19日

school-bud-e-frontend

1

School Bud-E is an intelligent and empathetic learning assistant designed to revolutionize the educational experience.

Dart
更新済み 2026年5月27日

Admin_Bud-E

1

Admin Bud-E is a lightweight, privacy-first control center for AI chat, speech-to-text, and text-to-speech. Manage providers, routing, and costs with a simple Admin Console. Give users per-period credits, prices per model, and a shared Common Pool. EU-friendly via OpenAI-Format endpoints or our optional Google Cloud Vertex proxy.

Python
更新済み 2026年5月18日

transformers

1

🤗 Transformers: the model-definition framework for state-of-the-art machine learning models in text, vision, audio, and multimodal models, for both inference and training.

Python
更新済み 2026年4月3日

snac-to-llama3

1

このリポジトリに関する説明は提供されていません。

Jupyter Notebook
更新済み 2025年4月4日

bud-e-mobile

1

Mobile app development of all bud-e derivatives.

不明な言語
更新済み 2025年4月4日

laionbox

0

LaionBox: Fine-tuned DramaBox TTS with Multi-Auxiliary Differentiable Losses

Python
更新済み 2026年6月13日

open-sci-ref

0

このリポジトリに関する説明は提供されていません。

Python
更新済み 2026年6月12日

Voice-Acting-Pipeline

0

Self-contained DramaBox voice acting pipeline: VoiceNet taxonomy, multi-GPU prompt generation, TTS synthesis, and audio refinement

Python
更新済み 2026年6月5日

emolia-bench

0

Benchmark analysis

Python
更新済み 2026年5月13日

jax-dacvae-echotts

0

JAX/TPU training code for EchoTTS with DACVAE latent codec

Python
更新済み 2026年5月8日

tunes

0

このリポジトリに関する説明は提供されていません。

Python
更新済み 2026年5月7日

scientific-summaries

0

このリポジトリに関する説明は提供されていません。

Python
更新済み 2026年5月7日

open-clap-scaling

0

Multi-node scaling benchmarks for CLAP contrastive audio-language models on HPC clusters

Python
更新済み 2026年3月29日

vocolino

0

このリポジトリに関する説明は提供されていません。

不明な言語
更新済み 2026年3月27日

helden-bud-e-frontend

0

このリポジトリに関する説明は提供されていません。

TypeScript
更新済み 2025年9月6日

DSA-Wissen-BM25-Server

0

このリポジトリに関する説明は提供されていません。

Python
更新済み 2025年9月6日

StoryBuddy-frontend

0

このリポジトリに関する説明は提供されていません。

不明な言語
更新済み 2025年8月31日

Open-Sci-moe-hf

0

このリポジトリに関する説明は提供されていません。

不明な言語
更新済み 2025年6月11日

よくある質問

LAION-AIはGitHubで何を構築していますか?

LAION-AIは、機械学習に関連するさまざまなプロジェクトを構築しています。特に、Open-AssistantやCLAPなど、広く利用されているプロジェクトが含まれています。

LAION-AIはどのプログラミング言語を使用していますか?

LAION-AIのリポジトリでは、主にPython、Jupyter Notebook、TypeScriptなどが使用されています。これらの言語は、機械学習やデータ処理に適しています。

LAION-AIのリポジトリは公開されていますか?

はい、LAION-AIのリポジトリはすべて公開されています。これにより、他の開発者や研究者がプロジェクトを利用し、貢献することができます。

この露出は意図的ですか?

RepoGuardでLAION AIを監視し、新しい公開リポジトリが現れた瞬間に警告を受け取ります。

このアカウントを監視する