RepoGuard
Bijgewerkt 4 h ago
EleutherAI

Organization

Publieke GitHub-voetafdruk van EleutherAI

@EleutherAI
Bekijk profiel op GitHub
The Internet

182

Publieke repositories

28.707

Totaal aantal sterren

4.327

Volgers

EleutherAI heeft een uitgebreide aanwezigheid op GitHub met een breed scala aan openbare repositories. Hun werk richt zich voornamelijk op programmeertalen zoals Python, Jupyter Notebook en C++. Belangrijke repositories zoals lm-evaluation-harness en gpt-neox zijn essentieel voor de evaluatie en implementatie van taalmodellen.

Top talen

Python 53Jupyter Notebook 18C++ 2JavaScript 2Rust 1Cuda 1CMake 1

Publieke repositories

lm-evaluation-harness

12.941

A framework for few-shot evaluation of language models.

Python
Bijgewerkt 13 jun 2026

gpt-neox

7.442

An implementation of model parallel autoregressive transformers on GPUs, based on the Megatron and DeepSpeed libraries

Python
Bijgewerkt 12 jun 2026

pythia

2.818

The hub for EleutherAI's work on interpretability and learning dynamics

Jupyter Notebook
Bijgewerkt 13 jun 2026

math-lm

1.095

Geen beschrijving gegeven voor deze repository.

Python
Bijgewerkt 11 jun 2026

cookbook

844

Deep learning for dummies. All the practical details and useful utilities that go into working with real models.

Python
Bijgewerkt 11 jun 2026

sparsify

727

Sparsify transformers with SAEs and transcoders

Python
Bijgewerkt 12 jun 2026

polyglot

487

Polyglot: Large Language Models of Well-balanced Competence in Multi-languages

Onbekende taal
Bijgewerkt 11 jun 2026

vqgan-clip

353

Geen beschrijving gegeven voor deze repository.

Jupyter Notebook
Bijgewerkt 11 jun 2026

concept-erasure

255

Erasing concepts from neural representations with provable guarantees

Python
Bijgewerkt 13 jun 2026

elk

220

Keeping language models honest by directly eliciting knowledge encoded in their activations.

Python
Bijgewerkt 11 jun 2026

nanoGPT-mup

196

The simplest, fastest repository for training/finetuning medium-sized GPTs.

Python
Bijgewerkt 11 jun 2026

oslo

175

OSLO: Open Source for Large-scale Optimization

Python
Bijgewerkt 11 jun 2026

aria

106

Official repository for the paper: Scaling Self-Supervised Representation Learning for Symbolic Piano Performance (ISMIR 2025)

Python
Bijgewerkt 11 jun 2026

dps

93

Data processing system for polyglot

Python
Bijgewerkt 11 jun 2026

improved-t5

76

Experiments for efforts to train a new and improved t5

Python
Bijgewerkt 11 jun 2026

minetest

74

Minetest is an open source voxel game engine with easy modding and game creation

C++
Bijgewerkt 11 jun 2026

aria-amt

70

Efficient and robust implementation of seq-to-seq automatic piano transcription.

Python
Bijgewerkt 11 jun 2026

bergson

60

Mapping out the "memory" of neural nets with data attribution

Python
Bijgewerkt 13 jun 2026

magiCARP

58

One stop shop for all things carp

Python
Bijgewerkt 11 jun 2026

semantic-memorization

44

Geen beschrijving gegeven voor deze repository.

Jupyter Notebook
Bijgewerkt 11 jun 2026

features-across-time

41

Understanding how features learned by neural networks evolve throughout training

Python
Bijgewerkt 11 jun 2026

hae-rae

33

Geen beschrijving gegeven voor deze repository.

Onbekende taal
Bijgewerkt 11 jun 2026

rnngineering

32

Engineering the state of RNN language models (Mamba, RWKV, etc.)

Jupyter Notebook
Bijgewerkt 11 jun 2026

elk-generalization

31

Investigating the generalization behavior of LM probes trained to predict truth labels: (1) from one annotator to another, and (2) from easy questions to hard

Python
Bijgewerkt 11 jun 2026

steering-llama3

30

Geen beschrijving gegeven voor deze repository.

Python
Bijgewerkt 11 jun 2026

tokengrams

27

Efficiently computing & storing token n-grams from large corpora

Rust
Bijgewerkt 11 jun 2026

training-jacobian

24

Geen beschrijving gegeven voor deze repository.

Jupyter Notebook
Bijgewerkt 11 jun 2026

w2s

24

Geen beschrijving gegeven voor deze repository.

Python
Bijgewerkt 11 jun 2026

deep-ignorance

19

Geen beschrijving gegeven voor deze repository.

Python
Bijgewerkt 11 jun 2026

polyglot-data

19

data related codebase for polyglot project

Python
Bijgewerkt 11 jun 2026

pile_dedupe

18

Pile Deduplication Code

Python
Bijgewerkt 11 jun 2026

latent-video-diffusion

16

Latent video diffusion

Python
Bijgewerkt 11 jun 2026

NeMo

16

NeMo: a toolkit for conversational AI

Python
Bijgewerkt 11 jun 2026

attribute

15

Geen beschrijving gegeven voor deze repository.

Python
Bijgewerkt 11 jun 2026

exploring-contrastive-topology

15

Geen beschrijving gegeven voor deze repository.

Jupyter Notebook
Bijgewerkt 11 jun 2026

polyapprox

13

Closed-form polynomial approximations to neural networks

Python
Bijgewerkt 11 jun 2026

pilev2

13

Geen beschrijving gegeven voor deze repository.

Python
Bijgewerkt 11 jun 2026

lm_dataformat

11

Geen beschrijving gegeven voor deze repository.

Python
Bijgewerkt 11 jun 2026

transformer-reasoning

10

Experiments in transformer knowledge and reasoning

Jupyter Notebook
Bijgewerkt 11 jun 2026

architecture-objective

10

Geen beschrijving gegeven voor deze repository.

Python
Bijgewerkt 11 jun 2026

attention-probes

8

Linear probes with attention weighting

Python
Bijgewerkt 11 jun 2026

equinox-llama

8

Equinox implementation of llama3 and llama3.1

Python
Bijgewerkt 11 jun 2026

GPTeacher

8

A collection of modular datasets generated by GPT-4, General-Instruct - Roleplay-Instruct - Code-Instruct - and Toolformer

Onbekende taal
Bijgewerkt 11 jun 2026

minetest-baselines

8

Baseline agents for Minetest tasks.

Python
Bijgewerkt 11 jun 2026

aria-utils

6

MIDI tokenizers and pre-processing utils.

Python
Bijgewerkt 11 jun 2026

cupbearer

6

A library for mechanistic anomaly detection

Jupyter Notebook
Bijgewerkt 11 jun 2026

weak-to-strong

6

Geen beschrijving gegeven voor deze repository.

Python
Bijgewerkt 11 jun 2026

trlx

6

A repo for distributed training of language models with Reinforcement Learning via Human Feedback (RLHF)

Python
Bijgewerkt 11 jun 2026

minetest-interpretabilty-notebook

6

Jupyter notebook for the interpretablity section of the minetester blog post

Jupyter Notebook
Bijgewerkt 11 jun 2026

CodeCARP

6

Data collection pipeline for CodeCARP. Includes PyCharm plugins.

Onbekende taal
Bijgewerkt 11 jun 2026

clearnets

5

Geen beschrijving gegeven voor deze repository.

Python
Bijgewerkt 11 jun 2026

optax-galore

5

Adds GaLore style projection wrappers to optax optimizers

Python
Bijgewerkt 11 jun 2026

architecture-experiments

5

Repository to host architecture experiments and development using Paxml and Praxis

Python
Bijgewerkt 11 jun 2026

FLAN

5

Geen beschrijving gegeven voor deze repository.

Python
Bijgewerkt 11 jun 2026

thonkenizers

5

yes

Onbekende taal
Bijgewerkt 11 jun 2026

scalable-elicitation

4

The code used in "Balancing Label Quantity and Quality for Scalable Elicitation"

Jupyter Notebook
Bijgewerkt 11 jun 2026

monkfish

4

Geen beschrijving gegeven voor deze repository.

Python
Bijgewerkt 11 jun 2026

alignment-handbook

4

Robust recipes for to align language models with human and AI preferences

Onbekende taal
Bijgewerkt 11 jun 2026

Unpaired-Image-Generation

4

Project Repo for Unpaired Image Generation project

Onbekende taal
Bijgewerkt 11 jun 2026

lm-scope

4

Geen beschrijving gegeven voor deze repository.

Jupyter Notebook
Bijgewerkt 11 jun 2026

sae_overlap

3

Acompanying code for our research on SAE feature overlap when trained on different seeds.

Jupyter Notebook
Bijgewerkt 11 jun 2026

variance-across-time

3

Studying the variance in neural net predictions across training time

Python
Bijgewerkt 11 jun 2026

EvilModel

3

A replication of "EvilModel 2.0: Bringing Neural Network Models into Malware Attacks"

Onbekende taal
Bijgewerkt 11 jun 2026

eai-prompt-gallery

3

Library of interesting prompt generations

JavaScript
Bijgewerkt 11 jun 2026

gamescope

2

Can interpretability methods confer an advantage in competitive games?

Python
Bijgewerkt 11 jun 2026

fmri

2

Analogue of fMRI on artificial neural networks

Onbekende taal
Bijgewerkt 11 jun 2026

rtopk

2

https://github.com/xiexi51/RTopK PyTorch wrapper

Cuda
Bijgewerkt 11 jun 2026

pd-books

2

Geen beschrijving gegeven voor deze repository.

Jupyter Notebook
Bijgewerkt 11 jun 2026

tuned-lens

2

Tools for understanding how transformer predictions are built layer-by-layer

Python
Bijgewerkt 11 jun 2026

tinydpo

2

Geen beschrijving gegeven voor deze repository.

Onbekende taal
Bijgewerkt 11 jun 2026

eleutherai-instruct-dataset

2

A large instruct dataset for open-source models (WIP).

Onbekende taal
Bijgewerkt 11 jun 2026

examples

2

Mosaicml example benchmarks + LLM scripts

Python
Bijgewerkt 11 jun 2026

minetest_game

2

Minetest Game - The default game for the Minetest engine [https://github.com/minetest/minetest/]

Onbekende taal
Bijgewerkt 11 jun 2026

groupoid-rl

2

Geen beschrijving gegeven voor deze repository.

Jupyter Notebook
Bijgewerkt 11 jun 2026

truffaldino

1

Investigating goal instability in RL

Python
Bijgewerkt 11 jun 2026

rllm

1

Democratizing Reinforcement Learning for LLMs

Jupyter Notebook
Bijgewerkt 11 jun 2026

bayesian-adam

1

Exactly what it says on the tin

Python
Bijgewerkt 11 jun 2026

RWKV-LM

1

RWKV is an RNN with transformer-level LLM performance. It can be directly trained like a GPT (parallelizable). So it's combining the best of RNN and transformer - great performance, fast inference, saves VRAM, fast training, "infinite" ctx_len, and free sentence embedding.

Python
Bijgewerkt 11 jun 2026

conceptual-constraints

1

Applying LEACE to models during training

Jupyter Notebook
Bijgewerkt 11 jun 2026

aria.cpp

1

GGML implementation of https://github.com/EleutherAI/aria

CMake
Bijgewerkt 11 jun 2026

classifier-latent-diffusion

1

Geen beschrijving gegeven voor deze repository.

Python
Bijgewerkt 11 jun 2026

language-adaptation

1

Geen beschrijving gegeven voor deze repository.

Onbekende taal
Bijgewerkt 11 jun 2026

maxtext

1

A simple, performant and scalable Jax LLM!

Onbekende taal
Bijgewerkt 11 jun 2026

irrlicht

1

Minetest's fork of Irrlicht

C++
Bijgewerkt 11 jun 2026

lm-evaulation-ui

1

App for generating html table from LM evaluation JSONs

JavaScript
Bijgewerkt 11 jun 2026

gradient-routing

0

Geen beschrijving gegeven voor deze repository.

Python
Bijgewerkt 11 jun 2026

rh-indicators

0

Geen beschrijving gegeven voor deze repository.

Python
Bijgewerkt 11 jun 2026

hackable-bergson

0

Simplified library for mapping out the "memory" of neural nets with data attribution

Onbekende taal
Bijgewerkt 11 jun 2026

vllm

0

A high-throughput and memory-efficient inference and serving engine for LLMs

Onbekende taal
Bijgewerkt 11 jun 2026

verifiers

0

Verifiers for LLM Reinforcement Learning

Python
Bijgewerkt 11 jun 2026

wmdp

0

WMDP is a LLM proxy benchmark for hazardous knowledge in bio, cyber, and chemical security. We also release code for RMU, an unlearning method which reduces LLM performance on WMDP while retaining general capabilities.

Jupyter Notebook
Bijgewerkt 11 jun 2026

Megatron-LM

0

Ongoing research training transformer models at scale

Onbekende taal
Bijgewerkt 11 jun 2026

mixture-of-depths

0

Geen beschrijving gegeven voor deze repository.

Onbekende taal
Bijgewerkt 11 jun 2026

llm-score-behavior

0

Geen beschrijving gegeven voor deze repository.

Python
Bijgewerkt 11 jun 2026

TransformerEngine

0

A library for accelerating Transformer models on NVIDIA GPUs, including using 8-bit floating point (FP8) precision on Hopper and Ada GPUs, to provide better performance with lower memory utilization in both training and inference.

Python
Bijgewerkt 11 jun 2026

Plenoxels_FreeNerf

0

implmentation of Plenoxels radiance fields without neural networks, with free nerf strategy

Onbekende taal
Bijgewerkt 11 jun 2026

oslo-1

0

OSLO: Open Source for Large-scale Optimization

Onbekende taal
Bijgewerkt 11 jun 2026

t-zero

0

Reproduce results and replicate training fo T0 (Multitask Prompted Training Enables Zero-Shot Task Generalization)

Onbekende taal
Bijgewerkt 11 jun 2026

CommonLoopUtils

0

[WIP] a version of CLU with WandB logging added.

Jupyter Notebook
Bijgewerkt 11 jun 2026

pytorch-fid

0

Compute FID scores with PyTorch.

Onbekende taal
Bijgewerkt 11 jun 2026

Veelgestelde vragen

Wat bouwt EleutherAI op GitHub?

EleutherAI bouwt diverse projecten op GitHub, waaronder frameworks voor taalmodelevaluatie en implementaties van autoregressieve transformers. Hun repositories zijn gericht op het verbeteren van de interpretatie en leerprocessen van taalmodellen.

Welke programmeertalen gebruikt EleutherAI?

EleutherAI maakt voornamelijk gebruik van Python en Jupyter Notebook, maar ook andere talen zoals C++, JavaScript, Rust en Cuda komen in hun projecten voor. Deze talen zijn essentieel voor hun onderzoeksdoelen.

Zijn de repositories van EleutherAI openbaar?

Ja, de repositories van EleutherAI zijn openbaar toegankelijk op GitHub. Dit stelt de gemeenschap in staat om bij te dragen aan hun projecten en gebruik te maken van hun tools en frameworks voor taalmodellen.

Is deze blootstelling bedoeld?

Monitor EleutherAI met RepoGuard en krijg een waarschuwing op het moment dat er een nieuwe publieke repository verschijnt.

Monitor dit account