Đã cập nhật 4 h ago

Organization

Dấu chân GitHub công khai của EleutherAI

@EleutherAI

Xem hồ sơ trên GitHub

The Internet

182

Kho lưu trữ công khai

28.707

Tổng số sao

4.327

Người theo dõi

EleutherAI là một tổ chức nổi bật trên GitHub với một loạt các kho mã nguồn công khai. Tổ chức này chủ yếu sử dụng các ngôn ngữ như Python, Jupyter Notebook và C++. Một số kho nổi bật bao gồm lm-evaluation-harness và gpt-neox, tập trung vào các mô hình ngôn ngữ và học sâu.

Ngôn ngữ hàng đầu

Python 53Jupyter Notebook 18C++ 2JavaScript 2Rust 1Cuda 1CMake 1

Kho lưu trữ công khai

lm-evaluation-harness

★12.941

A framework for few-shot evaluation of language models.

Python

Đã cập nhật 13 thg 6, 2026

gpt-neox

★7.442

An implementation of model parallel autoregressive transformers on GPUs, based on the Megatron and DeepSpeed libraries

Python

Đã cập nhật 12 thg 6, 2026

pythia

★2.818

The hub for EleutherAI's work on interpretability and learning dynamics

Jupyter Notebook

Đã cập nhật 13 thg 6, 2026

math-lm

★1.095

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python

Đã cập nhật 11 thg 6, 2026

cookbook

★844

Deep learning for dummies. All the practical details and useful utilities that go into working with real models.

Python

Đã cập nhật 11 thg 6, 2026

sparsify

★727

Sparsify transformers with SAEs and transcoders

Python

Đã cập nhật 12 thg 6, 2026

polyglot

★487

Polyglot: Large Language Models of Well-balanced Competence in Multi-languages

Ngôn ngữ không xác định

Đã cập nhật 11 thg 6, 2026

vqgan-clip

★353

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Jupyter Notebook

Đã cập nhật 11 thg 6, 2026

concept-erasure

★255

Erasing concepts from neural representations with provable guarantees

Python

Đã cập nhật 13 thg 6, 2026

elk

★220

Keeping language models honest by directly eliciting knowledge encoded in their activations.

Python

Đã cập nhật 11 thg 6, 2026

nanoGPT-mup

★196

The simplest, fastest repository for training/finetuning medium-sized GPTs.

Python

Đã cập nhật 11 thg 6, 2026

oslo

★175

OSLO: Open Source for Large-scale Optimization

Python

Đã cập nhật 11 thg 6, 2026

aria

★106

Official repository for the paper: Scaling Self-Supervised Representation Learning for Symbolic Piano Performance (ISMIR 2025)

Python

Đã cập nhật 11 thg 6, 2026

dps

★93

Data processing system for polyglot

Python

Đã cập nhật 11 thg 6, 2026

improved-t5

★76

Experiments for efforts to train a new and improved t5

Python

Đã cập nhật 11 thg 6, 2026

minetest

★74

Minetest is an open source voxel game engine with easy modding and game creation

C++

Đã cập nhật 11 thg 6, 2026

aria-amt

★70

Efficient and robust implementation of seq-to-seq automatic piano transcription.

Python

Đã cập nhật 11 thg 6, 2026

bergson

★60

Mapping out the "memory" of neural nets with data attribution

Python

Đã cập nhật 13 thg 6, 2026

magiCARP

★58

One stop shop for all things carp

Python

Đã cập nhật 11 thg 6, 2026

semantic-memorization

★44

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Jupyter Notebook

Đã cập nhật 11 thg 6, 2026

features-across-time

★41

Understanding how features learned by neural networks evolve throughout training

Python

Đã cập nhật 11 thg 6, 2026

hae-rae

★33

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Ngôn ngữ không xác định

Đã cập nhật 11 thg 6, 2026

rnngineering

★32

Engineering the state of RNN language models (Mamba, RWKV, etc.)

Jupyter Notebook

Đã cập nhật 11 thg 6, 2026

elk-generalization

★31

Investigating the generalization behavior of LM probes trained to predict truth labels: (1) from one annotator to another, and (2) from easy questions to hard

Python

Đã cập nhật 11 thg 6, 2026

steering-llama3

★30

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python

Đã cập nhật 11 thg 6, 2026

tokengrams

★27

Efficiently computing & storing token n-grams from large corpora

Rust

Đã cập nhật 11 thg 6, 2026

training-jacobian

★24

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Jupyter Notebook

Đã cập nhật 11 thg 6, 2026

w2s

★24

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python

Đã cập nhật 11 thg 6, 2026

deep-ignorance

★19

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python

Đã cập nhật 11 thg 6, 2026

polyglot-data

★19

data related codebase for polyglot project

Python

Đã cập nhật 11 thg 6, 2026

pile_dedupe

★18

Pile Deduplication Code

Python

Đã cập nhật 11 thg 6, 2026

latent-video-diffusion

★16

Latent video diffusion

Python

Đã cập nhật 11 thg 6, 2026

NeMo

★16

NeMo: a toolkit for conversational AI

Python

Đã cập nhật 11 thg 6, 2026

attribute

★15

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python

Đã cập nhật 11 thg 6, 2026

exploring-contrastive-topology

★15

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Jupyter Notebook

Đã cập nhật 11 thg 6, 2026

polyapprox

★13

Closed-form polynomial approximations to neural networks

Python

Đã cập nhật 11 thg 6, 2026

pilev2

★13

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python

Đã cập nhật 11 thg 6, 2026

lm_dataformat

★11

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python

Đã cập nhật 11 thg 6, 2026

transformer-reasoning

★10

Experiments in transformer knowledge and reasoning

Jupyter Notebook

Đã cập nhật 11 thg 6, 2026

architecture-objective

★10

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python

Đã cập nhật 11 thg 6, 2026

attention-probes

★8

Linear probes with attention weighting

Python

Đã cập nhật 11 thg 6, 2026

equinox-llama

★8

Equinox implementation of llama3 and llama3.1

Python

Đã cập nhật 11 thg 6, 2026

GPTeacher

★8

A collection of modular datasets generated by GPT-4, General-Instruct - Roleplay-Instruct - Code-Instruct - and Toolformer

Ngôn ngữ không xác định

Đã cập nhật 11 thg 6, 2026

minetest-baselines

★8

Baseline agents for Minetest tasks.

Python

Đã cập nhật 11 thg 6, 2026

aria-utils

★6

MIDI tokenizers and pre-processing utils.

Python

Đã cập nhật 11 thg 6, 2026

cupbearer

★6

A library for mechanistic anomaly detection

Jupyter Notebook

Đã cập nhật 11 thg 6, 2026

weak-to-strong

★6

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python

Đã cập nhật 11 thg 6, 2026

trlx

★6

A repo for distributed training of language models with Reinforcement Learning via Human Feedback (RLHF)

Python

Đã cập nhật 11 thg 6, 2026

minetest-interpretabilty-notebook

★6

Jupyter notebook for the interpretablity section of the minetester blog post

Jupyter Notebook

Đã cập nhật 11 thg 6, 2026

CodeCARP

★6

Data collection pipeline for CodeCARP. Includes PyCharm plugins.

Ngôn ngữ không xác định

Đã cập nhật 11 thg 6, 2026

clearnets

★5

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python

Đã cập nhật 11 thg 6, 2026

optax-galore

★5

Adds GaLore style projection wrappers to optax optimizers

Python

Đã cập nhật 11 thg 6, 2026

architecture-experiments

★5

Repository to host architecture experiments and development using Paxml and Praxis

Python

Đã cập nhật 11 thg 6, 2026

FLAN

★5

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python

Đã cập nhật 11 thg 6, 2026

thonkenizers

★5

yes

Ngôn ngữ không xác định

Đã cập nhật 11 thg 6, 2026

scalable-elicitation

★4

The code used in "Balancing Label Quantity and Quality for Scalable Elicitation"

Jupyter Notebook

Đã cập nhật 11 thg 6, 2026

monkfish

★4

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python

Đã cập nhật 11 thg 6, 2026

alignment-handbook

★4

Robust recipes for to align language models with human and AI preferences

Ngôn ngữ không xác định

Đã cập nhật 11 thg 6, 2026

Unpaired-Image-Generation

★4

Project Repo for Unpaired Image Generation project

Ngôn ngữ không xác định

Đã cập nhật 11 thg 6, 2026

lm-scope

★4

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Jupyter Notebook

Đã cập nhật 11 thg 6, 2026

sae_overlap

★3

Acompanying code for our research on SAE feature overlap when trained on different seeds.

Jupyter Notebook

Đã cập nhật 11 thg 6, 2026

variance-across-time

★3

Studying the variance in neural net predictions across training time

Python

Đã cập nhật 11 thg 6, 2026

EvilModel

★3

A replication of "EvilModel 2.0: Bringing Neural Network Models into Malware Attacks"

Ngôn ngữ không xác định

Đã cập nhật 11 thg 6, 2026

eai-prompt-gallery

★3

Library of interesting prompt generations

JavaScript

Đã cập nhật 11 thg 6, 2026

gamescope

★2

Can interpretability methods confer an advantage in competitive games?

Python

Đã cập nhật 11 thg 6, 2026

fmri

★2

Analogue of fMRI on artificial neural networks

Ngôn ngữ không xác định

Đã cập nhật 11 thg 6, 2026

rtopk

★2

https://github.com/xiexi51/RTopK PyTorch wrapper

Cuda

Đã cập nhật 11 thg 6, 2026

pd-books

★2

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Jupyter Notebook

Đã cập nhật 11 thg 6, 2026

tuned-lens

★2

Tools for understanding how transformer predictions are built layer-by-layer

Python

Đã cập nhật 11 thg 6, 2026

tinydpo

★2

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Ngôn ngữ không xác định

Đã cập nhật 11 thg 6, 2026

eleutherai-instruct-dataset

★2

A large instruct dataset for open-source models (WIP).

Ngôn ngữ không xác định

Đã cập nhật 11 thg 6, 2026

examples

★2

Mosaicml example benchmarks + LLM scripts

Python

Đã cập nhật 11 thg 6, 2026

minetest_game

★2

Minetest Game - The default game for the Minetest engine [https://github.com/minetest/minetest/]

Ngôn ngữ không xác định

Đã cập nhật 11 thg 6, 2026

groupoid-rl

★2

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Jupyter Notebook

Đã cập nhật 11 thg 6, 2026

truffaldino

★1

Investigating goal instability in RL

Python

Đã cập nhật 11 thg 6, 2026

rllm

★1

Democratizing Reinforcement Learning for LLMs

Jupyter Notebook

Đã cập nhật 11 thg 6, 2026

bayesian-adam

★1

Exactly what it says on the tin

Python

Đã cập nhật 11 thg 6, 2026

RWKV-LM

★1

RWKV is an RNN with transformer-level LLM performance. It can be directly trained like a GPT (parallelizable). So it's combining the best of RNN and transformer - great performance, fast inference, saves VRAM, fast training, "infinite" ctx_len, and free sentence embedding.

Python

Đã cập nhật 11 thg 6, 2026

conceptual-constraints

★1

Applying LEACE to models during training

Jupyter Notebook

Đã cập nhật 11 thg 6, 2026

aria.cpp

★1

GGML implementation of https://github.com/EleutherAI/aria

CMake

Đã cập nhật 11 thg 6, 2026

classifier-latent-diffusion

★1

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python

Đã cập nhật 11 thg 6, 2026

language-adaptation

★1

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Ngôn ngữ không xác định

Đã cập nhật 11 thg 6, 2026

maxtext

★1

A simple, performant and scalable Jax LLM!

Ngôn ngữ không xác định

Đã cập nhật 11 thg 6, 2026

irrlicht

★1

Minetest's fork of Irrlicht

C++

Đã cập nhật 11 thg 6, 2026

lm-evaulation-ui

★1

App for generating html table from LM evaluation JSONs

JavaScript

Đã cập nhật 11 thg 6, 2026

gradient-routing

★0

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python

Đã cập nhật 11 thg 6, 2026

rh-indicators

★0

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python

Đã cập nhật 11 thg 6, 2026

hackable-bergson

★0

Simplified library for mapping out the "memory" of neural nets with data attribution

Ngôn ngữ không xác định

Đã cập nhật 11 thg 6, 2026

vllm

★0

A high-throughput and memory-efficient inference and serving engine for LLMs

Ngôn ngữ không xác định

Đã cập nhật 11 thg 6, 2026

verifiers

★0

Verifiers for LLM Reinforcement Learning

Python

Đã cập nhật 11 thg 6, 2026

wmdp

★0

WMDP is a LLM proxy benchmark for hazardous knowledge in bio, cyber, and chemical security. We also release code for RMU, an unlearning method which reduces LLM performance on WMDP while retaining general capabilities.

Jupyter Notebook

Đã cập nhật 11 thg 6, 2026

Megatron-LM

★0

Ongoing research training transformer models at scale

Ngôn ngữ không xác định

Đã cập nhật 11 thg 6, 2026

mixture-of-depths

★0

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Ngôn ngữ không xác định

Đã cập nhật 11 thg 6, 2026

llm-score-behavior

★0

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python

Đã cập nhật 11 thg 6, 2026

TransformerEngine

★0

A library for accelerating Transformer models on NVIDIA GPUs, including using 8-bit floating point (FP8) precision on Hopper and Ada GPUs, to provide better performance with lower memory utilization in both training and inference.

Python

Đã cập nhật 11 thg 6, 2026

Plenoxels_FreeNerf

★0

implmentation of Plenoxels radiance fields without neural networks, with free nerf strategy

Ngôn ngữ không xác định

Đã cập nhật 11 thg 6, 2026

oslo-1

★0

OSLO: Open Source for Large-scale Optimization

Ngôn ngữ không xác định

Đã cập nhật 11 thg 6, 2026

t-zero

★0

Reproduce results and replicate training fo T0 (Multitask Prompted Training Enables Zero-Shot Task Generalization)

Ngôn ngữ không xác định

Đã cập nhật 11 thg 6, 2026

CommonLoopUtils

★0

[WIP] a version of CLU with WandB logging added.

Jupyter Notebook

Đã cập nhật 11 thg 6, 2026

pytorch-fid

★0

Compute FID scores with PyTorch.

Ngôn ngữ không xác định

Đã cập nhật 11 thg 6, 2026

Câu hỏi thường gặp

EleutherAI xây dựng những gì trên GitHub?

EleutherAI xây dựng nhiều dự án liên quan đến mô hình ngôn ngữ và học sâu. Các kho lưu trữ nổi bật bao gồm lm-evaluation-harness và gpt-neox, tập trung vào việc phát triển và đánh giá các mô hình ngôn ngữ hiện đại.

EleutherAI sử dụng những ngôn ngữ lập trình nào?

EleutherAI chủ yếu sử dụng các ngôn ngữ lập trình như Python, Jupyter Notebook, C++, JavaScript, Rust và Cuda. Những ngôn ngữ này cho phép họ phát triển các ứng dụng phức tạp và mô hình học sâu.

Các kho lưu trữ của EleutherAI có công khai không?

Có, tất cả các kho lưu trữ của EleutherAI đều là công khai trên GitHub. Điều này cho phép cộng đồng truy cập và đóng góp vào các dự án nghiên cứu về mô hình ngôn ngữ và học sâu.

Liệu việc lộ thông tin này có dự định không?

Theo dõi EleutherAI với RepoGuard và nhận cảnh báo ngay khi có kho lưu trữ công khai mới xuất hiện.

Theo dõi tài khoản này