EleutherAI की सार्वजनिक GitHub उपस्थिति में 182 से अधिक रिपॉजिटरी शामिल हैं, जिनमें Python, Jupyter Notebook, C++, JavaScript, Rust और Cuda जैसी प्रमुख भाषाएँ उपयोग की जाती हैं। उनके प्रमुख प्रोजेक्ट्स में lm-evaluation-harness, gpt-neox, और pythia शामिल हैं, जो भाषा मॉडल के विकास और मूल्यांकन पर केंद्रित हैं।
A framework for few-shot evaluation of language models.
An implementation of model parallel autoregressive transformers on GPUs, based on the Megatron and DeepSpeed libraries
The hub for EleutherAI's work on interpretability and learning dynamics
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
Deep learning for dummies. All the practical details and useful utilities that go into working with real models.
Sparsify transformers with SAEs and transcoders
Polyglot: Large Language Models of Well-balanced Competence in Multi-languages
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
Erasing concepts from neural representations with provable guarantees
Keeping language models honest by directly eliciting knowledge encoded in their activations.
The simplest, fastest repository for training/finetuning medium-sized GPTs.
OSLO: Open Source for Large-scale Optimization
Official repository for the paper: Scaling Self-Supervised Representation Learning for Symbolic Piano Performance (ISMIR 2025)
Data processing system for polyglot
Experiments for efforts to train a new and improved t5
Minetest is an open source voxel game engine with easy modding and game creation
Efficient and robust implementation of seq-to-seq automatic piano transcription.
Mapping out the "memory" of neural nets with data attribution
One stop shop for all things carp
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
Understanding how features learned by neural networks evolve throughout training
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
Engineering the state of RNN language models (Mamba, RWKV, etc.)
Investigating the generalization behavior of LM probes trained to predict truth labels: (1) from one annotator to another, and (2) from easy questions to hard
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
Efficiently computing & storing token n-grams from large corpora
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
data related codebase for polyglot project
Pile Deduplication Code
Latent video diffusion
NeMo: a toolkit for conversational AI
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
Closed-form polynomial approximations to neural networks
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
Experiments in transformer knowledge and reasoning
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
Linear probes with attention weighting
Equinox implementation of llama3 and llama3.1
A collection of modular datasets generated by GPT-4, General-Instruct - Roleplay-Instruct - Code-Instruct - and Toolformer
Baseline agents for Minetest tasks.
MIDI tokenizers and pre-processing utils.
A library for mechanistic anomaly detection
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
A repo for distributed training of language models with Reinforcement Learning via Human Feedback (RLHF)
Jupyter notebook for the interpretablity section of the minetester blog post
Data collection pipeline for CodeCARP. Includes PyCharm plugins.
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
Adds GaLore style projection wrappers to optax optimizers
Repository to host architecture experiments and development using Paxml and Praxis
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
yes
The code used in "Balancing Label Quantity and Quality for Scalable Elicitation"
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
Robust recipes for to align language models with human and AI preferences
Project Repo for Unpaired Image Generation project
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
Acompanying code for our research on SAE feature overlap when trained on different seeds.
Studying the variance in neural net predictions across training time
A replication of "EvilModel 2.0: Bringing Neural Network Models into Malware Attacks"
Library of interesting prompt generations
Can interpretability methods confer an advantage in competitive games?
Analogue of fMRI on artificial neural networks
https://github.com/xiexi51/RTopK PyTorch wrapper
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
Tools for understanding how transformer predictions are built layer-by-layer
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
A large instruct dataset for open-source models (WIP).
Mosaicml example benchmarks + LLM scripts
Minetest Game - The default game for the Minetest engine [https://github.com/minetest/minetest/]
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
Investigating goal instability in RL
Democratizing Reinforcement Learning for LLMs
Exactly what it says on the tin
RWKV is an RNN with transformer-level LLM performance. It can be directly trained like a GPT (parallelizable). So it's combining the best of RNN and transformer - great performance, fast inference, saves VRAM, fast training, "infinite" ctx_len, and free sentence embedding.
Applying LEACE to models during training
GGML implementation of https://github.com/EleutherAI/aria
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
A simple, performant and scalable Jax LLM!
Minetest's fork of Irrlicht
App for generating html table from LM evaluation JSONs
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
Simplified library for mapping out the "memory" of neural nets with data attribution
A high-throughput and memory-efficient inference and serving engine for LLMs
Verifiers for LLM Reinforcement Learning
WMDP is a LLM proxy benchmark for hazardous knowledge in bio, cyber, and chemical security. We also release code for RMU, an unlearning method which reduces LLM performance on WMDP while retaining general capabilities.
Ongoing research training transformer models at scale
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
A library for accelerating Transformer models on NVIDIA GPUs, including using 8-bit floating point (FP8) precision on Hopper and Ada GPUs, to provide better performance with lower memory utilization in both training and inference.
implmentation of Plenoxels radiance fields without neural networks, with free nerf strategy
OSLO: Open Source for Large-scale Optimization
Reproduce results and replicate training fo T0 (Multitask Prompted Training Enables Zero-Shot Task Generalization)
[WIP] a version of CLU with WandB logging added.
Compute FID scores with PyTorch.
EleutherAI GitHub पर विभिन्न प्रकार के प्रोजेक्ट्स बनाती है, विशेष रूप से भाषा मॉडल और उनके मूल्यांकन के लिए। उनके प्रमुख प्रोजेक्ट्स में lm-evaluation-harness और gpt-neox शामिल हैं।
EleutherAI मुख्य रूप से Python, Jupyter Notebook, C++, JavaScript, Rust और Cuda जैसी प्रोग्रामिंग भाषाएँ उपयोग करती है। ये भाषाएँ उनके प्रोजेक्ट्स के विकास में महत्वपूर्ण भूमिका निभाती हैं।
हाँ, EleutherAI की सभी रिपॉजिटरी सार्वजनिक हैं। यह उपयोगकर्ताओं को उनके प्रोजेक्ट्स, कोड और विकास प्रक्रियाओं तक पहुँच प्रदान करती हैं, जिससे समुदाय के सदस्यों को सहयोग और योगदान करने का अवसर मिलता है।
RepoGuard के साथ EleutherAI की निगरानी करें और जैसे ही एक नया सार्वजनिक रिपोजिटरी बनता है, सूचित हों।
इस खाते की निगरानी करें