RepoGuard
Обновлено 10 h ago
Ai2

Organization

Публичный след на GitHub Ai2

@allenai
Просмотреть профиль на GitHub
Seattle, WA

584

Публичные репозитории

77 201

Всего звезд

4 769

Подписчики

Организация allenai имеет значительное присутствие на GitHub, предлагая широкий спектр репозиториев, включая такие проекты, как olmocr и allennlp. Основные языки программирования, используемые в их репозиториях, включают Python, C# и Scala, что подчеркивает их фокус на разработке инструментов для обработки естественного языка и визуального ИИ.

Основные языки

Python 83Jupyter Notebook 3Scala 2Rust 2C# 1Lua 1HTML 1Java 1

Публичные репозитории

olmocr

17 387

Toolkit for linearizing PDFs for LLM datasets/training

Python
Обновлено 13 июн. 2026 г.

allennlp

11 892

An open-source NLP research library, built on PyTorch.

Python
Обновлено 13 июн. 2026 г.

OLMo

6 554

Modeling, training, eval, and inference code for OLMo

Python
Обновлено 12 июн. 2026 г.

open-instruct

3 752

AllenAI's post-training codebase

Python
Обновлено 12 июн. 2026 г.

RL4LMs

2 388

A modular RL library to fine-tune language models to human preferences

Python
Обновлено 6 июн. 2026 г.

longformer

2 196

Longformer: The Long-Document Transformer

Python
Обновлено 5 июн. 2026 г.

scispacy

1 964

A full spaCy pipeline and models for scientific/biomedical documents.

Python
Обновлено 12 июн. 2026 г.

ai2thor

1 739

An open-source platform for Visual AI.

C#
Обновлено 11 июн. 2026 г.

scibert

1 703

A BERT model for scientific text.

Python
Обновлено 10 июн. 2026 г.

dolma

1 508

Data and tools for generating and inspecting OLMo pre-training data.

Python
Обновлено 8 июн. 2026 г.

objaverse-xl

1 297

🪐 Objaverse-XL is a Universe of 10M+ 3D Objects. Contains API Scripts for Downloading and Processing!

Python
Обновлено 13 июн. 2026 г.

OLMo-core

1 289

PyTorch building blocks for the OLMo ecosystem

Python
Обновлено 13 июн. 2026 г.

s2orc

1 064

S2ORC: The Semantic Scholar Open Research Corpus: https://www.aclweb.org/anthology/2020.acl-main.447/

Python
Обновлено 10 июн. 2026 г.

natural-instructions

1 047

Expanding natural instructions

Python
Обновлено 10 июн. 2026 г.

OLMoE

1 026

OLMoE: Open Mixture-of-Experts Language Models

Jupyter Notebook
Обновлено 9 июн. 2026 г.

molmo

914

Code for the Molmo Vision-Language Model

Python
Обновлено 11 июн. 2026 г.

XNOR-Net

870

ImageNet classification using binary Convolutional Neural Networks

Lua
Обновлено 9 июн. 2026 г.

papermage

797

library supporting NLP and CV research on scientific papers

Python
Обновлено 8 июн. 2026 г.

visprog

773

Official code for VisProg (CVPR 2023 Best Paper!)

Python
Обновлено 8 июн. 2026 г.

scitldr

759

Описание для этого репозитория не предоставлено.

Python
Обновлено 9 июн. 2026 г.

pdffigures2

748

Given a scholarly PDF, extract figures, tables, captions, and section titles.

Scala
Обновлено 7 июн. 2026 г.

reward-bench

721

RewardBench: the first evaluation tool for reward models.

Python
Обновлено 12 июн. 2026 г.

molmo2

643

Code for the Molmo2 Vision-Language Model

Python
Обновлено 12 июн. 2026 г.

molmoact2

605

Official Repository for MolmoAct2

Python
Обновлено 13 июн. 2026 г.

specter

583

SPECTER: Document-level Representation Learning using Citation-informed Transformers

Python
Обновлено 13 июн. 2026 г.

WildDet3D

576

Allen Institute for AI: WildDet3D: Scaling Promptable 3D Detection in the Wild

Python
Обновлено 12 июн. 2026 г.

molmoweb

567

Описание для этого репозитория не предоставлено.

Python
Обновлено 11 июн. 2026 г.

allennlp-models

563

Officially supported AllenNLP models

Python
Обновлено 9 июн. 2026 г.

Holodeck

553

CVPR 2024: Language Guided Generation of 3D Embodied AI Environments.

Python
Обновлено 6 июн. 2026 г.

dont-stop-pretraining

543

Code associated with the Don't Stop Pretraining ACL 2020 paper

Python
Обновлено 5 июн. 2026 г.

OLMoASR

491

An open-source implementation of Whisper

Python
Обновлено 3 июн. 2026 г.

s2orc-doc2json

469

Parsers for scientific papers (PDF2JSON, TEX2JSON, JATS2JSON)

Python
Обновлено 6 июн. 2026 г.

procthor

441

🏘️ Scaling Embodied AI by Procedurally Generating Interactive 3D Houses

Python
Обновлено 12 июн. 2026 г.

deep_qa

403

A deep NLP library, based on Keras / tf, focused on question answering (but useful for other NLP too)

Python
Обновлено 6 июн. 2026 г.

allenact

382

An open source framework for research in Embodied-AI from AI2.

Python
Обновлено 9 июн. 2026 г.

olmes

379

Reproducible, flexible LLM evaluations

Python
Обновлено 10 июн. 2026 г.

molmoact

369

Official Repository for MolmoAct

Python
Обновлено 12 июн. 2026 г.

vla-evaluation-harness

368

One framework to evaluate any VLA model on any robot simulation benchmark.

Python
Обновлено 12 июн. 2026 г.

ScienceWorld

363

ScienceWorld is a text-based virtual environment centered around accomplishing tasks from the standardized elementary science curriculum.

Scala
Обновлено 10 июн. 2026 г.

molmospaces

358

An end-to-end open ecosystem for robot learning

Python
Обновлено 12 июн. 2026 г.

satlas-super-resolution

341

Описание для этого репозитория не предоставлено.

Python
Обновлено 10 июн. 2026 г.

ai2-scholarqa-lib

281

Repo housing the open sourced code for the ai2 scholar qa app and also the corresponding library

Python
Обновлено 7 июн. 2026 г.

satlas

280

Описание для этого репозитория не предоставлено.

Python
Обновлено 11 июн. 2026 г.

s2-folks

275

Public space for the user community of Semantic Scholar APIs to share scripts, report issues, and make suggestions.

Неизвестный язык
Обновлено 10 июн. 2026 г.

scifact

263

Data and models for the SciFact verification task.

Python
Обновлено 10 июн. 2026 г.

WildBench

254

Benchmarking LLMs with Challenging Tasks from Real Users

Python
Обновлено 8 июн. 2026 г.

olmoearth_pretrain

246

Earth system foundation model data, training, and eval

Python
Обновлено 12 июн. 2026 г.

asta-paper-finder

244

frozen-in-time version of our Paper Finder agent for reproducing evaluation results

Python
Обновлено 12 июн. 2026 г.

real-toxicity-prompts

233

Описание для этого репозитория не предоставлено.

Jupyter Notebook
Обновлено 11 июн. 2026 г.

discoveryworld

215

A virtual environment for developing and evaluating automated scientific discovery agents.

Python
Обновлено 10 июн. 2026 г.

hidden-networks

198

Описание для этого репозитория не предоставлено.

Python
Обновлено 8 июн. 2026 г.

autodiscovery-neurips

182

Official code for NeurIPS 2025 paper "AutoDiscovery: Open-ended Scientific Discovery via Bayesian Surprise"

Python
Обновлено 4 июн. 2026 г.

medicat

176

Dataset of medical images, captions, subfigure-subcaption annotations, and inline textual references

Python
Обновлено 12 июн. 2026 г.

pixmo-docs

163

ACL 2025: Synthetic data generation pipelines for text-rich images.

Python
Обновлено 5 июн. 2026 г.

discoverybench

147

Discovering Data-driven Hypotheses in the Wild

Python
Обновлено 12 июн. 2026 г.

SERA

146

Data generation and training repository for SERA: Soft-Verified Efficient Repository Agents.

Python
Обновлено 13 июн. 2026 г.

satlaspretrain_models

144

Описание для этого репозитория не предоставлено.

Jupyter Notebook
Обновлено 9 июн. 2026 г.

IFBench

142

Описание для этого репозитория не предоставлено.

Python
Обновлено 11 июн. 2026 г.

agent-baselines

142

Описание для этого репозитория не предоставлено.

Python
Обновлено 8 июн. 2026 г.

SPECTER2

136

Описание для этого репозитория не предоставлено.

Python
Обновлено 5 июн. 2026 г.

bolmo-core

134

Code for Bolmo: Byteifying the Next Generation of Language Models

Python
Обновлено 10 июн. 2026 г.

wildguard

125

Open One-Stop Moderation Tools for Safety Risks, Jailbreaks, and Refusals of LLMs

Python
Обновлено 12 июн. 2026 г.

aokvqa

116

Official repository for the A-OKVQA dataset

Python
Обновлено 5 июн. 2026 г.

asta-bench

109

Описание для этого репозитория не предоставлено.

Python
Обновлено 13 июн. 2026 г.

S2AND

109

Semantic Scholar's Author Disambiguation Algorithm & Evaluation Suite

Python
Обновлено 4 июн. 2026 г.

infinigram-api

101

Описание для этого репозитория не предоставлено.

Python
Обновлено 12 июн. 2026 г.

DecomP

99

Repository for Decomposed Prompting

Python
Обновлено 9 июн. 2026 г.

robothor-challenge

99

RoboTHOR Challenge

Python
Обновлено 4 июн. 2026 г.

MolmoBot

90

Code and website for "MolmoB0T: Large-Scale Simulation Enables Zero-Shot Manipulation".

Python
Обновлено 10 июн. 2026 г.

rslearn

89

A tool for developing remote sensing datasets and models.

Python
Обновлено 11 июн. 2026 г.

duplodocus

85

Tooling for exact and MinHash deduplication of large-scale text datasets

Rust
Обновлено 5 июн. 2026 г.

olmoearth_projects

74

OlmoEarth projects

Python
Обновлено 12 июн. 2026 г.

codenav

69

CodeNav is an LLM agent that navigates and leverages previously unseen code repositories to solve user queries.

Python
Обновлено 6 июн. 2026 г.

atlantes

66

Efficient and low latency real-time global-scale GPS trajectory modeling

Python
Обновлено 10 июн. 2026 г.

phone2proc

63

📱👉🏠 Perform conditional procedural generation to generate houses like your own!

Python
Обновлено 10 июн. 2026 г.

paper-embedding-public-apis

60

Collection of public APIs for embedding scientific papers

Неизвестный язык
Обновлено 7 июн. 2026 г.

ruletaker

55

Описание для этого репозитория не предоставлено.

Python
Обновлено 7 июн. 2026 г.

EMO

42

Описание для этого репозитория не предоставлено.

HTML
Обновлено 10 июн. 2026 г.

fermi

37

Описание для этого репозитория не предоставлено.

Python
Обновлено 3 июн. 2026 г.

artifact-linker

36

ArtifactLinker: Linking Scientific Artifacts for Automatic State-of-the-Art Discovery

Python
Обновлено 10 июн. 2026 г.

c4-documentation

33

Описание для этого репозитория не предоставлено.

Неизвестный язык
Обновлено 6 июн. 2026 г.

signal-and-noise

30

Measuring the Signal to Noise Ratio in Language Model Evaluation

Python
Обновлено 12 июн. 2026 г.

recoma

30

Reasoning by Communicating with Agents

Python
Обновлено 5 июн. 2026 г.

persona-bias

29

Описание для этого репозитория не предоставлено.

Python
Обновлено 9 июн. 2026 г.

natural-instructions-v1

28

Benchmarking Generalization to New Tasks from Natural Language Instructions

Python
Обновлено 11 июн. 2026 г.

grobid

23

A machine learning software for extracting information from scholarly documents

Java
Обновлено 12 июн. 2026 г.

rslearn_projects

22

Описание для этого репозитория не предоставлено.

Python
Обновлено 9 июн. 2026 г.

olmo-eval

18

Описание для этого репозитория не предоставлено.

Python
Обновлено 13 июн. 2026 г.

twentyquestions

17

A web application for playing 20 Questions to crowdsource common sense. 🤖

Python
Обновлено 7 июн. 2026 г.

asta-plugins

16

Описание для этого репозитория не предоставлено.

Python
Обновлено 12 июн. 2026 г.

MolmoPoint-GUISyn

15

Synthetic GUI Pointing Data Generation

Python
Обновлено 6 июн. 2026 г.

s6ui

12

A fast AWS S3 browser, with inspiration from s5cmd

Rust
Обновлено 5 июн. 2026 г.

layout-parser

5

A Python Library for Document Layout Understanding

Python
Обновлено 4 июн. 2026 г.

molmospaces-resources

4

Resource manager for MolmoSpaces

Python
Обновлено 11 июн. 2026 г.

skiff2-actions

3

GitHub actions for skiff2 repositories.

TypeScript
Обновлено 8 июн. 2026 г.

OlmoEarth-Feedback

2

Repo for collection of feedback on OlmoEarth

Неизвестный язык
Обновлено 5 июн. 2026 г.

mujoco

2

Описание для этого репозитория не предоставлено.

C++
Обновлено 4 июн. 2026 г.

personalized-scholarqa-eval

2

Evaluation code for the paper "Language Models Don't Know What You Want: Evaluating Personalization in Deep Research Needs Real Users"

Python
Обновлено 3 июн. 2026 г.

molmospaces_policy_zoo

0

Policy zoo for data generation + evaluation in MolmoSpaces

Python
Обновлено 12 июн. 2026 г.

fairseq

0

Facebook AI Research Sequence-to-Sequence Toolkit written in Python.

Python
Обновлено 3 июн. 2026 г.

Часто задаваемые вопросы

Что создает allenai на GitHub?

allenai разрабатывает репозитории, связанные с обработкой естественного языка и искусственным интеллектом. Их проекты включают библиотеки, такие как allennlp и OLMo, предназначенные для исследований и обучения ИИ.

Какие языки программирования использует allenai?

Основные языки программирования, используемые allenai, включают Python, C#, Scala и Rust. Эти языки поддерживают их разработки в области NLP и визуального ИИ, предоставляя разнообразные инструменты и библиотеки.

Являются ли репозитории allenai публичными?

Да, все репозитории allenai на GitHub являются публичными. Это позволяет разработчикам и исследователям по всему миру использовать и вносить вклад в их проекты, такие как longformer и scispacy.

Это раскрытие намеренно?

Следите за Ai2 с помощью RepoGuard и получайте уведомления в момент появления нового публичного репозитория.

Следить за этим аккаунтом