RepoGuard
Đã cập nhật 10 h ago
Ai2

Organization

Dấu chân GitHub công khai của Ai2

@allenai
Xem hồ sơ trên GitHub
Seattle, WA

584

Kho lưu trữ công khai

77.201

Tổng số sao

4.769

Người theo dõi

Tổ chức allenai có một sự hiện diện mạnh mẽ trên GitHub với một loạt các kho mã nguồn công khai. Họ chủ yếu sử dụng các ngôn ngữ như Python, C# và Scala, và có nhiều dự án nổi bật như allennlp, OLMo và longformer, phục vụ cho nghiên cứu và phát triển trong lĩnh vực trí tuệ nhân tạo.

Ngôn ngữ hàng đầu

Python 83Jupyter Notebook 3Scala 2Rust 2C# 1Lua 1HTML 1Java 1

Kho lưu trữ công khai

olmocr

17.387

Toolkit for linearizing PDFs for LLM datasets/training

Python
Đã cập nhật 13 thg 6, 2026

allennlp

11.892

An open-source NLP research library, built on PyTorch.

Python
Đã cập nhật 13 thg 6, 2026

OLMo

6.554

Modeling, training, eval, and inference code for OLMo

Python
Đã cập nhật 12 thg 6, 2026

open-instruct

3.752

AllenAI's post-training codebase

Python
Đã cập nhật 12 thg 6, 2026

RL4LMs

2.388

A modular RL library to fine-tune language models to human preferences

Python
Đã cập nhật 6 thg 6, 2026

longformer

2.196

Longformer: The Long-Document Transformer

Python
Đã cập nhật 5 thg 6, 2026

scispacy

1.964

A full spaCy pipeline and models for scientific/biomedical documents.

Python
Đã cập nhật 12 thg 6, 2026

ai2thor

1.739

An open-source platform for Visual AI.

C#
Đã cập nhật 11 thg 6, 2026

scibert

1.703

A BERT model for scientific text.

Python
Đã cập nhật 10 thg 6, 2026

dolma

1.508

Data and tools for generating and inspecting OLMo pre-training data.

Python
Đã cập nhật 8 thg 6, 2026

objaverse-xl

1.297

🪐 Objaverse-XL is a Universe of 10M+ 3D Objects. Contains API Scripts for Downloading and Processing!

Python
Đã cập nhật 13 thg 6, 2026

OLMo-core

1.289

PyTorch building blocks for the OLMo ecosystem

Python
Đã cập nhật 13 thg 6, 2026

s2orc

1.064

S2ORC: The Semantic Scholar Open Research Corpus: https://www.aclweb.org/anthology/2020.acl-main.447/

Python
Đã cập nhật 10 thg 6, 2026

natural-instructions

1.047

Expanding natural instructions

Python
Đã cập nhật 10 thg 6, 2026

OLMoE

1.026

OLMoE: Open Mixture-of-Experts Language Models

Jupyter Notebook
Đã cập nhật 9 thg 6, 2026

molmo

914

Code for the Molmo Vision-Language Model

Python
Đã cập nhật 11 thg 6, 2026

XNOR-Net

870

ImageNet classification using binary Convolutional Neural Networks

Lua
Đã cập nhật 9 thg 6, 2026

papermage

797

library supporting NLP and CV research on scientific papers

Python
Đã cập nhật 8 thg 6, 2026

visprog

773

Official code for VisProg (CVPR 2023 Best Paper!)

Python
Đã cập nhật 8 thg 6, 2026

scitldr

759

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python
Đã cập nhật 9 thg 6, 2026

pdffigures2

748

Given a scholarly PDF, extract figures, tables, captions, and section titles.

Scala
Đã cập nhật 7 thg 6, 2026

reward-bench

721

RewardBench: the first evaluation tool for reward models.

Python
Đã cập nhật 12 thg 6, 2026

molmo2

643

Code for the Molmo2 Vision-Language Model

Python
Đã cập nhật 12 thg 6, 2026

molmoact2

605

Official Repository for MolmoAct2

Python
Đã cập nhật 13 thg 6, 2026

specter

583

SPECTER: Document-level Representation Learning using Citation-informed Transformers

Python
Đã cập nhật 13 thg 6, 2026

WildDet3D

576

Allen Institute for AI: WildDet3D: Scaling Promptable 3D Detection in the Wild

Python
Đã cập nhật 12 thg 6, 2026

molmoweb

567

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python
Đã cập nhật 11 thg 6, 2026

allennlp-models

563

Officially supported AllenNLP models

Python
Đã cập nhật 9 thg 6, 2026

Holodeck

553

CVPR 2024: Language Guided Generation of 3D Embodied AI Environments.

Python
Đã cập nhật 6 thg 6, 2026

dont-stop-pretraining

543

Code associated with the Don't Stop Pretraining ACL 2020 paper

Python
Đã cập nhật 5 thg 6, 2026

OLMoASR

491

An open-source implementation of Whisper

Python
Đã cập nhật 3 thg 6, 2026

s2orc-doc2json

469

Parsers for scientific papers (PDF2JSON, TEX2JSON, JATS2JSON)

Python
Đã cập nhật 6 thg 6, 2026

procthor

441

🏘️ Scaling Embodied AI by Procedurally Generating Interactive 3D Houses

Python
Đã cập nhật 12 thg 6, 2026

deep_qa

403

A deep NLP library, based on Keras / tf, focused on question answering (but useful for other NLP too)

Python
Đã cập nhật 6 thg 6, 2026

allenact

382

An open source framework for research in Embodied-AI from AI2.

Python
Đã cập nhật 9 thg 6, 2026

olmes

379

Reproducible, flexible LLM evaluations

Python
Đã cập nhật 10 thg 6, 2026

molmoact

369

Official Repository for MolmoAct

Python
Đã cập nhật 12 thg 6, 2026

vla-evaluation-harness

368

One framework to evaluate any VLA model on any robot simulation benchmark.

Python
Đã cập nhật 12 thg 6, 2026

ScienceWorld

363

ScienceWorld is a text-based virtual environment centered around accomplishing tasks from the standardized elementary science curriculum.

Scala
Đã cập nhật 10 thg 6, 2026

molmospaces

358

An end-to-end open ecosystem for robot learning

Python
Đã cập nhật 12 thg 6, 2026

satlas-super-resolution

341

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python
Đã cập nhật 10 thg 6, 2026

ai2-scholarqa-lib

281

Repo housing the open sourced code for the ai2 scholar qa app and also the corresponding library

Python
Đã cập nhật 7 thg 6, 2026

satlas

280

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python
Đã cập nhật 11 thg 6, 2026

s2-folks

275

Public space for the user community of Semantic Scholar APIs to share scripts, report issues, and make suggestions.

Ngôn ngữ không xác định
Đã cập nhật 10 thg 6, 2026

scifact

263

Data and models for the SciFact verification task.

Python
Đã cập nhật 10 thg 6, 2026

WildBench

254

Benchmarking LLMs with Challenging Tasks from Real Users

Python
Đã cập nhật 8 thg 6, 2026

olmoearth_pretrain

246

Earth system foundation model data, training, and eval

Python
Đã cập nhật 12 thg 6, 2026

asta-paper-finder

244

frozen-in-time version of our Paper Finder agent for reproducing evaluation results

Python
Đã cập nhật 12 thg 6, 2026

real-toxicity-prompts

233

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Jupyter Notebook
Đã cập nhật 11 thg 6, 2026

discoveryworld

215

A virtual environment for developing and evaluating automated scientific discovery agents.

Python
Đã cập nhật 10 thg 6, 2026

hidden-networks

198

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python
Đã cập nhật 8 thg 6, 2026

autodiscovery-neurips

182

Official code for NeurIPS 2025 paper "AutoDiscovery: Open-ended Scientific Discovery via Bayesian Surprise"

Python
Đã cập nhật 4 thg 6, 2026

medicat

176

Dataset of medical images, captions, subfigure-subcaption annotations, and inline textual references

Python
Đã cập nhật 12 thg 6, 2026

pixmo-docs

163

ACL 2025: Synthetic data generation pipelines for text-rich images.

Python
Đã cập nhật 5 thg 6, 2026

discoverybench

147

Discovering Data-driven Hypotheses in the Wild

Python
Đã cập nhật 12 thg 6, 2026

SERA

146

Data generation and training repository for SERA: Soft-Verified Efficient Repository Agents.

Python
Đã cập nhật 13 thg 6, 2026

satlaspretrain_models

144

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Jupyter Notebook
Đã cập nhật 9 thg 6, 2026

IFBench

142

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python
Đã cập nhật 11 thg 6, 2026

agent-baselines

142

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python
Đã cập nhật 8 thg 6, 2026

SPECTER2

136

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python
Đã cập nhật 5 thg 6, 2026

bolmo-core

134

Code for Bolmo: Byteifying the Next Generation of Language Models

Python
Đã cập nhật 10 thg 6, 2026

wildguard

125

Open One-Stop Moderation Tools for Safety Risks, Jailbreaks, and Refusals of LLMs

Python
Đã cập nhật 12 thg 6, 2026

aokvqa

116

Official repository for the A-OKVQA dataset

Python
Đã cập nhật 5 thg 6, 2026

asta-bench

109

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python
Đã cập nhật 13 thg 6, 2026

S2AND

109

Semantic Scholar's Author Disambiguation Algorithm & Evaluation Suite

Python
Đã cập nhật 4 thg 6, 2026

infinigram-api

101

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python
Đã cập nhật 12 thg 6, 2026

DecomP

99

Repository for Decomposed Prompting

Python
Đã cập nhật 9 thg 6, 2026

robothor-challenge

99

RoboTHOR Challenge

Python
Đã cập nhật 4 thg 6, 2026

MolmoBot

90

Code and website for "MolmoB0T: Large-Scale Simulation Enables Zero-Shot Manipulation".

Python
Đã cập nhật 10 thg 6, 2026

rslearn

89

A tool for developing remote sensing datasets and models.

Python
Đã cập nhật 11 thg 6, 2026

duplodocus

85

Tooling for exact and MinHash deduplication of large-scale text datasets

Rust
Đã cập nhật 5 thg 6, 2026

olmoearth_projects

74

OlmoEarth projects

Python
Đã cập nhật 12 thg 6, 2026

codenav

69

CodeNav is an LLM agent that navigates and leverages previously unseen code repositories to solve user queries.

Python
Đã cập nhật 6 thg 6, 2026

atlantes

66

Efficient and low latency real-time global-scale GPS trajectory modeling

Python
Đã cập nhật 10 thg 6, 2026

phone2proc

63

📱👉🏠 Perform conditional procedural generation to generate houses like your own!

Python
Đã cập nhật 10 thg 6, 2026

paper-embedding-public-apis

60

Collection of public APIs for embedding scientific papers

Ngôn ngữ không xác định
Đã cập nhật 7 thg 6, 2026

ruletaker

55

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python
Đã cập nhật 7 thg 6, 2026

EMO

42

Không có mô tả nào được cung cấp cho kho lưu trữ này.

HTML
Đã cập nhật 10 thg 6, 2026

fermi

37

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python
Đã cập nhật 3 thg 6, 2026

artifact-linker

36

ArtifactLinker: Linking Scientific Artifacts for Automatic State-of-the-Art Discovery

Python
Đã cập nhật 10 thg 6, 2026

c4-documentation

33

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Ngôn ngữ không xác định
Đã cập nhật 6 thg 6, 2026

signal-and-noise

30

Measuring the Signal to Noise Ratio in Language Model Evaluation

Python
Đã cập nhật 12 thg 6, 2026

recoma

30

Reasoning by Communicating with Agents

Python
Đã cập nhật 5 thg 6, 2026

persona-bias

29

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python
Đã cập nhật 9 thg 6, 2026

natural-instructions-v1

28

Benchmarking Generalization to New Tasks from Natural Language Instructions

Python
Đã cập nhật 11 thg 6, 2026

grobid

23

A machine learning software for extracting information from scholarly documents

Java
Đã cập nhật 12 thg 6, 2026

rslearn_projects

22

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python
Đã cập nhật 9 thg 6, 2026

olmo-eval

18

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python
Đã cập nhật 13 thg 6, 2026

twentyquestions

17

A web application for playing 20 Questions to crowdsource common sense. 🤖

Python
Đã cập nhật 7 thg 6, 2026

asta-plugins

16

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python
Đã cập nhật 12 thg 6, 2026

MolmoPoint-GUISyn

15

Synthetic GUI Pointing Data Generation

Python
Đã cập nhật 6 thg 6, 2026

s6ui

12

A fast AWS S3 browser, with inspiration from s5cmd

Rust
Đã cập nhật 5 thg 6, 2026

layout-parser

5

A Python Library for Document Layout Understanding

Python
Đã cập nhật 4 thg 6, 2026

molmospaces-resources

4

Resource manager for MolmoSpaces

Python
Đã cập nhật 11 thg 6, 2026

skiff2-actions

3

GitHub actions for skiff2 repositories.

TypeScript
Đã cập nhật 8 thg 6, 2026

OlmoEarth-Feedback

2

Repo for collection of feedback on OlmoEarth

Ngôn ngữ không xác định
Đã cập nhật 5 thg 6, 2026

mujoco

2

Không có mô tả nào được cung cấp cho kho lưu trữ này.

C++
Đã cập nhật 4 thg 6, 2026

personalized-scholarqa-eval

2

Evaluation code for the paper "Language Models Don't Know What You Want: Evaluating Personalization in Deep Research Needs Real Users"

Python
Đã cập nhật 3 thg 6, 2026

molmospaces_policy_zoo

0

Policy zoo for data generation + evaluation in MolmoSpaces

Python
Đã cập nhật 12 thg 6, 2026

fairseq

0

Facebook AI Research Sequence-to-Sequence Toolkit written in Python.

Python
Đã cập nhật 3 thg 6, 2026

Câu hỏi thường gặp

allenai xây dựng gì trên GitHub?

allenai phát triển một loạt các dự án mã nguồn mở, bao gồm thư viện NLP allennlp và công cụ mô hình hóa OLMo. Những dự án này tập trung vào nghiên cứu và ứng dụng trí tuệ nhân tạo.

Ngôn ngữ lập trình nào được allenai sử dụng?

allenai chủ yếu sử dụng các ngôn ngữ lập trình như Python, Jupyter Notebook, C# và Scala cho các dự án của họ, cho phép họ phát triển các giải pháp AI đa dạng và hiệu quả.

Các kho mã nguồn của allenai có công khai không?

Có, tất cả các kho mã nguồn của allenai đều là công khai trên GitHub. Điều này cho phép cộng đồng nghiên cứu và phát triển có thể truy cập, sử dụng và đóng góp cho các dự án của họ.

Liệu việc lộ thông tin này có dự định không?

Theo dõi Ai2 với RepoGuard và nhận cảnh báo ngay khi có kho lưu trữ công khai mới xuất hiện.

Theo dõi tài khoản này