RepoGuard
已更新 10 h ago
Ai2

Organization

Ai2 的公共 GitHub 足迹

@allenai
在 GitHub 上查看个人资料
Seattle, WA

584

公共仓库

77,201

总星标

4,769

关注者

allenai是一个位于西雅图的组织,在GitHub上拥有广泛的公共存在。它的主要编程语言包括Python和C#,并发布了一系列知名的开源项目,如allennlp和ai2thor,这些项目在自然语言处理和视觉人工智能领域具有重要影响。

顶级语言

Python 83Jupyter Notebook 3Scala 2Rust 2C# 1Lua 1HTML 1Java 1

公共仓库

olmocr

17,387

Toolkit for linearizing PDFs for LLM datasets/training

Python
已更新 2026年6月13日

allennlp

11,892

An open-source NLP research library, built on PyTorch.

Python
已更新 2026年6月13日

OLMo

6,554

Modeling, training, eval, and inference code for OLMo

Python
已更新 2026年6月12日

open-instruct

3,752

AllenAI's post-training codebase

Python
已更新 2026年6月12日

RL4LMs

2,388

A modular RL library to fine-tune language models to human preferences

Python
已更新 2026年6月6日

longformer

2,196

Longformer: The Long-Document Transformer

Python
已更新 2026年6月5日

scispacy

1,964

A full spaCy pipeline and models for scientific/biomedical documents.

Python
已更新 2026年6月12日

ai2thor

1,739

An open-source platform for Visual AI.

C#
已更新 2026年6月11日

scibert

1,703

A BERT model for scientific text.

Python
已更新 2026年6月10日

dolma

1,508

Data and tools for generating and inspecting OLMo pre-training data.

Python
已更新 2026年6月8日

objaverse-xl

1,297

🪐 Objaverse-XL is a Universe of 10M+ 3D Objects. Contains API Scripts for Downloading and Processing!

Python
已更新 2026年6月13日

OLMo-core

1,289

PyTorch building blocks for the OLMo ecosystem

Python
已更新 2026年6月13日

s2orc

1,064

S2ORC: The Semantic Scholar Open Research Corpus: https://www.aclweb.org/anthology/2020.acl-main.447/

Python
已更新 2026年6月10日

natural-instructions

1,047

Expanding natural instructions

Python
已更新 2026年6月10日

OLMoE

1,026

OLMoE: Open Mixture-of-Experts Language Models

Jupyter Notebook
已更新 2026年6月9日

molmo

914

Code for the Molmo Vision-Language Model

Python
已更新 2026年6月11日

XNOR-Net

870

ImageNet classification using binary Convolutional Neural Networks

Lua
已更新 2026年6月9日

papermage

797

library supporting NLP and CV research on scientific papers

Python
已更新 2026年6月8日

visprog

773

Official code for VisProg (CVPR 2023 Best Paper!)

Python
已更新 2026年6月8日

scitldr

759

此仓库未提供描述。

Python
已更新 2026年6月9日

pdffigures2

748

Given a scholarly PDF, extract figures, tables, captions, and section titles.

Scala
已更新 2026年6月7日

reward-bench

721

RewardBench: the first evaluation tool for reward models.

Python
已更新 2026年6月12日

molmo2

643

Code for the Molmo2 Vision-Language Model

Python
已更新 2026年6月12日

molmoact2

605

Official Repository for MolmoAct2

Python
已更新 2026年6月13日

specter

583

SPECTER: Document-level Representation Learning using Citation-informed Transformers

Python
已更新 2026年6月13日

WildDet3D

576

Allen Institute for AI: WildDet3D: Scaling Promptable 3D Detection in the Wild

Python
已更新 2026年6月12日

molmoweb

567

此仓库未提供描述。

Python
已更新 2026年6月11日

allennlp-models

563

Officially supported AllenNLP models

Python
已更新 2026年6月9日

Holodeck

553

CVPR 2024: Language Guided Generation of 3D Embodied AI Environments.

Python
已更新 2026年6月6日

dont-stop-pretraining

543

Code associated with the Don't Stop Pretraining ACL 2020 paper

Python
已更新 2026年6月5日

OLMoASR

491

An open-source implementation of Whisper

Python
已更新 2026年6月3日

s2orc-doc2json

469

Parsers for scientific papers (PDF2JSON, TEX2JSON, JATS2JSON)

Python
已更新 2026年6月6日

procthor

441

🏘️ Scaling Embodied AI by Procedurally Generating Interactive 3D Houses

Python
已更新 2026年6月12日

deep_qa

403

A deep NLP library, based on Keras / tf, focused on question answering (but useful for other NLP too)

Python
已更新 2026年6月6日

allenact

382

An open source framework for research in Embodied-AI from AI2.

Python
已更新 2026年6月9日

olmes

379

Reproducible, flexible LLM evaluations

Python
已更新 2026年6月10日

molmoact

369

Official Repository for MolmoAct

Python
已更新 2026年6月12日

vla-evaluation-harness

368

One framework to evaluate any VLA model on any robot simulation benchmark.

Python
已更新 2026年6月12日

ScienceWorld

363

ScienceWorld is a text-based virtual environment centered around accomplishing tasks from the standardized elementary science curriculum.

Scala
已更新 2026年6月10日

molmospaces

358

An end-to-end open ecosystem for robot learning

Python
已更新 2026年6月12日

satlas-super-resolution

341

此仓库未提供描述。

Python
已更新 2026年6月10日

ai2-scholarqa-lib

281

Repo housing the open sourced code for the ai2 scholar qa app and also the corresponding library

Python
已更新 2026年6月7日

satlas

280

此仓库未提供描述。

Python
已更新 2026年6月11日

s2-folks

275

Public space for the user community of Semantic Scholar APIs to share scripts, report issues, and make suggestions.

未知语言
已更新 2026年6月10日

scifact

263

Data and models for the SciFact verification task.

Python
已更新 2026年6月10日

WildBench

254

Benchmarking LLMs with Challenging Tasks from Real Users

Python
已更新 2026年6月8日

olmoearth_pretrain

246

Earth system foundation model data, training, and eval

Python
已更新 2026年6月12日

asta-paper-finder

244

frozen-in-time version of our Paper Finder agent for reproducing evaluation results

Python
已更新 2026年6月12日

real-toxicity-prompts

233

此仓库未提供描述。

Jupyter Notebook
已更新 2026年6月11日

discoveryworld

215

A virtual environment for developing and evaluating automated scientific discovery agents.

Python
已更新 2026年6月10日

hidden-networks

198

此仓库未提供描述。

Python
已更新 2026年6月8日

autodiscovery-neurips

182

Official code for NeurIPS 2025 paper "AutoDiscovery: Open-ended Scientific Discovery via Bayesian Surprise"

Python
已更新 2026年6月4日

medicat

176

Dataset of medical images, captions, subfigure-subcaption annotations, and inline textual references

Python
已更新 2026年6月12日

pixmo-docs

163

ACL 2025: Synthetic data generation pipelines for text-rich images.

Python
已更新 2026年6月5日

discoverybench

147

Discovering Data-driven Hypotheses in the Wild

Python
已更新 2026年6月12日

SERA

146

Data generation and training repository for SERA: Soft-Verified Efficient Repository Agents.

Python
已更新 2026年6月13日

satlaspretrain_models

144

此仓库未提供描述。

Jupyter Notebook
已更新 2026年6月9日

IFBench

142

此仓库未提供描述。

Python
已更新 2026年6月11日

agent-baselines

142

此仓库未提供描述。

Python
已更新 2026年6月8日

SPECTER2

136

此仓库未提供描述。

Python
已更新 2026年6月5日

bolmo-core

134

Code for Bolmo: Byteifying the Next Generation of Language Models

Python
已更新 2026年6月10日

wildguard

125

Open One-Stop Moderation Tools for Safety Risks, Jailbreaks, and Refusals of LLMs

Python
已更新 2026年6月12日

aokvqa

116

Official repository for the A-OKVQA dataset

Python
已更新 2026年6月5日

asta-bench

109

此仓库未提供描述。

Python
已更新 2026年6月13日

S2AND

109

Semantic Scholar's Author Disambiguation Algorithm & Evaluation Suite

Python
已更新 2026年6月4日

infinigram-api

101

此仓库未提供描述。

Python
已更新 2026年6月12日

DecomP

99

Repository for Decomposed Prompting

Python
已更新 2026年6月9日

robothor-challenge

99

RoboTHOR Challenge

Python
已更新 2026年6月4日

MolmoBot

90

Code and website for "MolmoB0T: Large-Scale Simulation Enables Zero-Shot Manipulation".

Python
已更新 2026年6月10日

rslearn

89

A tool for developing remote sensing datasets and models.

Python
已更新 2026年6月11日

duplodocus

85

Tooling for exact and MinHash deduplication of large-scale text datasets

Rust
已更新 2026年6月5日

olmoearth_projects

74

OlmoEarth projects

Python
已更新 2026年6月12日

codenav

69

CodeNav is an LLM agent that navigates and leverages previously unseen code repositories to solve user queries.

Python
已更新 2026年6月6日

atlantes

66

Efficient and low latency real-time global-scale GPS trajectory modeling

Python
已更新 2026年6月10日

phone2proc

63

📱👉🏠 Perform conditional procedural generation to generate houses like your own!

Python
已更新 2026年6月10日

paper-embedding-public-apis

60

Collection of public APIs for embedding scientific papers

未知语言
已更新 2026年6月7日

ruletaker

55

此仓库未提供描述。

Python
已更新 2026年6月7日

EMO

42

此仓库未提供描述。

HTML
已更新 2026年6月10日

fermi

37

此仓库未提供描述。

Python
已更新 2026年6月3日

artifact-linker

36

ArtifactLinker: Linking Scientific Artifacts for Automatic State-of-the-Art Discovery

Python
已更新 2026年6月10日

c4-documentation

33

此仓库未提供描述。

未知语言
已更新 2026年6月6日

signal-and-noise

30

Measuring the Signal to Noise Ratio in Language Model Evaluation

Python
已更新 2026年6月12日

recoma

30

Reasoning by Communicating with Agents

Python
已更新 2026年6月5日

persona-bias

29

此仓库未提供描述。

Python
已更新 2026年6月9日

natural-instructions-v1

28

Benchmarking Generalization to New Tasks from Natural Language Instructions

Python
已更新 2026年6月11日

grobid

23

A machine learning software for extracting information from scholarly documents

Java
已更新 2026年6月12日

rslearn_projects

22

此仓库未提供描述。

Python
已更新 2026年6月9日

olmo-eval

18

此仓库未提供描述。

Python
已更新 2026年6月13日

twentyquestions

17

A web application for playing 20 Questions to crowdsource common sense. 🤖

Python
已更新 2026年6月7日

asta-plugins

16

此仓库未提供描述。

Python
已更新 2026年6月12日

MolmoPoint-GUISyn

15

Synthetic GUI Pointing Data Generation

Python
已更新 2026年6月6日

s6ui

12

A fast AWS S3 browser, with inspiration from s5cmd

Rust
已更新 2026年6月5日

layout-parser

5

A Python Library for Document Layout Understanding

Python
已更新 2026年6月4日

molmospaces-resources

4

Resource manager for MolmoSpaces

Python
已更新 2026年6月11日

skiff2-actions

3

GitHub actions for skiff2 repositories.

TypeScript
已更新 2026年6月8日

OlmoEarth-Feedback

2

Repo for collection of feedback on OlmoEarth

未知语言
已更新 2026年6月5日

mujoco

2

此仓库未提供描述。

C++
已更新 2026年6月4日

personalized-scholarqa-eval

2

Evaluation code for the paper "Language Models Don't Know What You Want: Evaluating Personalization in Deep Research Needs Real Users"

Python
已更新 2026年6月3日

molmospaces_policy_zoo

0

Policy zoo for data generation + evaluation in MolmoSpaces

Python
已更新 2026年6月12日

fairseq

0

Facebook AI Research Sequence-to-Sequence Toolkit written in Python.

Python
已更新 2026年6月3日

常见问题

allenai在GitHub上构建了什么?

allenai在GitHub上构建了多个开源项目,主要集中在自然语言处理和人工智能领域。其知名库包括allennlp,一个基于PyTorch的NLP研究库,以及用于视觉AI的ai2thor。

allenai使用哪些编程语言?

allenai的公共仓库主要使用Python和C#,此外还涉及Scala、Rust、Jupyter Notebook和Lua等语言。这种多样化的语言选择支持其在不同领域的项目开发。

allenai的仓库是公开的吗?

是的,allenai在GitHub上的所有仓库都是公开的。这意味着任何人都可以访问和使用这些资源,促进了开源社区的发展和合作。

这种曝光是有意的吗?

使用 RepoGuard 监控 Ai2,并在新公共仓库出现的瞬间提醒您。

监控此账户