Tài khoản GitHub công khai của Stanford NLP chứa một loạt các kho lưu trữ liên quan đến xử lý ngôn ngữ tự nhiên. Các ngôn ngữ lập trình chính được sử dụng bao gồm Python, Java, và C. Một số kho lưu trữ đáng chú ý như DSPy, CoreNLP, và stanza giúp phát triển các công cụ NLP tiên tiến.
DSPy: The framework for programming—not prompting—language models
CoreNLP: A Java suite of core NLP tools for tokenization, sentence segmentation, NER, parsing, coreference, sentiment analysis, etc.
Stanford NLP Python library for tokenization, sentence segmentation, NER, and parsing of many human languages
Software in C and data files for the popular GloVe model for distributed word representations, a.k.a. word vectors or embeddings
Course notes for CS224N Winter17
Stanford NLP Python library for Representation Finetuning (ReFT)
Tree-structured Long Short-Term Memory networks (http://arxiv.org/abs/1503.00075)
Stanford NLP Python library for understanding and improving PyTorch models via interventions
String-to-String Algorithms for Natural Language Processing
Python interface to CoreNLP using a bidirectional server-client interface.
Implementation for the paper "Compositional Attention Networks for Machine Reasoning" (Hudson and Manning, ICLR 2018)
A large-scale statistical machine translation system written in Java.
SPINN (Stack-augmented Parser-Interpreter Neural Network): fast, batchable, context-aware TreeRNNs
Stanford NLP Python library for benchmarking the utility of LLM interpretability methods
The baselines used in the CoQA paper
Framework for learning dialogue agents in a two-player game setting.
Stanford NLP group's shared Python tools.
Stanford's Alexa Prize socialbot
[Deprecated] This library has been renamed to "Stanza". Latest development at: https://github.com/stanfordnlp/stanza
Workflow-Guided Exploration: sample-efficient RL agent for web tasks
Logical structure analysis for visually structured documents
http://cs224n.stanford.edu
Không có mô tả nào được cung cấp cho kho lưu trữ này.
Model training tutorials for the Stanza Python NLP Library
Code for Relevance-guided Supervision for OpenQA with ColBERT (TACL'21)
Mapping natural language commands to web elements
Không có mô tả nào được cung cấp cho kho lưu trữ này.
A baseline system for ContractNLI (https://stanfordnlp.github.io/contract-nli/)
Semantic Parser with Execution
Code for Learning to Generate Compositional Color Descriptions
Demos for the MiniWoB++ benchmark
Python bindings for Stanford CoreNLP's protobufs.
Code for our paper Resources and Evaluations for Multi-Distribution Dense Information Retrieval
Scripts for pushing models to huggingface repos
ContractNLI: A Dataset for Document-level Natural Language Inference for Contracts
An English NER dataset built from foreign newswire
Universe: a software platform for measuring and training an AI's general intelligence across the world's supply of games, websites and other applications.
Không có mô tả nào được cung cấp cho kho lưu trữ này.
Updated version of SST
Extra hand parsed data for training models
Không có mô tả nào được cung cấp cho kho lưu trữ này.
datasets for plotting
Không có mô tả nào được cung cấp cho kho lưu trữ này.
CoQA -- A Conversational Question Answering Challenge
Web interface for the plotting project
Dataset for pdf-struct (https://github.com/stanfordnlp/pdf-struct)
A fork of ParlAI supporting Chirpy Cardinal's custom neural generator
A repository for hosting models for https://github.com/stanfordnlp/pdf-struct
A history of NLP at Stanford, initially written for the Stanford NLP 25 year reunion in 2025
A re-implementation of nndep using PyTorch.
Stanford's Alexa Prize socialbot [internal]
Sindhi tokenization data from ISRA
The repository for making new post submissions to the SAIL Blog
Không có mô tả nào được cung cấp cho kho lưu trữ này.
stanfordnlp phát triển nhiều kho lưu trữ liên quan đến xử lý ngôn ngữ tự nhiên, bao gồm các thư viện như CoreNLP và stanza, cùng với các công cụ như DSPy phục vụ cho việc lập trình mô hình ngôn ngữ.
stanfordnlp chủ yếu sử dụng các ngôn ngữ lập trình như Python, Java, C, và TeX. Điều này cho phép họ tạo ra các công cụ và thư viện hiệu quả cho nghiên cứu và ứng dụng NLP.
Tất cả các kho lưu trữ của stanfordnlp trên GitHub đều là công khai. Điều này cho phép cộng đồng tiếp cận và sử dụng các công cụ cũng như tài nguyên mà họ phát triển.
Theo dõi Stanford NLP với RepoGuard và nhận cảnh báo ngay khi có kho lưu trữ công khai mới xuất hiện.
Theo dõi tài khoản này