RepoGuard
Обновлено 10 h ago
THUNLP

Organization

Публичный след на GitHub THUNLP

@thunlp
Просмотреть профиль на GitHub

Natural Language Processing Lab at Tsinghua University

FIT Building, Tsinghua University, Beijing

269

Публичные репозитории

83 916

Всего звезд

3 402

Подписчики

Организация THUNLP, расположенная в Университете Цинхуа, активно использует GitHub для разработки в области обработки естественного языка. В её репозиториях представлены проекты на языках Python, C++, TeX и JavaScript, включая такие заметные работы, как GNNPapers и OpenPrompt.

Основные языки

Python 74C++ 4TeX 3Java 2JavaScript 1HTML 1C 1TypeScript 1

Публичные репозитории

GNNPapers

16 792

Must-read papers on graph neural networks (GNN)

Неизвестный язык
Обновлено 13 июн. 2026 г.

WantWords

7 109

An open-source online reverse dictionary.

JavaScript
Обновлено 12 июн. 2026 г.

OpenPrompt

4 877

An Open-Source Framework for Prompt-Learning.

Python
Обновлено 11 июн. 2026 г.

OpenNRE

4 466

An Open-Source Package for Neural Relation Extraction (NRE)

Python
Обновлено 10 июн. 2026 г.

PromptPapers

4 315

Must-read papers on prompt-based tuning for pre-trained language models.

Неизвестный язык
Обновлено 7 июн. 2026 г.

OpenKE

4 040

An Open-Source Package for Knowledge Embedding (KE)

Python
Обновлено 11 июн. 2026 г.

PLMpapers

3 362

Must-read Papers on pre-trained language models.

Неизвестный язык
Обновлено 8 июн. 2026 г.

UltraChat

2 864

Large-scale, Informative, and Diverse Multi-round Chat Data (and Models)

Python
Обновлено 13 июн. 2026 г.

NRLPapers

2 517

Must-read papers on network representation learning (NRL) / network embedding (NE)

TeX
Обновлено 10 июн. 2026 г.

THULAC-Python

2 087

An Efficient Lexical Analyzer for Chinese

Python
Обновлено 9 июн. 2026 г.

OpenNE

1 705

An Open-Source Package for Network Embedding (NE)

Python
Обновлено 26 мая 2026 г.

TAADpapers

1 574

Must-read Papers on Textual Adversarial Attack and Defense

Python
Обновлено 20 мая 2026 г.

KRLPapers

1 525

Must-read papers on knowledge representation learning (KRL) / knowledge embedding (KE)

TeX
Обновлено 21 мая 2026 г.

KB2E

1 423

Knowledge Graph Embeddings including TransE, TransH, TransR and PTransE

C++
Обновлено 30 мая 2026 г.

ERNIE

1 420

Source code and dataset for ACL 2019 paper "ERNIE: Enhanced Language Representation with Informative Entities"

Python
Обновлено 26 мая 2026 г.

THUOCL

1 079

THUOCL(THU Open Chinese Lexicon)中文词库

Неизвестный язык
Обновлено 13 июн. 2026 г.

OpenDelta

1 045

A plug-and-play library for parameter-efficient-tuning (Delta Tuning)

Python
Обновлено 26 мая 2026 г.

NREPapers

1 030

Must-read papers on neural relation extraction (NRE)

TeX
Обновлено 2 июн. 2026 г.

OpenCLaP

984

Open Chinese Language Pre-trained Model Zoo

Неизвестный язык
Обновлено 8 мая 2026 г.

ToolLearningPapers

922

Описание для этого репозитория не предоставлено.

Неизвестный язык
Обновлено 2 июн. 2026 г.

WebCPM

911

Official codes for ACL 2023 paper "WebCPM: Interactive Web Search for Chinese Long-form Question Answering"

HTML
Обновлено 31 мая 2026 г.

RCPapers

889

Must-read papers on Machine Reading Comprehension

Неизвестный язык
Обновлено 26 мая 2026 г.

LLMxMapReduce

875

Описание для этого репозитория не предоставлено.

Python
Обновлено 9 июн. 2026 г.

THULAC

832

An Efficient Lexical Analyzer for Chinese

C++
Обновлено 1 июн. 2026 г.

Chinese_Rumor_Dataset

782

中文谣言数据

Неизвестный язык
Обновлено 1 июн. 2026 г.

OpenAttack

777

An Open-Source Package for Textual Adversarial Attack.

Python
Обновлено 8 июн. 2026 г.

FewRel

746

A Large-Scale Few-Shot Relation Extraction Dataset

Python
Обновлено 26 мая 2026 г.

OPD

654

Rethinking On-Policy Distillation of Large Language Models: Phenomenology, Mechanism, and Recipe

Python
Обновлено 13 июн. 2026 г.

DocRED

652

Dataset and codes for ACL 2019 DocRED: A Large-Scale Document-Level Relation Extraction Dataset.

Python
Обновлено 2 июн. 2026 г.

OpenHowNet

637

Core Data of HowNet and OpenHowNet Python API

Python
Обновлено 29 мая 2026 г.

ProactiveAgent

609

A LLM-based Agent that predict its tasks proactively.

Python
Обновлено 12 июн. 2026 г.

TensorFlow-TransX

513

An implementation of TransE and its extended models for Knowledge Representation Learning on TensorFlow

Python
Обновлено 6 мая 2026 г.

CAIL

509

Chinese AI & Law Challenge

Неизвестный язык
Обновлено 9 июн. 2026 г.

LegalPapers

498

Must-read Papers on Legal Intelligence

Неизвестный язык
Обновлено 25 мая 2026 г.

BERT-KPE

447

Описание для этого репозитория не предоставлено.

Python
Обновлено 24 мая 2026 г.

OpenMatch

442

An Open-Source Package for Information Retrieval.

Python
Обновлено 24 мая 2026 г.

LLaVA-UHD

424

LLaVA-UHD v3: Progressive Visual Compression for Efficient Native-Resolution Encoding in MLLMs

Python
Обновлено 11 июн. 2026 г.

Fast-TransX

405

An Efficient implementation of TransE and its extended models for Knowledge Representation Learning

C++
Обновлено 6 июн. 2026 г.

InfLLM

404

The code of our paper "InfLLM: Unveiling the Intrinsic Capacity of LLMs for Understanding Extremely Long Sequences with Training-Free Memory"

Python
Обновлено 9 июн. 2026 г.

Few-NERD

400

Code and data of ACL 2021 paper "Few-NERD: A Few-shot Named Entity Recognition Dataset"

Python
Обновлено 26 мая 2026 г.

TensorFlow-Summarization

386

Описание для этого репозитория не предоставлено.

Python
Обновлено 12 июн. 2026 г.

BMCourse

371

The repo for Tsinghua summer course: Interdisciplinary Seminar on Big Models

Python
Обновлено 20 мая 2026 г.

LEGENT

341

Open Platform for Embodied Agents

Python
Обновлено 2 июн. 2026 г.

THULAC-Java

339

An Efficient Lexical Analyzer for Chinese

Java
Обновлено 6 июн. 2026 г.

ChatEval

335

Codes for our paper "ChatEval: Towards Better LLM-based Evaluators through Multi-Agent Debate"

Python
Обновлено 5 июн. 2026 г.

NSC

287

Neural Sentiment Classification

Python
Обновлено 8 мая 2026 г.

DeltaPapers

284

Must-read Papers of Parameter-Efficient Tuning (Delta Tuning) Methods on Pre-trained Models.

Неизвестный язык
Обновлено 9 июн. 2026 г.

JustRL

276

[ICLR 2026 Blogpost Track Poster] JustRL: Scaling a 1.5B LLM with a Simple RL Recipe

Python
Обновлено 11 июн. 2026 г.

PL-Marker

272

Source code for "Packed Levitated Marker for Entity and Relation Extraction"

Python
Обновлено 10 июн. 2026 г.

OpenBackdoor

209

An open-source toolkit for textual backdoor attack and defense (NeurIPS 2022 D&B, Spotlight)

Python
Обновлено 18 мая 2026 г.

SE-WRL

196

Improved Word Representation Learning with Sememes

C
Обновлено 8 мая 2026 г.

LegalPLMs

194

Source code and checkpoints for legal pre-trained language models.

Python
Обновлено 5 июн. 2026 г.

Auto_CLIWC

168

Code for Chinese LIWC Lexicon Expansion via Hierarchical Classification of Word Embeddings with Sememe Attention (AAAI18)

Python
Обновлено 26 мая 2026 г.

DeepNote

134

Описание для этого репозитория не предоставлено.

Python
Обновлено 7 июн. 2026 г.

TritonBench

133

TritonBench: Benchmarking Large Language Model Capabilities for Generating Triton Operators

Python
Обновлено 8 июн. 2026 г.

attribute_charge

132

The source code of our COLING'18 paper "Few-Shot Charge Prediction with Discriminative Legal Attributes".

Python
Обновлено 1 мая 2026 г.

LEVEN

123

Source code and dataset for ACL2022 Findings Paper "LEVEN: A Large-Scale Chinese Legal Event Detection dataset"

Python
Обновлено 12 июн. 2026 г.

Ouroboros

117

Ouroboros: Speculative Decoding with Large Model Enhanced Drafting (EMNLP 2024 main)

Python
Обновлено 26 мая 2026 г.

MatPlotAgent

115

Описание для этого репозитория не предоставлено.

Python
Обновлено 8 июн. 2026 г.

MultiRD

110

Code and data of the AAAI-20 paper "Multi-channel Reverse Dictionary Model"

Python
Обновлено 6 мая 2026 г.

GEAR

100

Source code for ACL 2019 paper "GEAR: Graph-based Evidence Aggregating and Reasoning for Fact Verification"

Python
Обновлено 24 мая 2026 г.

TopJudge

100

Описание для этого репозитория не предоставлено.

Python
Обновлено 30 апр. 2026 г.

Prompt-Transferability

99

On Transferability of Prompt Tuning for Natural Language Processing

Python
Обновлено 26 мая 2026 г.

KV-PLM

89

Source code for "A Deep-learning System Bridging Molecule Structure and Biomedical Text with Comprehension Comparable to Human Professionals"

Python
Обновлено 3 июн. 2026 г.

DebugBench

86

The repository for paper "DebugBench: "Evaluating Debugging Capability of Large Language Models".

Python
Обновлено 21 мая 2026 г.

ChartCoder

79

[ACL'25 Main] ChartCoder: Advancing Multimodal Large Language Model for Chart-to-Code Generation

Python
Обновлено 28 апр. 2026 г.

Advbench

77

Code and data of the EMNLP 2022 paper "Why Should Adversarial Perturbations be Imperceptible? Rethink the Research Paradigm in Adversarial NLP".

Python
Обновлено 6 мая 2026 г.

NeuIRPapers

74

Must-read Papers on Neural Information Retrieval

Неизвестный язык
Обновлено 29 мая 2026 г.

MMDW

73

Max-margin DeepWalk

Java
Обновлено 6 мая 2026 г.

Optima

72

Code for paper "Optima: Optimizing Effectiveness and Efficiency for LLM-Based Multi-Agent System"

Python
Обновлено 8 мая 2026 г.

KARL

68

KARL: Knowledge-Aware Reasoning and Reinforcement Learning for Knowledge-Intensive Visual Grounding

Python
Обновлено 14 мая 2026 г.

CorefBERT

67

Source code for EMNLP 2020 paper "Coreferential Reasoning Learning for Language Representation"

Python
Обновлено 24 мая 2026 г.

H-Neurons

66

The official implementation of the paper: H-Neurons: On the Existence, Impact, and Origin of Hallucination-Associated Neurons in LLMs

Python
Обновлено 9 июн. 2026 г.

Adaptive-Note

60

Описание для этого репозитория не предоставлено.

Python
Обновлено 7 июн. 2026 г.

Delta-CoMe

59

Delta-CoMe can achieve near loss-less 1-bit compressin which has been accepted by NeurIPS 2024

Python
Обновлено 2 мая 2026 г.

EmbodiedEval

58

Evaluate Multimodal LLMs as Embodied Agents

Python
Обновлено 11 июн. 2026 г.

FR-Spec

55

[ACL 2025 main] FR-Spec: Frequency-Ranked Speculative Sampling

C++
Обновлено 29 мая 2026 г.

duplex-model

46

Описание для этого репозитория не предоставлено.

TypeScript
Обновлено 2 июн. 2026 г.

HiddenKiller

45

Code and data of the ACL-IJCNLP 2021 paper "Hidden Killer: Invisible Textual Backdoor Attacks with Syntactic Trigger"

Python
Обновлено 7 мая 2026 г.

SubCharTokenization

45

Описание для этого репозитория не предоставлено.

Python
Обновлено 30 апр. 2026 г.

VERNet

42

Source codes of Neural Quality Estimation with Multiple Hypotheses for Grammatical Error Correction

Python
Обновлено 29 мая 2026 г.

EmbodiedAIxLLMPapers

38

Papers on integrating large language models with embodied AI

Неизвестный язык
Обновлено 2 мая 2026 г.

Seq1F1B

37

Sequence-level 1F1B schedule for LLMs.

Python
Обновлено 23 апр. 2026 г.

hybrid-linear-attention

36

Code and models for the paper: Hybrid Linear Attention Done Right: Efficient Distillation and Effective Architectures for Extremely Long Contexts

Python
Обновлено 20 мая 2026 г.

SparsingLaw

32

The open-source materials for paper "Sparsing Law: Towards Large Language Models with Greater Activation Sparsity".

Python
Обновлено 9 июн. 2026 г.

explore-and-evaluate

31

Code for EMNLP2020 paper "Exploring and Evaluating Attributes, Values, and Structures for Entity Alignment".

Python
Обновлено 3 мая 2026 г.

CokeBERT

30

CokeBERT: Contextual Knowledge Selection and Embedding towards Enhanced Pre-Trained Language Models

Python
Обновлено 24 мая 2026 г.

Model_Emotion

27

Neuron Activation

Python
Обновлено 1 мая 2026 г.

LoRAFlow

25

ACL 2024: LoRA-Flow Dynamic LoRA Fusion for Large Language Models in Generative Tasks

Python
Обновлено 12 мая 2026 г.

VisualDS

24

Описание для этого репозитория не предоставлено.

Python
Обновлено 28 апр. 2026 г.

KG-Infused-RAG

23

Official implementation for the paper "KG-Infused RAG: Augmenting Corpus-Based RAG with External Knowledge Graphs"

Python
Обновлено 1 июн. 2026 г.

SchemaReinforcementLearning

23

Learning to Generate STRUCTURED Output with Schema Reinforcement Learning

Python
Обновлено 28 апр. 2026 г.

NOSA

17

The official implementation of NOSA

Python
Обновлено 11 июн. 2026 г.

hyperbolic_llm

13

Описание для этого репозитория не предоставлено.

Python
Обновлено 9 июн. 2026 г.

ClueAnchor

12

[EMNLP 2025 Findings] ClueAnchor: Clue-Anchored Knowledge Reasoning Exploration and Optimization for Retrieval-Augmented Generation

Python
Обновлено 6 июн. 2026 г.

Chujian

12

A large-scale dataset of Chu bamboo slip scripts and a multi-granularity tokenizer for ancient Chinese scripts

Python
Обновлено 27 мая 2026 г.

SMP

8

Single-Shot Meta-Pruning (SMP) for attention heads of Transformers

Python
Обновлено 29 апр. 2026 г.

DECO

2

Source code for paper "DECO: Sparse Mixture-of-Experts with Dense-Comparable Performance on End-Side Devices".

Python
Обновлено 23 мая 2026 г.

CPMobius

1

Описание для этого репозитория не предоставлено.

Python
Обновлено 14 мая 2026 г.

LexRel

1

Описание для этого репозитория не предоставлено.

Python
Обновлено 7 мая 2026 г.

Часто задаваемые вопросы

Что разрабатывает thunlp на GitHub?

thunlp разрабатывает различные проекты в области обработки естественного языка, включая репозитории, такие как GNNPapers, OpenPrompt и WantWords, которые охватывают темы от графовых нейронных сетей до обратных словарей.

Какие языки программирования использует thunlp?

thunlp использует несколько языков программирования, среди которых Python, C++, TeX, Java и JavaScript. Эти языки позволяют создавать широкий спектр инструментов и библиотек для исследований в области обработки естественного языка.

Являются ли репозитории thunlp публичными?

Да, все репозитории thunlp на GitHub являются публичными. Это позволяет исследователям и разработчикам получить доступ к ресурсам, инструментам и материалам, связанным с обработкой естественного языка.

Это раскрытие намеренно?

Следите за THUNLP с помощью RepoGuard и получайте уведомления в момент появления нового публичного репозитория.

Следить за этим аккаунтом