RepoGuard
Đã cập nhật 10 h ago
THUNLP

Organization

Dấu chân GitHub công khai của THUNLP

@thunlp
Xem hồ sơ trên GitHub

Natural Language Processing Lab at Tsinghua University

FIT Building, Tsinghua University, Beijing

269

Kho lưu trữ công khai

83.916

Tổng số sao

3.402

Người theo dõi

THUNLP là một tổ chức nghiên cứu tại Đại học Thanh Hoa, tập trung vào lĩnh vực xử lý ngôn ngữ tự nhiên. Tài khoản GitHub của họ chứa một loạt các kho lưu trữ công khai, bao gồm nhiều dự án nổi bật như GNNPapers và OpenPrompt, được xây dựng chủ yếu bằng các ngôn ngữ Python, C++ và JavaScript.

Ngôn ngữ hàng đầu

Python 74C++ 4TeX 3Java 2JavaScript 1HTML 1C 1TypeScript 1

Kho lưu trữ công khai

GNNPapers

16.792

Must-read papers on graph neural networks (GNN)

Ngôn ngữ không xác định
Đã cập nhật 13 thg 6, 2026

WantWords

7.109

An open-source online reverse dictionary.

JavaScript
Đã cập nhật 12 thg 6, 2026

OpenPrompt

4.877

An Open-Source Framework for Prompt-Learning.

Python
Đã cập nhật 11 thg 6, 2026

OpenNRE

4.466

An Open-Source Package for Neural Relation Extraction (NRE)

Python
Đã cập nhật 10 thg 6, 2026

PromptPapers

4.315

Must-read papers on prompt-based tuning for pre-trained language models.

Ngôn ngữ không xác định
Đã cập nhật 7 thg 6, 2026

OpenKE

4.040

An Open-Source Package for Knowledge Embedding (KE)

Python
Đã cập nhật 11 thg 6, 2026

PLMpapers

3.362

Must-read Papers on pre-trained language models.

Ngôn ngữ không xác định
Đã cập nhật 8 thg 6, 2026

UltraChat

2.864

Large-scale, Informative, and Diverse Multi-round Chat Data (and Models)

Python
Đã cập nhật 13 thg 6, 2026

NRLPapers

2.517

Must-read papers on network representation learning (NRL) / network embedding (NE)

TeX
Đã cập nhật 10 thg 6, 2026

THULAC-Python

2.087

An Efficient Lexical Analyzer for Chinese

Python
Đã cập nhật 9 thg 6, 2026

OpenNE

1.705

An Open-Source Package for Network Embedding (NE)

Python
Đã cập nhật 26 thg 5, 2026

TAADpapers

1.574

Must-read Papers on Textual Adversarial Attack and Defense

Python
Đã cập nhật 20 thg 5, 2026

KRLPapers

1.525

Must-read papers on knowledge representation learning (KRL) / knowledge embedding (KE)

TeX
Đã cập nhật 21 thg 5, 2026

KB2E

1.423

Knowledge Graph Embeddings including TransE, TransH, TransR and PTransE

C++
Đã cập nhật 30 thg 5, 2026

ERNIE

1.420

Source code and dataset for ACL 2019 paper "ERNIE: Enhanced Language Representation with Informative Entities"

Python
Đã cập nhật 26 thg 5, 2026

THUOCL

1.079

THUOCL(THU Open Chinese Lexicon)中文词库

Ngôn ngữ không xác định
Đã cập nhật 13 thg 6, 2026

OpenDelta

1.045

A plug-and-play library for parameter-efficient-tuning (Delta Tuning)

Python
Đã cập nhật 26 thg 5, 2026

NREPapers

1.030

Must-read papers on neural relation extraction (NRE)

TeX
Đã cập nhật 2 thg 6, 2026

OpenCLaP

984

Open Chinese Language Pre-trained Model Zoo

Ngôn ngữ không xác định
Đã cập nhật 8 thg 5, 2026

ToolLearningPapers

922

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Ngôn ngữ không xác định
Đã cập nhật 2 thg 6, 2026

WebCPM

911

Official codes for ACL 2023 paper "WebCPM: Interactive Web Search for Chinese Long-form Question Answering"

HTML
Đã cập nhật 31 thg 5, 2026

RCPapers

889

Must-read papers on Machine Reading Comprehension

Ngôn ngữ không xác định
Đã cập nhật 26 thg 5, 2026

LLMxMapReduce

875

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python
Đã cập nhật 9 thg 6, 2026

THULAC

832

An Efficient Lexical Analyzer for Chinese

C++
Đã cập nhật 1 thg 6, 2026

Chinese_Rumor_Dataset

782

中文谣言数据

Ngôn ngữ không xác định
Đã cập nhật 1 thg 6, 2026

OpenAttack

777

An Open-Source Package for Textual Adversarial Attack.

Python
Đã cập nhật 8 thg 6, 2026

FewRel

746

A Large-Scale Few-Shot Relation Extraction Dataset

Python
Đã cập nhật 26 thg 5, 2026

OPD

654

Rethinking On-Policy Distillation of Large Language Models: Phenomenology, Mechanism, and Recipe

Python
Đã cập nhật 13 thg 6, 2026

DocRED

652

Dataset and codes for ACL 2019 DocRED: A Large-Scale Document-Level Relation Extraction Dataset.

Python
Đã cập nhật 2 thg 6, 2026

OpenHowNet

637

Core Data of HowNet and OpenHowNet Python API

Python
Đã cập nhật 29 thg 5, 2026

ProactiveAgent

609

A LLM-based Agent that predict its tasks proactively.

Python
Đã cập nhật 12 thg 6, 2026

TensorFlow-TransX

513

An implementation of TransE and its extended models for Knowledge Representation Learning on TensorFlow

Python
Đã cập nhật 6 thg 5, 2026

CAIL

509

Chinese AI & Law Challenge

Ngôn ngữ không xác định
Đã cập nhật 9 thg 6, 2026

LegalPapers

498

Must-read Papers on Legal Intelligence

Ngôn ngữ không xác định
Đã cập nhật 25 thg 5, 2026

BERT-KPE

447

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python
Đã cập nhật 24 thg 5, 2026

OpenMatch

442

An Open-Source Package for Information Retrieval.

Python
Đã cập nhật 24 thg 5, 2026

LLaVA-UHD

424

LLaVA-UHD v3: Progressive Visual Compression for Efficient Native-Resolution Encoding in MLLMs

Python
Đã cập nhật 11 thg 6, 2026

Fast-TransX

405

An Efficient implementation of TransE and its extended models for Knowledge Representation Learning

C++
Đã cập nhật 6 thg 6, 2026

InfLLM

404

The code of our paper "InfLLM: Unveiling the Intrinsic Capacity of LLMs for Understanding Extremely Long Sequences with Training-Free Memory"

Python
Đã cập nhật 9 thg 6, 2026

Few-NERD

400

Code and data of ACL 2021 paper "Few-NERD: A Few-shot Named Entity Recognition Dataset"

Python
Đã cập nhật 26 thg 5, 2026

TensorFlow-Summarization

386

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python
Đã cập nhật 12 thg 6, 2026

BMCourse

371

The repo for Tsinghua summer course: Interdisciplinary Seminar on Big Models

Python
Đã cập nhật 20 thg 5, 2026

LEGENT

341

Open Platform for Embodied Agents

Python
Đã cập nhật 2 thg 6, 2026

THULAC-Java

339

An Efficient Lexical Analyzer for Chinese

Java
Đã cập nhật 6 thg 6, 2026

ChatEval

335

Codes for our paper "ChatEval: Towards Better LLM-based Evaluators through Multi-Agent Debate"

Python
Đã cập nhật 5 thg 6, 2026

NSC

287

Neural Sentiment Classification

Python
Đã cập nhật 8 thg 5, 2026

DeltaPapers

284

Must-read Papers of Parameter-Efficient Tuning (Delta Tuning) Methods on Pre-trained Models.

Ngôn ngữ không xác định
Đã cập nhật 9 thg 6, 2026

JustRL

276

[ICLR 2026 Blogpost Track Poster] JustRL: Scaling a 1.5B LLM with a Simple RL Recipe

Python
Đã cập nhật 11 thg 6, 2026

PL-Marker

272

Source code for "Packed Levitated Marker for Entity and Relation Extraction"

Python
Đã cập nhật 10 thg 6, 2026

OpenBackdoor

209

An open-source toolkit for textual backdoor attack and defense (NeurIPS 2022 D&B, Spotlight)

Python
Đã cập nhật 18 thg 5, 2026

SE-WRL

196

Improved Word Representation Learning with Sememes

C
Đã cập nhật 8 thg 5, 2026

LegalPLMs

194

Source code and checkpoints for legal pre-trained language models.

Python
Đã cập nhật 5 thg 6, 2026

Auto_CLIWC

168

Code for Chinese LIWC Lexicon Expansion via Hierarchical Classification of Word Embeddings with Sememe Attention (AAAI18)

Python
Đã cập nhật 26 thg 5, 2026

DeepNote

134

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python
Đã cập nhật 7 thg 6, 2026

TritonBench

133

TritonBench: Benchmarking Large Language Model Capabilities for Generating Triton Operators

Python
Đã cập nhật 8 thg 6, 2026

attribute_charge

132

The source code of our COLING'18 paper "Few-Shot Charge Prediction with Discriminative Legal Attributes".

Python
Đã cập nhật 1 thg 5, 2026

LEVEN

123

Source code and dataset for ACL2022 Findings Paper "LEVEN: A Large-Scale Chinese Legal Event Detection dataset"

Python
Đã cập nhật 12 thg 6, 2026

Ouroboros

117

Ouroboros: Speculative Decoding with Large Model Enhanced Drafting (EMNLP 2024 main)

Python
Đã cập nhật 26 thg 5, 2026

MatPlotAgent

115

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python
Đã cập nhật 8 thg 6, 2026

MultiRD

110

Code and data of the AAAI-20 paper "Multi-channel Reverse Dictionary Model"

Python
Đã cập nhật 6 thg 5, 2026

GEAR

100

Source code for ACL 2019 paper "GEAR: Graph-based Evidence Aggregating and Reasoning for Fact Verification"

Python
Đã cập nhật 24 thg 5, 2026

TopJudge

100

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python
Đã cập nhật 30 thg 4, 2026

Prompt-Transferability

99

On Transferability of Prompt Tuning for Natural Language Processing

Python
Đã cập nhật 26 thg 5, 2026

KV-PLM

89

Source code for "A Deep-learning System Bridging Molecule Structure and Biomedical Text with Comprehension Comparable to Human Professionals"

Python
Đã cập nhật 3 thg 6, 2026

DebugBench

86

The repository for paper "DebugBench: "Evaluating Debugging Capability of Large Language Models".

Python
Đã cập nhật 21 thg 5, 2026

ChartCoder

79

[ACL'25 Main] ChartCoder: Advancing Multimodal Large Language Model for Chart-to-Code Generation

Python
Đã cập nhật 28 thg 4, 2026

Advbench

77

Code and data of the EMNLP 2022 paper "Why Should Adversarial Perturbations be Imperceptible? Rethink the Research Paradigm in Adversarial NLP".

Python
Đã cập nhật 6 thg 5, 2026

NeuIRPapers

74

Must-read Papers on Neural Information Retrieval

Ngôn ngữ không xác định
Đã cập nhật 29 thg 5, 2026

MMDW

73

Max-margin DeepWalk

Java
Đã cập nhật 6 thg 5, 2026

Optima

72

Code for paper "Optima: Optimizing Effectiveness and Efficiency for LLM-Based Multi-Agent System"

Python
Đã cập nhật 8 thg 5, 2026

KARL

68

KARL: Knowledge-Aware Reasoning and Reinforcement Learning for Knowledge-Intensive Visual Grounding

Python
Đã cập nhật 14 thg 5, 2026

CorefBERT

67

Source code for EMNLP 2020 paper "Coreferential Reasoning Learning for Language Representation"

Python
Đã cập nhật 24 thg 5, 2026

H-Neurons

66

The official implementation of the paper: H-Neurons: On the Existence, Impact, and Origin of Hallucination-Associated Neurons in LLMs

Python
Đã cập nhật 9 thg 6, 2026

Adaptive-Note

60

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python
Đã cập nhật 7 thg 6, 2026

Delta-CoMe

59

Delta-CoMe can achieve near loss-less 1-bit compressin which has been accepted by NeurIPS 2024

Python
Đã cập nhật 2 thg 5, 2026

EmbodiedEval

58

Evaluate Multimodal LLMs as Embodied Agents

Python
Đã cập nhật 11 thg 6, 2026

FR-Spec

55

[ACL 2025 main] FR-Spec: Frequency-Ranked Speculative Sampling

C++
Đã cập nhật 29 thg 5, 2026

duplex-model

46

Không có mô tả nào được cung cấp cho kho lưu trữ này.

TypeScript
Đã cập nhật 2 thg 6, 2026

HiddenKiller

45

Code and data of the ACL-IJCNLP 2021 paper "Hidden Killer: Invisible Textual Backdoor Attacks with Syntactic Trigger"

Python
Đã cập nhật 7 thg 5, 2026

SubCharTokenization

45

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python
Đã cập nhật 30 thg 4, 2026

VERNet

42

Source codes of Neural Quality Estimation with Multiple Hypotheses for Grammatical Error Correction

Python
Đã cập nhật 29 thg 5, 2026

EmbodiedAIxLLMPapers

38

Papers on integrating large language models with embodied AI

Ngôn ngữ không xác định
Đã cập nhật 2 thg 5, 2026

Seq1F1B

37

Sequence-level 1F1B schedule for LLMs.

Python
Đã cập nhật 23 thg 4, 2026

hybrid-linear-attention

36

Code and models for the paper: Hybrid Linear Attention Done Right: Efficient Distillation and Effective Architectures for Extremely Long Contexts

Python
Đã cập nhật 20 thg 5, 2026

SparsingLaw

32

The open-source materials for paper "Sparsing Law: Towards Large Language Models with Greater Activation Sparsity".

Python
Đã cập nhật 9 thg 6, 2026

explore-and-evaluate

31

Code for EMNLP2020 paper "Exploring and Evaluating Attributes, Values, and Structures for Entity Alignment".

Python
Đã cập nhật 3 thg 5, 2026

CokeBERT

30

CokeBERT: Contextual Knowledge Selection and Embedding towards Enhanced Pre-Trained Language Models

Python
Đã cập nhật 24 thg 5, 2026

Model_Emotion

27

Neuron Activation

Python
Đã cập nhật 1 thg 5, 2026

LoRAFlow

25

ACL 2024: LoRA-Flow Dynamic LoRA Fusion for Large Language Models in Generative Tasks

Python
Đã cập nhật 12 thg 5, 2026

VisualDS

24

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python
Đã cập nhật 28 thg 4, 2026

KG-Infused-RAG

23

Official implementation for the paper "KG-Infused RAG: Augmenting Corpus-Based RAG with External Knowledge Graphs"

Python
Đã cập nhật 1 thg 6, 2026

SchemaReinforcementLearning

23

Learning to Generate STRUCTURED Output with Schema Reinforcement Learning

Python
Đã cập nhật 28 thg 4, 2026

NOSA

17

The official implementation of NOSA

Python
Đã cập nhật 11 thg 6, 2026

hyperbolic_llm

13

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python
Đã cập nhật 9 thg 6, 2026

ClueAnchor

12

[EMNLP 2025 Findings] ClueAnchor: Clue-Anchored Knowledge Reasoning Exploration and Optimization for Retrieval-Augmented Generation

Python
Đã cập nhật 6 thg 6, 2026

Chujian

12

A large-scale dataset of Chu bamboo slip scripts and a multi-granularity tokenizer for ancient Chinese scripts

Python
Đã cập nhật 27 thg 5, 2026

SMP

8

Single-Shot Meta-Pruning (SMP) for attention heads of Transformers

Python
Đã cập nhật 29 thg 4, 2026

DECO

2

Source code for paper "DECO: Sparse Mixture-of-Experts with Dense-Comparable Performance on End-Side Devices".

Python
Đã cập nhật 23 thg 5, 2026

CPMobius

1

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python
Đã cập nhật 14 thg 5, 2026

LexRel

1

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python
Đã cập nhật 7 thg 5, 2026

Câu hỏi thường gặp

thunlp xây dựng gì trên GitHub?

thunlp phát triển nhiều dự án mã nguồn mở liên quan đến xử lý ngôn ngữ tự nhiên, bao gồm các kho lưu trữ như OpenPrompt và OpenNRE, phục vụ cho các nghiên cứu và ứng dụng trong lĩnh vực này.

thunlp sử dụng những ngôn ngữ lập trình nào?

thunlp chủ yếu sử dụng các ngôn ngữ lập trình như Python, C++, TeX, Java, JavaScript và HTML trong các dự án của mình, cho phép họ phát triển nhiều loại ứng dụng và công cụ trong lĩnh vực NLP.

các kho lưu trữ của thunlp có công khai không?

Tất cả các kho lưu trữ của thunlp đều là công khai, cho phép cộng đồng truy cập và sử dụng các tài nguyên nghiên cứu, cũng như đóng góp vào các dự án mã nguồn mở của họ.

Liệu việc lộ thông tin này có dự định không?

Theo dõi THUNLP với RepoGuard và nhận cảnh báo ngay khi có kho lưu trữ công khai mới xuất hiện.

Theo dõi tài khoản này