Đã cập nhật 2 h ago

Organization

Dấu chân GitHub công khai của Tongyi Lab, Alibaba Group

@Alibaba-NLP

Xem hồ sơ trên GitHub

Our team at Tongyi Lab is dedicated to pioneer advancements in AI search technologies.

China

Kho lưu trữ công khai

25.454

Tổng số sao

1.658

Người theo dõi

Alibaba-NLP, thuộc về Tongyi Lab của Alibaba Group, có một sự hiện diện mạnh mẽ trên GitHub với nhiều kho lưu trữ công khai. Đội ngũ của họ chuyên về công nghệ tìm kiếm AI, với các dự án nổi bật như DeepResearch và ZeroSearch, chủ yếu sử dụng ngôn ngữ Python để phát triển các công cụ và framework hỗ trợ nghiên cứu sâu.

Ngôn ngữ hàng đầu

Python 34

Kho lưu trữ công khai

DeepResearch

★19.381

Tongyi Deep Research, the Leading Open-source Deep Research Agent

Python

Đã cập nhật 13 thg 6, 2026

ZeroSearch

★1.292

ZeroSearch: Incentivize the Search Capability of LLMs without Searching

Python

Đã cập nhật 13 thg 6, 2026

VRAG

★947

Multimodal Retrieval-augmented Generation Framework Built by Tongyi Lab, Alibaba Group.

Python

Đã cập nhật 12 thg 6, 2026

ViDoRAG

★664

[EMNLP 2025] ViDoRAG: Visual Document Retrieval-Augmented Generation via Dynamic Iterative Reasoning Agents

Python

Đã cập nhật 11 thg 6, 2026

OmniSearch

★430

Repo for Benchmarking Multimodal Retrieval Augmented Generation with Dynamic VQA Dataset and Self-adaptive Planning Agent

Python

Đã cập nhật 11 thg 6, 2026

ACE

★313

[ACL-IJCNLP 2021] Automated Concatenation of Embeddings for Structured Prediction

Python

Đã cập nhật 1 thg 6, 2026

CHRONOS

★300

Repo for NAACL 2025 Paper "Unfolding the Headline: Iterative Self-Questioning for News Retrieval and Timeline Summarization"

Python

Đã cập nhật 12 thg 6, 2026

EcomGPT

★275

An Instruction-tuned Large Language Model for E-commerce

Python

Đã cập nhật 12 thg 6, 2026

qqr

★254

qqr is an RL training framework for open-ended agents.

Python

Đã cập nhật 10 thg 6, 2026

HiAGM

★230

Hierarchy-Aware Global Model for Hierarchical Text Classification

Python

Đã cập nhật 1 thg 6, 2026

SeqGPT

★227

SeqGPT: An Out-of-the-box Large Language Model for Open Domain Sequence Understanding

Python

Đã cập nhật 1 thg 6, 2026

Multi-CPR

★206

[SIGIR 2022] Multi-CPR: A Multi Domain Chinese Dataset for Passage Retrieval

Python

Đã cập nhật 1 thg 6, 2026

KB-NER

★186

Winner system (DAMO-NLP) of SemEval 2022 MultiCoNER shared task over 10 out of 13 tracks.

Python

Đã cập nhật 22 thg 5, 2026

MaskSearch

★155

Repo for "MaskSearch: A Universal Pre-Training Framework to Enhance Agentic Search Capability"

Python

Đã cập nhật 6 thg 6, 2026

CLNER

★93

[ACL-IJCNLP 2021] Improving Named Entity Recognition by External Context Retrieving and Cooperative Learning

Python

Đã cập nhật 19 thg 5, 2026

MultilangStructureKD

★74

[ACL 2020] Structure-Level Knowledge Distillation For Multilingual Sequence Labeling

Python

Đã cập nhật 1 thg 6, 2026

E2Rank

★57

E2Rank: Your Text Embedding can Also be an Effective and Efficient Listwise Reranker

Python

Đã cập nhật 10 thg 6, 2026

LaRA

★51

The code for LaRA Benchmark

Python

Đã cập nhật 8 thg 6, 2026

CoFE-RAG

★45

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python

Đã cập nhật 7 thg 6, 2026

RankingGPT

★35

code for paper 《RankingGPT: Empowering Large Language Models in Text Ranking with Progressive Enhancement》

Python

Đã cập nhật 9 thg 4, 2026

ProtoRE

★32

Code for 'Prototypical Representation Learning for Relation Extraction'.

Python

Đã cập nhật 1 thg 6, 2026

MuVER

★32

[EMNLP 2021] MuVER: Improving First-Stage Entity Retrieval with Multi-View Entity Representations

Python

Đã cập nhật 9 thg 4, 2026

AISHELL-NER

★25

[ICASSP 2022] AISHELL-NER: Named Entity Recognition from Chinese Speech

Ngôn ngữ không xác định

Đã cập nhật 4 thg 1, 2026

DAAT-CWS

★23

Coupling Distant Annotation and Adversarial Training for Cross-Domain Chinese Word Segmentation

Python

Đã cập nhật 1 thg 6, 2026

MANNER

★20

[ACL 2023] MANNER: A Variational Memory-Augmented Model for Cross Domain Few-Shot Named Entity Recognition

Python

Đã cập nhật 1 thg 6, 2026

HLATR

★20

Hybrid List Aware Transformer Reranking

Ngôn ngữ không xác định

Đã cập nhật 9 thg 4, 2026

AIN

★20

Code for our EMNLP 2020 Paper "AIN: Fast and Accurate Sequence Labeling with Approximate Inference Network"

Python

Đã cập nhật 9 thg 4, 2026

CDQA

★18

CDQA: Chinese Dynamic Question Answering Benchmark

Python

Đã cập nhật 9 thg 4, 2026

EBM-Net

★14

Codes for the EMNLP'2020 paper "Predicting Clinical Trial Results by Implicit Evidence Integration".

Python

Đã cập nhật 27 thg 11, 2024

StructuralKD

★11

[ACL-IJCNLP 2021] Structural Knowledge Distillation: Tractably Distilling Information for Structured Predictor

Python

Đã cập nhật 1 thg 6, 2026

WebDetective

★7

A new evaluation paradigm for deep search that identifies specific LLM failure sources, introduces challenging hint-free datasets with holistic evaluation, and offers a strong baseline incorporating memory and verification.

Python

Đã cập nhật 1 thg 6, 2026

Vec-RA-ODQA

★6

Source code of paper Improving "Retrieval Augmented Open-Domain Question-Answering with Vectorized Contexts

Python

Đã cập nhật 1 thg 6, 2026

IBKD

★3

This is the official repository for the IBKD knowledge distillation method, as described in the paper .

Python

Đã cập nhật 1 thg 6, 2026

MarCo-Dialog

★3

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python

Đã cập nhật 17 thg 3, 2022

VLLM-KB

★2

[EMNLP 2025] Code for "Detecting Knowledge Boundary of Vision Large Language Models by Sampling-Based Inference"

Python

Đã cập nhật 9 thg 4, 2026

Key-Point-Analysis

★1

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Python

Đã cập nhật 29 thg 8, 2024

Gumbel-CRF

★1

Implementation of NeurIPS 20 paper: Latent Template Induction with Gumbel-CRFs

Ngôn ngữ không xác định

Đã cập nhật 24 thg 3, 2024

Partially-Observed-TreeCRFs

★1

Implementation of AAAI 21 paper: Nested Named Entity Recognition with Partially Observed TreeCRFs

Ngôn ngữ không xác định

Đã cập nhật 28 thg 2, 2023

hilichurl

★0

Không có mô tả nào được cung cấp cho kho lưu trữ này.

Ngôn ngữ không xác định

Đã cập nhật 13 thg 1, 2026

Triaffine-nested-ner

★0

[ACL 2022 Findings] Fusing Heterogeneous Factors with Triaffine Mechanism for Nested Named Entity Recognition

Ngôn ngữ không xác định

Đã cập nhật 1 thg 5, 2022

ICD-MSMN

★0

[ACL 2022] Code Synonyms Do Matter: Multiple Synonyms Matching Network for Automatic ICD Coding

Ngôn ngữ không xác định

Đã cập nhật 29 thg 4, 2022

Alibaba-TREC-PM

★0

Codes and data for Alibaba's winning systems at the TREC Precision Medicine Track 2020.

Ngôn ngữ không xác định

Đã cập nhật 28 thg 8, 2021

PoincareProbe

★0

Implementation of ICLR 21 paper: Probing BERT in Hyperbolic Spaces

Ngôn ngữ không xác định

Đã cập nhật 7 thg 4, 2021

Câu hỏi thường gặp

Alibaba-NLP xây dựng những gì trên GitHub?

Alibaba-NLP phát triển nhiều dự án liên quan đến công nghệ AI và tìm kiếm, bao gồm các kho lưu trữ như DeepResearch, ZeroSearch và VRAG, tập trung vào các ứng dụng nghiên cứu và thu hồi thông tin.

Ngôn ngữ lập trình nào được Alibaba-NLP sử dụng?

Alibaba-NLP chủ yếu sử dụng ngôn ngữ Python cho các dự án của mình, giúp phát triển các mô hình và framework phục vụ cho nghiên cứu và ứng dụng AI, tạo ra nhiều kho lưu trữ có giá trị.

Kho lưu trữ của Alibaba-NLP có công khai không?

Tất cả kho lưu trữ của Alibaba-NLP trên GitHub đều là công khai, cho phép người dùng truy cập và tham khảo các dự án, mã nguồn và tài liệu mà đội ngũ phát triển đã tạo ra.

Liệu việc lộ thông tin này có dự định không?

Theo dõi Tongyi Lab, Alibaba Group với RepoGuard và nhận cảnh báo ngay khi có kho lưu trữ công khai mới xuất hiện.

Theo dõi tài khoản này