Обновлено 2 h ago

Organization

Публичный след на GitHub Tongyi Lab, Alibaba Group

@Alibaba-NLP

Просмотреть профиль на GitHub

Our team at Tongyi Lab is dedicated to pioneer advancements in AI search technologies.

China

Публичные репозитории

25 454

Всего звезд

1 658

Подписчики

Организация Alibaba-NLP представляет собой команду Tongyi Lab из Alibaba Group, сосредоточенную на разработке технологий искусственного интеллекта для поиска. На их GitHub-странице размещено множество репозиториев, включая DeepResearch и ZeroSearch, написанных на Python, которые способствуют развитию открытых решений в области глубоких исследований и поисковых технологий.

Основные языки

Python 34

Публичные репозитории

DeepResearch

★19 381

Tongyi Deep Research, the Leading Open-source Deep Research Agent

Python

Обновлено 13 июн. 2026 г.

ZeroSearch

★1 292

ZeroSearch: Incentivize the Search Capability of LLMs without Searching

Python

Обновлено 13 июн. 2026 г.

VRAG

★947

Multimodal Retrieval-augmented Generation Framework Built by Tongyi Lab, Alibaba Group.

Python

Обновлено 12 июн. 2026 г.

ViDoRAG

★664

[EMNLP 2025] ViDoRAG: Visual Document Retrieval-Augmented Generation via Dynamic Iterative Reasoning Agents

Python

Обновлено 11 июн. 2026 г.

OmniSearch

★430

Repo for Benchmarking Multimodal Retrieval Augmented Generation with Dynamic VQA Dataset and Self-adaptive Planning Agent

Python

Обновлено 11 июн. 2026 г.

ACE

★313

[ACL-IJCNLP 2021] Automated Concatenation of Embeddings for Structured Prediction

Python

Обновлено 1 июн. 2026 г.

CHRONOS

★300

Repo for NAACL 2025 Paper "Unfolding the Headline: Iterative Self-Questioning for News Retrieval and Timeline Summarization"

Python

Обновлено 12 июн. 2026 г.

EcomGPT

★275

An Instruction-tuned Large Language Model for E-commerce

Python

Обновлено 12 июн. 2026 г.

qqr

★254

qqr is an RL training framework for open-ended agents.

Python

Обновлено 10 июн. 2026 г.

HiAGM

★230

Hierarchy-Aware Global Model for Hierarchical Text Classification

Python

Обновлено 1 июн. 2026 г.

SeqGPT

★227

SeqGPT: An Out-of-the-box Large Language Model for Open Domain Sequence Understanding

Python

Обновлено 1 июн. 2026 г.

Multi-CPR

★206

[SIGIR 2022] Multi-CPR: A Multi Domain Chinese Dataset for Passage Retrieval

Python

Обновлено 1 июн. 2026 г.

KB-NER

★186

Winner system (DAMO-NLP) of SemEval 2022 MultiCoNER shared task over 10 out of 13 tracks.

Python

Обновлено 22 мая 2026 г.

MaskSearch

★155

Repo for "MaskSearch: A Universal Pre-Training Framework to Enhance Agentic Search Capability"

Python

Обновлено 6 июн. 2026 г.

CLNER

★93

[ACL-IJCNLP 2021] Improving Named Entity Recognition by External Context Retrieving and Cooperative Learning

Python

Обновлено 19 мая 2026 г.

MultilangStructureKD

★74

[ACL 2020] Structure-Level Knowledge Distillation For Multilingual Sequence Labeling

Python

Обновлено 1 июн. 2026 г.

E2Rank

★57

E2Rank: Your Text Embedding can Also be an Effective and Efficient Listwise Reranker

Python

Обновлено 10 июн. 2026 г.

LaRA

★51

The code for LaRA Benchmark

Python

Обновлено 8 июн. 2026 г.

CoFE-RAG

★45

Описание для этого репозитория не предоставлено.

Python

Обновлено 7 июн. 2026 г.

RankingGPT

★35

code for paper 《RankingGPT: Empowering Large Language Models in Text Ranking with Progressive Enhancement》

Python

Обновлено 9 апр. 2026 г.

ProtoRE

★32

Code for 'Prototypical Representation Learning for Relation Extraction'.

Python

Обновлено 1 июн. 2026 г.

MuVER

★32

[EMNLP 2021] MuVER: Improving First-Stage Entity Retrieval with Multi-View Entity Representations

Python

Обновлено 9 апр. 2026 г.

AISHELL-NER

★25

[ICASSP 2022] AISHELL-NER: Named Entity Recognition from Chinese Speech

Неизвестный язык

Обновлено 4 янв. 2026 г.

DAAT-CWS

★23

Coupling Distant Annotation and Adversarial Training for Cross-Domain Chinese Word Segmentation

Python

Обновлено 1 июн. 2026 г.

MANNER

★20

[ACL 2023] MANNER: A Variational Memory-Augmented Model for Cross Domain Few-Shot Named Entity Recognition

Python

Обновлено 1 июн. 2026 г.

HLATR

★20

Hybrid List Aware Transformer Reranking

Неизвестный язык

Обновлено 9 апр. 2026 г.

AIN

★20

Code for our EMNLP 2020 Paper "AIN: Fast and Accurate Sequence Labeling with Approximate Inference Network"

Python

Обновлено 9 апр. 2026 г.

CDQA

★18

CDQA: Chinese Dynamic Question Answering Benchmark

Python

Обновлено 9 апр. 2026 г.

EBM-Net

★14

Codes for the EMNLP'2020 paper "Predicting Clinical Trial Results by Implicit Evidence Integration".

Python

Обновлено 27 нояб. 2024 г.

StructuralKD

★11

[ACL-IJCNLP 2021] Structural Knowledge Distillation: Tractably Distilling Information for Structured Predictor

Python

Обновлено 1 июн. 2026 г.

WebDetective

★7

A new evaluation paradigm for deep search that identifies specific LLM failure sources, introduces challenging hint-free datasets with holistic evaluation, and offers a strong baseline incorporating memory and verification.

Python

Обновлено 1 июн. 2026 г.

Vec-RA-ODQA

★6

Source code of paper Improving "Retrieval Augmented Open-Domain Question-Answering with Vectorized Contexts

Python

Обновлено 1 июн. 2026 г.

IBKD

★3

This is the official repository for the IBKD knowledge distillation method, as described in the paper .

Python

Обновлено 1 июн. 2026 г.

MarCo-Dialog

★3

Описание для этого репозитория не предоставлено.

Python

Обновлено 17 мар. 2022 г.

VLLM-KB

★2

[EMNLP 2025] Code for "Detecting Knowledge Boundary of Vision Large Language Models by Sampling-Based Inference"

Python

Обновлено 9 апр. 2026 г.

Key-Point-Analysis

★1

Описание для этого репозитория не предоставлено.

Python

Обновлено 29 авг. 2024 г.

Gumbel-CRF

★1

Implementation of NeurIPS 20 paper: Latent Template Induction with Gumbel-CRFs

Неизвестный язык

Обновлено 24 мар. 2024 г.

Partially-Observed-TreeCRFs

★1

Implementation of AAAI 21 paper: Nested Named Entity Recognition with Partially Observed TreeCRFs

Неизвестный язык

Обновлено 28 февр. 2023 г.

hilichurl

★0

Описание для этого репозитория не предоставлено.

Неизвестный язык

Обновлено 13 янв. 2026 г.

Triaffine-nested-ner

★0

[ACL 2022 Findings] Fusing Heterogeneous Factors with Triaffine Mechanism for Nested Named Entity Recognition

Неизвестный язык

Обновлено 1 мая 2022 г.

ICD-MSMN

★0

[ACL 2022] Code Synonyms Do Matter: Multiple Synonyms Matching Network for Automatic ICD Coding

Неизвестный язык

Обновлено 29 апр. 2022 г.

Alibaba-TREC-PM

★0

Codes and data for Alibaba's winning systems at the TREC Precision Medicine Track 2020.

Неизвестный язык

Обновлено 28 авг. 2021 г.

PoincareProbe

★0

Implementation of ICLR 21 paper: Probing BERT in Hyperbolic Spaces

Неизвестный язык

Обновлено 7 апр. 2021 г.

Часто задаваемые вопросы

Что разрабатывает Alibaba-NLP на GitHub?

Alibaba-NLP разрабатывает ряд проектов, включая DeepResearch и ZeroSearch, которые касаются технологий глубокого обучения и поиска. Эти репозитории предлагают решения для развития AI и оптимизации поисковых возможностей.

Какие языки программирования использует Alibaba-NLP?

Основным языком программирования, используемым Alibaba-NLP, является Python. Он применяется в различных проектах, таких как ViDoRAG и OmniSearch, что делает его важным инструментом в их разработках.

Являются ли репозитории Alibaba-NLP публичными?

Да, репозитории Alibaba-NLP являются публичными и доступны для просмотра. Это позволяет сообществу изучать их разработки, такие как ACE и EcomGPT, и вносить свой вклад в проекты.

Это раскрытие намеренно?

Следите за Tongyi Lab, Alibaba Group с помощью RepoGuard и получайте уведомления в момент появления нового публичного репозитория.

Следить за этим аккаунтом