RepoGuard
Bijgewerkt 2 h ago
Tongyi Lab, Alibaba Group

Organization

Publieke GitHub-voetafdruk van Tongyi Lab, Alibaba Group

@Alibaba-NLP
Bekijk profiel op GitHub

Our team at Tongyi Lab is dedicated to pioneer advancements in AI search technologies.

China

43

Publieke repositories

25.454

Totaal aantal sterren

1.658

Volgers

Alibaba-NLP, onderdeel van Tongyi Lab van Alibaba Group, heeft een actieve aanwezigheid op GitHub met een breed scala aan open-source projecten. De belangrijkste programmeertaal is Python, met opmerkelijke repositories zoals DeepResearch en ZeroSearch, die zich richten op AI-zoektechnologieën en multimodale retrieval-systemen.

Top talen

Python 34

Publieke repositories

DeepResearch

19.381

Tongyi Deep Research, the Leading Open-source Deep Research Agent

Python
Bijgewerkt 13 jun 2026

ZeroSearch

1.292

ZeroSearch: Incentivize the Search Capability of LLMs without Searching

Python
Bijgewerkt 13 jun 2026

VRAG

947

Multimodal Retrieval-augmented Generation Framework Built by Tongyi Lab, Alibaba Group.

Python
Bijgewerkt 12 jun 2026

ViDoRAG

664

[EMNLP 2025] ViDoRAG: Visual Document Retrieval-Augmented Generation via Dynamic Iterative Reasoning Agents

Python
Bijgewerkt 11 jun 2026

OmniSearch

430

Repo for Benchmarking Multimodal Retrieval Augmented Generation with Dynamic VQA Dataset and Self-adaptive Planning Agent

Python
Bijgewerkt 11 jun 2026

ACE

313

[ACL-IJCNLP 2021] Automated Concatenation of Embeddings for Structured Prediction

Python
Bijgewerkt 1 jun 2026

CHRONOS

300

Repo for NAACL 2025 Paper "Unfolding the Headline: Iterative Self-Questioning for News Retrieval and Timeline Summarization"

Python
Bijgewerkt 12 jun 2026

EcomGPT

275

An Instruction-tuned Large Language Model for E-commerce

Python
Bijgewerkt 12 jun 2026

qqr

254

qqr is an RL training framework for open-ended agents.

Python
Bijgewerkt 10 jun 2026

HiAGM

230

Hierarchy-Aware Global Model for Hierarchical Text Classification

Python
Bijgewerkt 1 jun 2026

SeqGPT

227

SeqGPT: An Out-of-the-box Large Language Model for Open Domain Sequence Understanding

Python
Bijgewerkt 1 jun 2026

Multi-CPR

206

[SIGIR 2022] Multi-CPR: A Multi Domain Chinese Dataset for Passage Retrieval

Python
Bijgewerkt 1 jun 2026

KB-NER

186

Winner system (DAMO-NLP) of SemEval 2022 MultiCoNER shared task over 10 out of 13 tracks.

Python
Bijgewerkt 22 mei 2026

MaskSearch

155

Repo for "MaskSearch: A Universal Pre-Training Framework to Enhance Agentic Search Capability"

Python
Bijgewerkt 6 jun 2026

CLNER

93

[ACL-IJCNLP 2021] Improving Named Entity Recognition by External Context Retrieving and Cooperative Learning

Python
Bijgewerkt 19 mei 2026

MultilangStructureKD

74

[ACL 2020] Structure-Level Knowledge Distillation For Multilingual Sequence Labeling

Python
Bijgewerkt 1 jun 2026

E2Rank

57

E2Rank: Your Text Embedding can Also be an Effective and Efficient Listwise Reranker

Python
Bijgewerkt 10 jun 2026

LaRA

51

The code for LaRA Benchmark

Python
Bijgewerkt 8 jun 2026

CoFE-RAG

45

Geen beschrijving gegeven voor deze repository.

Python
Bijgewerkt 7 jun 2026

RankingGPT

35

code for paper 《RankingGPT: Empowering Large Language Models in Text Ranking with Progressive Enhancement》

Python
Bijgewerkt 9 apr 2026

ProtoRE

32

Code for 'Prototypical Representation Learning for Relation Extraction'.

Python
Bijgewerkt 1 jun 2026

MuVER

32

[EMNLP 2021] MuVER: Improving First-Stage Entity Retrieval with Multi-View Entity Representations

Python
Bijgewerkt 9 apr 2026

AISHELL-NER

25

[ICASSP 2022] AISHELL-NER: Named Entity Recognition from Chinese Speech

Onbekende taal
Bijgewerkt 4 jan 2026

DAAT-CWS

23

Coupling Distant Annotation and Adversarial Training for Cross-Domain Chinese Word Segmentation

Python
Bijgewerkt 1 jun 2026

MANNER

20

[ACL 2023] MANNER: A Variational Memory-Augmented Model for Cross Domain Few-Shot Named Entity Recognition

Python
Bijgewerkt 1 jun 2026

HLATR

20

Hybrid List Aware Transformer Reranking

Onbekende taal
Bijgewerkt 9 apr 2026

AIN

20

Code for our EMNLP 2020 Paper "AIN: Fast and Accurate Sequence Labeling with Approximate Inference Network"

Python
Bijgewerkt 9 apr 2026

CDQA

18

CDQA: Chinese Dynamic Question Answering Benchmark

Python
Bijgewerkt 9 apr 2026

EBM-Net

14

Codes for the EMNLP'2020 paper "Predicting Clinical Trial Results by Implicit Evidence Integration".

Python
Bijgewerkt 27 nov 2024

StructuralKD

11

[ACL-IJCNLP 2021] Structural Knowledge Distillation: Tractably Distilling Information for Structured Predictor

Python
Bijgewerkt 1 jun 2026

WebDetective

7

A new evaluation paradigm for deep search that identifies specific LLM failure sources, introduces challenging hint-free datasets with holistic evaluation, and offers a strong baseline incorporating memory and verification.

Python
Bijgewerkt 1 jun 2026

Vec-RA-ODQA

6

Source code of paper Improving "Retrieval Augmented Open-Domain Question-Answering with Vectorized Contexts

Python
Bijgewerkt 1 jun 2026

IBKD

3

This is the official repository for the IBKD knowledge distillation method, as described in the paper .

Python
Bijgewerkt 1 jun 2026

MarCo-Dialog

3

Geen beschrijving gegeven voor deze repository.

Python
Bijgewerkt 17 mrt 2022

VLLM-KB

2

[EMNLP 2025] Code for "Detecting Knowledge Boundary of Vision Large Language Models by Sampling-Based Inference"

Python
Bijgewerkt 9 apr 2026

Key-Point-Analysis

1

Geen beschrijving gegeven voor deze repository.

Python
Bijgewerkt 29 aug 2024

Gumbel-CRF

1

Implementation of NeurIPS 20 paper: Latent Template Induction with Gumbel-CRFs

Onbekende taal
Bijgewerkt 24 mrt 2024

Partially-Observed-TreeCRFs

1

Implementation of AAAI 21 paper: Nested Named Entity Recognition with Partially Observed TreeCRFs

Onbekende taal
Bijgewerkt 28 feb 2023

hilichurl

0

Geen beschrijving gegeven voor deze repository.

Onbekende taal
Bijgewerkt 13 jan 2026

Triaffine-nested-ner

0

[ACL 2022 Findings] Fusing Heterogeneous Factors with Triaffine Mechanism for Nested Named Entity Recognition

Onbekende taal
Bijgewerkt 1 mei 2022

ICD-MSMN

0

[ACL 2022] Code Synonyms Do Matter: Multiple Synonyms Matching Network for Automatic ICD Coding

Onbekende taal
Bijgewerkt 29 apr 2022

Alibaba-TREC-PM

0

Codes and data for Alibaba's winning systems at the TREC Precision Medicine Track 2020.

Onbekende taal
Bijgewerkt 28 aug 2021

PoincareProbe

0

Implementation of ICLR 21 paper: Probing BERT in Hyperbolic Spaces

Onbekende taal
Bijgewerkt 7 apr 2021

Veelgestelde vragen

Wat bouwt Alibaba-NLP op GitHub?

Alibaba-NLP ontwikkelt verschillende open-source projecten op GitHub, waaronder DeepResearch en ZeroSearch, die zich richten op AI-zoektechnologieën en multimodale retrieval. Deze projecten zijn gericht op het verbeteren van de mogelijkheden van LLMs.

Welke programmeertalen gebruikt Alibaba-NLP?

De primaire programmeertaal die Alibaba-NLP gebruikt voor hun GitHub-projecten is Python. Dit stelt hen in staat om complexe algoritmen en modellen te ontwikkelen voor hun AI-zoektechnologieën.

Zijn de repositories van Alibaba-NLP openbaar?

Ja, de repositories van Alibaba-NLP zijn openbaar toegankelijk op GitHub. Dit biedt transparantie en stelt andere ontwikkelaars in staat om bij te dragen aan of gebruik te maken van hun open-source projecten.

Is deze blootstelling bedoeld?

Monitor Tongyi Lab, Alibaba Group met RepoGuard en krijg een waarschuwing op het moment dat er een nieuwe publieke repository verschijnt.

Monitor dit account