Bijgewerkt 2 h ago

Organization

Publieke GitHub-voetafdruk van Tongyi Lab, Alibaba Group

@Alibaba-NLP

Bekijk profiel op GitHub

Our team at Tongyi Lab is dedicated to pioneer advancements in AI search technologies.

China

Publieke repositories

25.454

Totaal aantal sterren

1.658

Volgers

Alibaba-NLP, onderdeel van Tongyi Lab van Alibaba Group, heeft een actieve aanwezigheid op GitHub met een breed scala aan open-source projecten. De belangrijkste programmeertaal is Python, met opmerkelijke repositories zoals DeepResearch en ZeroSearch, die zich richten op AI-zoektechnologieën en multimodale retrieval-systemen.

Top talen

Python 34

Publieke repositories

DeepResearch

★19.381

Tongyi Deep Research, the Leading Open-source Deep Research Agent

Python

Bijgewerkt 13 jun 2026

ZeroSearch

★1.292

ZeroSearch: Incentivize the Search Capability of LLMs without Searching

Python

Bijgewerkt 13 jun 2026

VRAG

★947

Multimodal Retrieval-augmented Generation Framework Built by Tongyi Lab, Alibaba Group.

Python

Bijgewerkt 12 jun 2026

ViDoRAG

★664

[EMNLP 2025] ViDoRAG: Visual Document Retrieval-Augmented Generation via Dynamic Iterative Reasoning Agents

Python

Bijgewerkt 11 jun 2026

OmniSearch

★430

Repo for Benchmarking Multimodal Retrieval Augmented Generation with Dynamic VQA Dataset and Self-adaptive Planning Agent

Python

Bijgewerkt 11 jun 2026

ACE

★313

[ACL-IJCNLP 2021] Automated Concatenation of Embeddings for Structured Prediction

Python

Bijgewerkt 1 jun 2026

CHRONOS

★300

Repo for NAACL 2025 Paper "Unfolding the Headline: Iterative Self-Questioning for News Retrieval and Timeline Summarization"

Python

Bijgewerkt 12 jun 2026

EcomGPT

★275

An Instruction-tuned Large Language Model for E-commerce

Python

Bijgewerkt 12 jun 2026

qqr

★254

qqr is an RL training framework for open-ended agents.

Python

Bijgewerkt 10 jun 2026

HiAGM

★230

Hierarchy-Aware Global Model for Hierarchical Text Classification

Python

Bijgewerkt 1 jun 2026

SeqGPT

★227

SeqGPT: An Out-of-the-box Large Language Model for Open Domain Sequence Understanding

Python

Bijgewerkt 1 jun 2026

Multi-CPR

★206

[SIGIR 2022] Multi-CPR: A Multi Domain Chinese Dataset for Passage Retrieval

Python

Bijgewerkt 1 jun 2026

KB-NER

★186

Winner system (DAMO-NLP) of SemEval 2022 MultiCoNER shared task over 10 out of 13 tracks.

Python

Bijgewerkt 22 mei 2026

MaskSearch

★155

Repo for "MaskSearch: A Universal Pre-Training Framework to Enhance Agentic Search Capability"

Python

Bijgewerkt 6 jun 2026

CLNER

★93

[ACL-IJCNLP 2021] Improving Named Entity Recognition by External Context Retrieving and Cooperative Learning

Python

Bijgewerkt 19 mei 2026

MultilangStructureKD

★74

[ACL 2020] Structure-Level Knowledge Distillation For Multilingual Sequence Labeling

Python

Bijgewerkt 1 jun 2026

E2Rank

★57

E2Rank: Your Text Embedding can Also be an Effective and Efficient Listwise Reranker

Python

Bijgewerkt 10 jun 2026

LaRA

★51

The code for LaRA Benchmark

Python

Bijgewerkt 8 jun 2026

CoFE-RAG

★45

Geen beschrijving gegeven voor deze repository.

Python

Bijgewerkt 7 jun 2026

RankingGPT

★35

code for paper 《RankingGPT: Empowering Large Language Models in Text Ranking with Progressive Enhancement》

Python

Bijgewerkt 9 apr 2026

ProtoRE

★32

Code for 'Prototypical Representation Learning for Relation Extraction'.

Python

Bijgewerkt 1 jun 2026

MuVER

★32

[EMNLP 2021] MuVER: Improving First-Stage Entity Retrieval with Multi-View Entity Representations

Python

Bijgewerkt 9 apr 2026

AISHELL-NER

★25

[ICASSP 2022] AISHELL-NER: Named Entity Recognition from Chinese Speech

Onbekende taal

Bijgewerkt 4 jan 2026

DAAT-CWS

★23

Coupling Distant Annotation and Adversarial Training for Cross-Domain Chinese Word Segmentation

Python

Bijgewerkt 1 jun 2026

MANNER

★20

[ACL 2023] MANNER: A Variational Memory-Augmented Model for Cross Domain Few-Shot Named Entity Recognition

Python

Bijgewerkt 1 jun 2026

HLATR

★20

Hybrid List Aware Transformer Reranking

Onbekende taal

Bijgewerkt 9 apr 2026

AIN

★20

Code for our EMNLP 2020 Paper "AIN: Fast and Accurate Sequence Labeling with Approximate Inference Network"

Python

Bijgewerkt 9 apr 2026

CDQA

★18

CDQA: Chinese Dynamic Question Answering Benchmark

Python

Bijgewerkt 9 apr 2026

EBM-Net

★14

Codes for the EMNLP'2020 paper "Predicting Clinical Trial Results by Implicit Evidence Integration".

Python

Bijgewerkt 27 nov 2024

StructuralKD

★11

[ACL-IJCNLP 2021] Structural Knowledge Distillation: Tractably Distilling Information for Structured Predictor

Python

Bijgewerkt 1 jun 2026

WebDetective

★7

A new evaluation paradigm for deep search that identifies specific LLM failure sources, introduces challenging hint-free datasets with holistic evaluation, and offers a strong baseline incorporating memory and verification.

Python

Bijgewerkt 1 jun 2026

Vec-RA-ODQA

★6

Source code of paper Improving "Retrieval Augmented Open-Domain Question-Answering with Vectorized Contexts

Python

Bijgewerkt 1 jun 2026

IBKD

★3

This is the official repository for the IBKD knowledge distillation method, as described in the paper .

Python

Bijgewerkt 1 jun 2026

MarCo-Dialog

★3

Geen beschrijving gegeven voor deze repository.

Python

Bijgewerkt 17 mrt 2022

VLLM-KB

★2

[EMNLP 2025] Code for "Detecting Knowledge Boundary of Vision Large Language Models by Sampling-Based Inference"

Python

Bijgewerkt 9 apr 2026

Key-Point-Analysis

★1

Geen beschrijving gegeven voor deze repository.

Python

Bijgewerkt 29 aug 2024

Gumbel-CRF

★1

Implementation of NeurIPS 20 paper: Latent Template Induction with Gumbel-CRFs

Onbekende taal

Bijgewerkt 24 mrt 2024

Partially-Observed-TreeCRFs

★1

Implementation of AAAI 21 paper: Nested Named Entity Recognition with Partially Observed TreeCRFs

Onbekende taal

Bijgewerkt 28 feb 2023

hilichurl

★0

Geen beschrijving gegeven voor deze repository.

Onbekende taal

Bijgewerkt 13 jan 2026

Triaffine-nested-ner

★0

[ACL 2022 Findings] Fusing Heterogeneous Factors with Triaffine Mechanism for Nested Named Entity Recognition

Onbekende taal

Bijgewerkt 1 mei 2022

ICD-MSMN

★0

[ACL 2022] Code Synonyms Do Matter: Multiple Synonyms Matching Network for Automatic ICD Coding

Onbekende taal

Bijgewerkt 29 apr 2022

Alibaba-TREC-PM

★0

Codes and data for Alibaba's winning systems at the TREC Precision Medicine Track 2020.

Onbekende taal

Bijgewerkt 28 aug 2021

PoincareProbe

★0

Implementation of ICLR 21 paper: Probing BERT in Hyperbolic Spaces

Onbekende taal

Bijgewerkt 7 apr 2021

Veelgestelde vragen

Wat bouwt Alibaba-NLP op GitHub?

Alibaba-NLP ontwikkelt verschillende open-source projecten op GitHub, waaronder DeepResearch en ZeroSearch, die zich richten op AI-zoektechnologieën en multimodale retrieval. Deze projecten zijn gericht op het verbeteren van de mogelijkheden van LLMs.

Welke programmeertalen gebruikt Alibaba-NLP?

De primaire programmeertaal die Alibaba-NLP gebruikt voor hun GitHub-projecten is Python. Dit stelt hen in staat om complexe algoritmen en modellen te ontwikkelen voor hun AI-zoektechnologieën.

Zijn de repositories van Alibaba-NLP openbaar?

Ja, de repositories van Alibaba-NLP zijn openbaar toegankelijk op GitHub. Dit biedt transparantie en stelt andere ontwikkelaars in staat om bij te dragen aan of gebruik te maken van hun open-source projecten.

Is deze blootstelling bedoeld?

Monitor Tongyi Lab, Alibaba Group met RepoGuard en krijg een waarschuwing op het moment dat er een nieuwe publieke repository verschijnt.

Monitor dit account