RepoGuard
Atualizado 2 h ago
Explosion

Organization

Pegada pública no GitHub de Explosion

@explosion
Ver perfil no GitHub

Software company specializing in developer tools and tailored solutions for AI and Natural Language Processing

Berlin, Germany

79

Repositórios públicos

57.166

Total de estrelas

1.488

Seguidores

A organização Explosion possui uma presença significativa no GitHub, com uma ampla gama de repositórios focados em ferramentas para desenvolvedores e soluções personalizadas em Inteligência Artificial e Processamento de Linguagem Natural. As principais linguagens utilizadas incluem Python e Cython, com repositórios notáveis como spaCy e thinc, que são amplamente utilizados na comunidade de desenvolvedores.

Principais linguagens

Python 53Cython 5Jupyter Notebook 4C++ 3C 3JavaScript 2TypeScript 2CSS 1

Repositórios públicos

spaCy

33.658

💫 Industrial-strength Natural Language Processing (NLP) in Python

Python
Atualizado 13 de jun. de 2026

thinc

2.890

🔮 A refreshing functional take on deep learning, compatible with your favorite libraries

Python
Atualizado 10 de jun. de 2026

spacy-course

2.422

👩‍🏫 Advanced NLP with spaCy: A free online course

Python
Atualizado 10 de jun. de 2026

spacy-models

1.881

💫 Models for the spaCy Natural Language Processing (NLP) library

Python
Atualizado 13 de jun. de 2026

sense2vec

1.672

🦆 Contextually-keyed word vectors

Python
Atualizado 11 de jun. de 2026

projects

1.431

🪐 End-to-end NLP workflows from prototype to production

Python
Atualizado 2 de jun. de 2026

spacy-transformers

1.406

🛸 Use pretrained transformers like BERT, XLNet and GPT-2 in spaCy

Python
Atualizado 11 de jun. de 2026

spacy-llm

1.392

🦙 Integrating LLMs into structured NLP pipelines

Python
Atualizado 5 de jun. de 2026

spacy-layout

903

📚 Process PDFs, Word documents and more with spaCy

Python
Atualizado 6 de jun. de 2026

curated-transformers

896

🤖 A PyTorch library of curated Transformer models and their composable components

Python
Atualizado 5 de jun. de 2026

spacy-streamlit

857

👑 spaCy building blocks and visualizers for Streamlit apps

Python
Atualizado 28 de mai. de 2026

spacy-stanza

748

💥 Use the latest Stanza (StanfordNLP) research models directly in spaCy

Python
Atualizado 11 de mai. de 2026

prodigy-recipes

507

🍳 Recipes for the Prodigy, our fully scriptable annotation tool

Jupyter Notebook
Atualizado 12 de mai. de 2026

srsly

481

🦉 Modern high-performance serialization utilities for Python (JSON, MessagePack, Pickle)

Python
Atualizado 23 de mar. de 2026

wasabi

469

🍣 A lightweight console printing and formatting toolkit

Python
Atualizado 8 de mai. de 2026

cymem

461

💥 Cython memory pool for RAII-style memory management

Cython
Atualizado 17 de mai. de 2026

displacy

345

:boom: displaCy.js: An open-source NLP visualiser for the modern web

JavaScript
Atualizado 9 de abr. de 2026

floret

341

🌸 fastText + Bloom embeddings for compact, full-coverage vectors with spaCy

C++
Atualizado 12 de mai. de 2026

prodigy-openai-recipes

322

✨ Bootstrap annotation with zero- & few-shot learning via OpenAI GPT-3

Python
Atualizado 5 de mar. de 2026

lightnet

320

🌓 Bringing pjreddie's DarkNet out of the shadows #yolo

C
Atualizado 27 de ago. de 2025

spacy-notebooks

288

💫 Jupyter notebooks for spaCy examples and tutorials

Jupyter Notebook
Atualizado 19 de mai. de 2026

spacy-services

239

💫 REST microservices for various spaCy-related tasks

Python
Atualizado 17 de abr. de 2026

cython-blis

237

💥 Fast matrix-multiplication as a self-contained Python library – no system dependencies!

C
Atualizado 14 de mai. de 2026

displacy-ent

200

:boom: displaCy-ent.js: An open-source named entity visualiser for the modern web

CSS
Atualizado 25 de jan. de 2026

tokenizations

195

Robust and Fast tokenizations alignment library for Rust and Python https://tamuhey.github.io/tokenizations/

Rust
Atualizado 18 de mai. de 2026

confection

193

:candy: Confection: the sweetest config system for Python

Python
Atualizado 27 de abr. de 2026

jupyterlab-prodigy

189

🧬 A JupyterLab extension for annotating data with Prodigy

TypeScript
Atualizado 9 de mai. de 2026

catalogue

183

Super lightweight function registries for your library

Python
Atualizado 13 de jun. de 2026

spacymoji

182

💙 Emoji handling and meta data for spaCy with custom extension attributes

Python
Atualizado 8 de mar. de 2026

wheelwright

175

🎡 Automated build repo for Python wheels and source packages

Python
Atualizado 9 de jan. de 2026

spacy-dev-resources

123

💫 Scripts, tools and resources for developing spaCy

Python
Atualizado 8 de jun. de 2026

spacy-lookups-data

115

📂 Additional lookup tables and data resources for spaCy

Python
Atualizado 29 de mar. de 2026

radicli

110

🕊️ Radically lightweight command-line interfaces

Python
Atualizado 30 de mai. de 2026

spacy-experimental

105

🧪 Cutting-edge experimental spaCy components and features

Python
Atualizado 15 de dez. de 2025

thinc-apple-ops

103

🍏 Make Thinc faster on macOS by calling into Apple's native Accelerate library

Cython
Atualizado 28 de mar. de 2026

weasel

94

🦦 weasel: A small and easy workflow system

Python
Atualizado 27 de abr. de 2026

talks

94

💥 Browser-based slides or PDFs of our talks and presentations

JavaScript
Atualizado 20 de ago. de 2024

healthsea

91

Healthsea is a spaCy pipeline for analyzing user reviews of supplementary products for their effects on health.

Python
Atualizado 12 de abr. de 2026

preshed

88

💥 Cython hash tables that assume keys are pre-hashed

Cython
Atualizado 7 de abr. de 2026

spacy-pkuseg

70

pkuseg多领域中文分词工具; The pkuseg toolkit for multi-domain Chinese word segmentation

Python
Atualizado 13 de abr. de 2026

spacy-huggingface-pipelines

65

💥 Use Hugging Face text and token classification pipelines directly in spaCy

Python
Atualizado 26 de mai. de 2026

spacy-ray

56

☄️ Parallel and distributed training with spaCy and Ray

Python
Atualizado 24 de jul. de 2025

murmurhash

47

💥 Cython bindings for MurmurHash2

C++
Atualizado 19 de abr. de 2026

ml-datasets

47

🌊 Machine learning dataset loaders for testing and example scripts

Python
Atualizado 26 de mar. de 2026

spacy-huggingface-hub

45

🤗 Push your spaCy pipelines to the Hugging Face Hub

Python
Atualizado 3 de jun. de 2026

assets

45

💥 Explosion Assets

Linguagem Desconhecida
Atualizado 30 de out. de 2025

wikid

39

Generate a SQLite database from Wikipedia & Wikidata dumps.

Python
Atualizado 13 de mai. de 2026

prodigy-pdf

37

A Prodigy plugin for PDF annotation

Python
Atualizado 9 de fev. de 2026

spacy-alignments

35

💫 A spaCy package for Yohei Tamura's Rust tokenizations library

Python
Atualizado 27 de mar. de 2026

spacy-curated-transformers

32

spaCy entry points for Curated Transformers

Python
Atualizado 27 de mar. de 2026

spacy-vscode

32

spaCy extension for Visual Studio Code

Python
Atualizado 25 de fev. de 2026

vscode-prodigy

30

🧬 A VS Code extension for annotating data with Prodigy

TypeScript
Atualizado 11 de jun. de 2024

prodigy-hf

21

Train huggingface models on top of Prodigy annotations

Python
Atualizado 19 de nov. de 2024

spacy-benchmarks

20

💫 Runtime performance comparison of spaCy against other NLP libraries

Python
Atualizado 27 de jan. de 2023

os-signpost

18

Wrapper for the macOS signpost API

Cython
Atualizado 5 de jun. de 2026

spacy-vectors-builder

18

🌸 Train floret vectors

Python
Atualizado 16 de set. de 2024

conll-2012

13

A slightly cleaned up version of the scripts & data for the CoNLL 2012 Coreference task.

Python
Atualizado 30 de mai. de 2026

prodigy-evaluate

13

🔎 A Prodigy plugin for evaluating spaCy pipelines

Python
Atualizado 23 de nov. de 2024

curated-tokenizers

12

Lightweight piece tokenization library

Cython
Atualizado 28 de out. de 2024

spacy-loggers

12

📟 Logging utilities for spaCy

Python
Atualizado 6 de mai. de 2024

prodigy-segment

10

Select pixels in Prodigy via Facebook's Segment-Anything model.

Python
Atualizado 19 de nov. de 2025

thinc_gpu_ops

9

🔮 GPU kernels for Thinc

C++
Atualizado 28 de jan. de 2023

prodigy-ann

5

A Prodigy pluging for ANN techniques

Python
Atualizado 23 de nov. de 2025

prodigy-whisper

5

Audio transcription with OpenAI's whisper model in the loop.

Python
Atualizado 4 de dez. de 2024

spacy-legacy

4

🕸️ Legacy architectures and other registered spaCy v3.x functions for backwards-compatibility

Python
Atualizado 4 de jan. de 2024

princetondh

4

Code for our presentation in Princeton DH 2023 April.

Jupyter Notebook
Atualizado 19 de dez. de 2023

prodigy-lunr

3

A Prodigy plugin for document search via LUNR

Python
Atualizado 4 de abr. de 2025

ec2buildwheel

3

Nenhuma descrição fornecida para este repositório.

Python
Atualizado 4 de abr. de 2025

fastapi-explosion-extras

2

Nenhuma descrição fornecida para este repositório.

Python
Atualizado 4 de mai. de 2026

.github

2

:octocat: GitHub settings

Linguagem Desconhecida
Atualizado 26 de out. de 2025

span-labeling-datasets

2

Loaders for various span labeling datasets

Python
Atualizado 31 de dez. de 2024

spacy-biaffine-parser

1

Nenhuma descrição fornecida para este repositório.

Python
Atualizado 8 de mai. de 2024

aiGrunn-2023

1

Materials for the aiGrunn 2023 talk on spaCy Transformer pipelines

Python
Atualizado 10 de nov. de 2023

spacy-io-binder

1

📒 Repository used to build Binder images for the interactive spaCy code examples

Jupyter Notebook
Atualizado 23 de jan. de 2023

blis

1

BLAS-like Library Instantiation Software Framework

C
Atualizado 16 de set. de 2022

ellf-terraform-cluster

0

Terraform definitions for self-hosted Ellf clusters

HCL
Atualizado 9 de jun. de 2026

gha-cibuildwheel

0

Nenhuma descrição fornecida para este repositório.

Linguagem Desconhecida
Atualizado 24 de mar. de 2026

curated-transformers-addons

0

Add-ons for Curated Transformers

Python
Atualizado 4 de out. de 2023

nginx_acm_ssl_proxy

0

Nginx container that allows for environmental variable use to set nginx configuration.

Shell
Atualizado 19 de ago. de 2022

Perguntas frequentes

O que a Explosion constrói no GitHub?

A Explosion constrói uma variedade de ferramentas e bibliotecas no GitHub, com foco em Inteligência Artificial e Processamento de Linguagem Natural. Projetos notáveis incluem spaCy, thinc e spacy-course, que são utilizados por desenvolvedores em todo o mundo.

Quais linguagens de programação a Explosion utiliza?

A Explosion utiliza várias linguagens de programação em seus repositórios, com ênfase em Python e Cython. Outras linguagens como Jupyter Notebook, C++, C e JavaScript também estão presentes em suas contribuições no GitHub.

Os repositórios da Explosion são públicos?

Sim, todos os repositórios da Explosion são públicos no GitHub. Isso permite que desenvolvedores e pesquisadores acessem e contribuam para os projetos, promovendo uma comunidade ativa em torno das ferramentas de Processamento de Linguagem Natural.

Essa exposição é intencional?

Monitore Explosion com o RepoGuard e receba alertas no momento em que um novo repositório público aparecer.

Monitore esta conta