RepoGuard
Actualizado 2 h ago
Explosion

Organization

Huella pública de GitHub de Explosion

@explosion
Ver perfil en GitHub

Software company specializing in developer tools and tailored solutions for AI and Natural Language Processing

Berlin, Germany

79

Repositorios públicos

57.166

Total de estrellas

1488

Seguidores

La organización Explosion tiene una presencia significativa en GitHub, donde se especializa en herramientas para desarrolladores y soluciones personalizadas en inteligencia artificial y procesamiento del lenguaje natural. Sus repositorios principales incluyen spaCy, thinc y modelos de spaCy, y utilizan lenguajes como Python, Cython y JavaScript.

Principales lenguajes

Python 53Cython 5Jupyter Notebook 4C++ 3C 3JavaScript 2TypeScript 2CSS 1

Repositorios públicos

spaCy

33.658

💫 Industrial-strength Natural Language Processing (NLP) in Python

Python
Actualizado 13 jun 2026

thinc

2890

🔮 A refreshing functional take on deep learning, compatible with your favorite libraries

Python
Actualizado 10 jun 2026

spacy-course

2422

👩‍🏫 Advanced NLP with spaCy: A free online course

Python
Actualizado 10 jun 2026

spacy-models

1881

💫 Models for the spaCy Natural Language Processing (NLP) library

Python
Actualizado 13 jun 2026

sense2vec

1672

🦆 Contextually-keyed word vectors

Python
Actualizado 11 jun 2026

projects

1431

🪐 End-to-end NLP workflows from prototype to production

Python
Actualizado 2 jun 2026

spacy-transformers

1406

🛸 Use pretrained transformers like BERT, XLNet and GPT-2 in spaCy

Python
Actualizado 11 jun 2026

spacy-llm

1392

🦙 Integrating LLMs into structured NLP pipelines

Python
Actualizado 5 jun 2026

spacy-layout

903

📚 Process PDFs, Word documents and more with spaCy

Python
Actualizado 6 jun 2026

curated-transformers

896

🤖 A PyTorch library of curated Transformer models and their composable components

Python
Actualizado 5 jun 2026

spacy-streamlit

857

👑 spaCy building blocks and visualizers for Streamlit apps

Python
Actualizado 28 may 2026

spacy-stanza

748

💥 Use the latest Stanza (StanfordNLP) research models directly in spaCy

Python
Actualizado 11 may 2026

prodigy-recipes

507

🍳 Recipes for the Prodigy, our fully scriptable annotation tool

Jupyter Notebook
Actualizado 12 may 2026

srsly

481

🦉 Modern high-performance serialization utilities for Python (JSON, MessagePack, Pickle)

Python
Actualizado 23 mar 2026

wasabi

469

🍣 A lightweight console printing and formatting toolkit

Python
Actualizado 8 may 2026

cymem

461

💥 Cython memory pool for RAII-style memory management

Cython
Actualizado 17 may 2026

displacy

345

:boom: displaCy.js: An open-source NLP visualiser for the modern web

JavaScript
Actualizado 9 abr 2026

floret

341

🌸 fastText + Bloom embeddings for compact, full-coverage vectors with spaCy

C++
Actualizado 12 may 2026

prodigy-openai-recipes

322

✨ Bootstrap annotation with zero- & few-shot learning via OpenAI GPT-3

Python
Actualizado 5 mar 2026

lightnet

320

🌓 Bringing pjreddie's DarkNet out of the shadows #yolo

C
Actualizado 27 ago 2025

spacy-notebooks

288

💫 Jupyter notebooks for spaCy examples and tutorials

Jupyter Notebook
Actualizado 19 may 2026

spacy-services

239

💫 REST microservices for various spaCy-related tasks

Python
Actualizado 17 abr 2026

cython-blis

237

💥 Fast matrix-multiplication as a self-contained Python library – no system dependencies!

C
Actualizado 14 may 2026

displacy-ent

200

:boom: displaCy-ent.js: An open-source named entity visualiser for the modern web

CSS
Actualizado 25 ene 2026

tokenizations

195

Robust and Fast tokenizations alignment library for Rust and Python https://tamuhey.github.io/tokenizations/

Rust
Actualizado 18 may 2026

confection

193

:candy: Confection: the sweetest config system for Python

Python
Actualizado 27 abr 2026

jupyterlab-prodigy

189

🧬 A JupyterLab extension for annotating data with Prodigy

TypeScript
Actualizado 9 may 2026

catalogue

183

Super lightweight function registries for your library

Python
Actualizado 13 jun 2026

spacymoji

182

💙 Emoji handling and meta data for spaCy with custom extension attributes

Python
Actualizado 8 mar 2026

wheelwright

175

🎡 Automated build repo for Python wheels and source packages

Python
Actualizado 9 ene 2026

spacy-dev-resources

123

💫 Scripts, tools and resources for developing spaCy

Python
Actualizado 8 jun 2026

spacy-lookups-data

115

📂 Additional lookup tables and data resources for spaCy

Python
Actualizado 29 mar 2026

radicli

110

🕊️ Radically lightweight command-line interfaces

Python
Actualizado 30 may 2026

spacy-experimental

105

🧪 Cutting-edge experimental spaCy components and features

Python
Actualizado 15 dic 2025

thinc-apple-ops

103

🍏 Make Thinc faster on macOS by calling into Apple's native Accelerate library

Cython
Actualizado 28 mar 2026

weasel

94

🦦 weasel: A small and easy workflow system

Python
Actualizado 27 abr 2026

talks

94

💥 Browser-based slides or PDFs of our talks and presentations

JavaScript
Actualizado 20 ago 2024

healthsea

91

Healthsea is a spaCy pipeline for analyzing user reviews of supplementary products for their effects on health.

Python
Actualizado 12 abr 2026

preshed

88

💥 Cython hash tables that assume keys are pre-hashed

Cython
Actualizado 7 abr 2026

spacy-pkuseg

70

pkuseg多领域中文分词工具; The pkuseg toolkit for multi-domain Chinese word segmentation

Python
Actualizado 13 abr 2026

spacy-huggingface-pipelines

65

💥 Use Hugging Face text and token classification pipelines directly in spaCy

Python
Actualizado 26 may 2026

spacy-ray

56

☄️ Parallel and distributed training with spaCy and Ray

Python
Actualizado 24 jul 2025

murmurhash

47

💥 Cython bindings for MurmurHash2

C++
Actualizado 19 abr 2026

ml-datasets

47

🌊 Machine learning dataset loaders for testing and example scripts

Python
Actualizado 26 mar 2026

spacy-huggingface-hub

45

🤗 Push your spaCy pipelines to the Hugging Face Hub

Python
Actualizado 3 jun 2026

assets

45

💥 Explosion Assets

Idioma desconocido
Actualizado 30 oct 2025

wikid

39

Generate a SQLite database from Wikipedia & Wikidata dumps.

Python
Actualizado 13 may 2026

prodigy-pdf

37

A Prodigy plugin for PDF annotation

Python
Actualizado 9 feb 2026

spacy-alignments

35

💫 A spaCy package for Yohei Tamura's Rust tokenizations library

Python
Actualizado 27 mar 2026

spacy-curated-transformers

32

spaCy entry points for Curated Transformers

Python
Actualizado 27 mar 2026

spacy-vscode

32

spaCy extension for Visual Studio Code

Python
Actualizado 25 feb 2026

vscode-prodigy

30

🧬 A VS Code extension for annotating data with Prodigy

TypeScript
Actualizado 11 jun 2024

prodigy-hf

21

Train huggingface models on top of Prodigy annotations

Python
Actualizado 19 nov 2024

spacy-benchmarks

20

💫 Runtime performance comparison of spaCy against other NLP libraries

Python
Actualizado 27 ene 2023

os-signpost

18

Wrapper for the macOS signpost API

Cython
Actualizado 5 jun 2026

spacy-vectors-builder

18

🌸 Train floret vectors

Python
Actualizado 16 sept 2024

conll-2012

13

A slightly cleaned up version of the scripts & data for the CoNLL 2012 Coreference task.

Python
Actualizado 30 may 2026

prodigy-evaluate

13

🔎 A Prodigy plugin for evaluating spaCy pipelines

Python
Actualizado 23 nov 2024

curated-tokenizers

12

Lightweight piece tokenization library

Cython
Actualizado 28 oct 2024

spacy-loggers

12

📟 Logging utilities for spaCy

Python
Actualizado 6 may 2024

prodigy-segment

10

Select pixels in Prodigy via Facebook's Segment-Anything model.

Python
Actualizado 19 nov 2025

thinc_gpu_ops

9

🔮 GPU kernels for Thinc

C++
Actualizado 28 ene 2023

prodigy-ann

5

A Prodigy pluging for ANN techniques

Python
Actualizado 23 nov 2025

prodigy-whisper

5

Audio transcription with OpenAI's whisper model in the loop.

Python
Actualizado 4 dic 2024

spacy-legacy

4

🕸️ Legacy architectures and other registered spaCy v3.x functions for backwards-compatibility

Python
Actualizado 4 ene 2024

princetondh

4

Code for our presentation in Princeton DH 2023 April.

Jupyter Notebook
Actualizado 19 dic 2023

prodigy-lunr

3

A Prodigy plugin for document search via LUNR

Python
Actualizado 4 abr 2025

ec2buildwheel

3

No se proporcionó descripción para este repositorio.

Python
Actualizado 4 abr 2025

fastapi-explosion-extras

2

No se proporcionó descripción para este repositorio.

Python
Actualizado 4 may 2026

.github

2

:octocat: GitHub settings

Idioma desconocido
Actualizado 26 oct 2025

span-labeling-datasets

2

Loaders for various span labeling datasets

Python
Actualizado 31 dic 2024

spacy-biaffine-parser

1

No se proporcionó descripción para este repositorio.

Python
Actualizado 8 may 2024

aiGrunn-2023

1

Materials for the aiGrunn 2023 talk on spaCy Transformer pipelines

Python
Actualizado 10 nov 2023

spacy-io-binder

1

📒 Repository used to build Binder images for the interactive spaCy code examples

Jupyter Notebook
Actualizado 23 ene 2023

blis

1

BLAS-like Library Instantiation Software Framework

C
Actualizado 16 sept 2022

ellf-terraform-cluster

0

Terraform definitions for self-hosted Ellf clusters

HCL
Actualizado 9 jun 2026

gha-cibuildwheel

0

No se proporcionó descripción para este repositorio.

Idioma desconocido
Actualizado 24 mar 2026

curated-transformers-addons

0

Add-ons for Curated Transformers

Python
Actualizado 4 oct 2023

nginx_acm_ssl_proxy

0

Nginx container that allows for environmental variable use to set nginx configuration.

Shell
Actualizado 19 ago 2022

Preguntas frecuentes

¿Qué construye explosion en GitHub?

Explosion desarrolla una variedad de herramientas y bibliotecas enfocadas en procesamiento del lenguaje natural. Sus proyectos más destacados incluyen spaCy, thinc y spacy-course, que son utilizados por desarrolladores y investigadores en el campo de la inteligencia artificial.

¿Qué lenguajes de programación utiliza explosion?

Explosion utiliza principalmente Python, Cython, Jupyter Notebook, C++, C y JavaScript en sus proyectos. Esta diversidad de lenguajes permite la creación de soluciones versátiles y eficientes para el procesamiento del lenguaje natural.

¿Son públicos los repositorios de explosion?

Sí, todos los repositorios de explosion son públicos en GitHub. Esto permite que la comunidad acceda a sus herramientas y contribuciones, fomentando la colaboración y el uso compartido en el ámbito del procesamiento del lenguaje natural.

¿Esta exposición es intencionada?

Monitorea a Explosion con RepoGuard y recibe alertas en el momento en que aparece un nuevo repositorio público.

Monitorea esta cuenta