RepoGuard
Mis à jour 6 min ago
Scrapy project

Organization

Empreinte publique GitHub de Scrapy project

@scrapy
Voir le profil sur GitHub

An open source and collaborative framework for extracting the data you need from websites. In a fast, simple, yet extensible way.

29

Dépôts publics

74 290

Total des étoiles

809

Abonnés

Langues principales

Python 22HTML 2C++ 2DIGITAL Command Language 1Shell 1

Dépôts publics

scrapy

62 237

Scrapy, a fast high-level web crawling & scraping framework for Python.

Python
Mis à jour 13 juin 2026

scrapyd

3 095

A service daemon to run Scrapy spiders

Python
Mis à jour 13 juin 2026

scrapely

1 888

A pure-python HTML screen-scraping library

HTML
Mis à jour 9 juin 2026

dirbot

1 628

Scrapy project to scrape public web directories (educational) [DEPRECATED]

Python
Mis à jour 12 juin 2026

quotesbot

1 357

This is a sample Scrapy project for educational purposes

Python
Mis à jour 8 juin 2026

parsel

1 333

Parsel lets you extract data from XML/HTML documents using XPath or CSS selectors

Python
Mis à jour 11 juin 2026

scrapyd-client

773

Command line client for Scrapyd server

Python
Mis à jour 3 juin 2026

w3lib

419

Python library of web-related functions

Python
Mis à jour 10 juin 2026

cssselect

309

CSS Selectors for Python

Python
Mis à jour 1 juin 2026

queuelib

299

Collection of persistent (disk-based) and non-persistent (memory-based) queues for Python

Python
Mis à jour 1 juin 2026

loginform

279

Fill HTML login forms automatically

Python
Mis à jour 29 mars 2026

slybot

224

Aucune description fournie pour ce dépôt.

Langue inconnue
Mis à jour 12 juin 2026

protego

88

A pure-Python robots.txt parser with support for modern conventions.

DIGITAL Command Language
Mis à jour 11 juin 2026

itemadapter

70

Common interface for data container classes

Python
Mis à jour 1 juin 2026

scrapy.org

66

The scrapy.org website (old code)

HTML
Mis à jour 3 juin 2026

itemloaders

49

Library to populate items using XPath and CSS with a convenient API

Python
Mis à jour 2 juin 2026

booksbot

42

A crawler for http://books.toscrape.com

Python
Mis à jour 8 déc. 2025

scrapy-bench

32

A CLI for benchmarking Scrapy.

Python
Mis à jour 15 sept. 2025

scrapy-lint

22

A linter for Scrapy projects.

Python
Mis à jour 15 avr. 2026

scurl

21

Performance-focused replacement for Python urllib

Python
Mis à jour 26 mai 2026

pypydispatcher

16

A fork of http://pydispatcher.sourceforge.net/ with PyPy support

Python
Mis à jour 12 juin 2024

xtractmime

13

https://mimesniff.spec.whatwg.org/ implementation for Python

Python
Mis à jour 10 juin 2026

base-chromium

8

base component forked from Chromium source https://chromium.googlesource.com/chromium/src/base/

C++
Mis à jour 10 mars 2026

scrapy-itemloader

7

[Archived] Library to populate Scrapy items using XPath and CSS with a convenient API

Python
Mis à jour 10 mars 2026

form2request

5

Python library to build HTTP requests out of HTML forms

Python
Mis à jour 12 juin 2026

url-chromium

4

url component from Chromium source code, forked from https://chromium.googlesource.com/chromium/src/url

C++
Mis à jour 10 mars 2026

gsoc2014-integration-tests

3

GSoC2014 - Scrapy Integration tests project

Shell
Mis à jour 6 juil. 2017

scrapy-bench-speedcenter

2

Codespeed for scrapy-bench

Python
Mis à jour 26 mai 2026

sphinx-scrapy

1

Sphinx extension for documentation in the Scrapy ecosystem

Python
Mis à jour 11 juin 2026

Cette exposition est-elle intentionnelle ?

Surveillez Scrapy project avec RepoGuard et soyez alerté dès qu'un nouveau dépôt public apparaît.

Surveiller ce compte