RepoGuard
Aggiornato 10 h ago
Scrapy project

Organization

Impronta pubblica su GitHub di Scrapy project

@scrapy
Visualizza profilo su GitHub

An open source and collaborative framework for extracting the data you need from websites. In a fast, simple, yet extensible way.

29

Repository pubblici

74.276

Stelle totali

808

Follower

Lingue principali

Python 22HTML 2C++ 2DIGITAL Command Language 1Shell 1

Repository pubblici

scrapy

62.224

Scrapy, a fast high-level web crawling & scraping framework for Python.

Python
Aggiornato 13 giu 2026

scrapyd

3094

A service daemon to run Scrapy spiders

Python
Aggiornato 13 giu 2026

scrapely

1888

A pure-python HTML screen-scraping library

HTML
Aggiornato 9 giu 2026

dirbot

1628

Scrapy project to scrape public web directories (educational) [DEPRECATED]

Python
Aggiornato 12 giu 2026

quotesbot

1357

This is a sample Scrapy project for educational purposes

Python
Aggiornato 8 giu 2026

parsel

1333

Parsel lets you extract data from XML/HTML documents using XPath or CSS selectors

Python
Aggiornato 11 giu 2026

scrapyd-client

773

Command line client for Scrapyd server

Python
Aggiornato 3 giu 2026

w3lib

419

Python library of web-related functions

Python
Aggiornato 10 giu 2026

cssselect

309

CSS Selectors for Python

Python
Aggiornato 1 giu 2026

queuelib

299

Collection of persistent (disk-based) and non-persistent (memory-based) queues for Python

Python
Aggiornato 1 giu 2026

loginform

279

Fill HTML login forms automatically

Python
Aggiornato 29 mar 2026

slybot

224

Nessuna descrizione fornita per questo repository.

Lingua sconosciuta
Aggiornato 12 giu 2026

protego

88

A pure-Python robots.txt parser with support for modern conventions.

DIGITAL Command Language
Aggiornato 11 giu 2026

itemadapter

70

Common interface for data container classes

Python
Aggiornato 1 giu 2026

scrapy.org

66

The scrapy.org website (old code)

HTML
Aggiornato 3 giu 2026

itemloaders

49

Library to populate items using XPath and CSS with a convenient API

Python
Aggiornato 2 giu 2026

booksbot

42

A crawler for http://books.toscrape.com

Python
Aggiornato 8 dic 2025

scrapy-bench

32

A CLI for benchmarking Scrapy.

Python
Aggiornato 15 set 2025

scrapy-lint

22

A linter for Scrapy projects.

Python
Aggiornato 15 apr 2026

scurl

21

Performance-focused replacement for Python urllib

Python
Aggiornato 26 mag 2026

pypydispatcher

16

A fork of http://pydispatcher.sourceforge.net/ with PyPy support

Python
Aggiornato 12 giu 2024

xtractmime

13

https://mimesniff.spec.whatwg.org/ implementation for Python

Python
Aggiornato 10 giu 2026

base-chromium

8

base component forked from Chromium source https://chromium.googlesource.com/chromium/src/base/

C++
Aggiornato 10 mar 2026

scrapy-itemloader

7

[Archived] Library to populate Scrapy items using XPath and CSS with a convenient API

Python
Aggiornato 10 mar 2026

form2request

5

Python library to build HTTP requests out of HTML forms

Python
Aggiornato 12 giu 2026

url-chromium

4

url component from Chromium source code, forked from https://chromium.googlesource.com/chromium/src/url

C++
Aggiornato 10 mar 2026

gsoc2014-integration-tests

3

GSoC2014 - Scrapy Integration tests project

Shell
Aggiornato 6 lug 2017

scrapy-bench-speedcenter

2

Codespeed for scrapy-bench

Python
Aggiornato 26 mag 2026

sphinx-scrapy

1

Sphinx extension for documentation in the Scrapy ecosystem

Python
Aggiornato 11 giu 2026

Questa esposizione è intenzionata?

Monitora Scrapy project con RepoGuard e ricevi un avviso nel momento in cui appare un nuovo repository pubblico.

Monitora questo account