RepoGuard
Bijgewerkt 10 h ago
Scrapy project

Organization

Publieke GitHub-voetafdruk van Scrapy project

@scrapy
Bekijk profiel op GitHub

An open source and collaborative framework for extracting the data you need from websites. In a fast, simple, yet extensible way.

29

Publieke repositories

74.276

Totaal aantal sterren

808

Volgers

Het Scrapy-project heeft een breed scala aan openbare repositories op GitHub, met een focus op webscraping en gegevensextractie. De belangrijkste programmeertalen die worden gebruikt zijn Python, HTML en C++. Enkele opmerkelijke repositories zijn scrapy, scrapyd en parsel, die veelvuldig worden gebruikt in de ontwikkeling van webtoepassingen.

Top talen

Python 22HTML 2C++ 2DIGITAL Command Language 1Shell 1

Publieke repositories

scrapy

62.224

Scrapy, a fast high-level web crawling & scraping framework for Python.

Python
Bijgewerkt 13 jun 2026

scrapyd

3.094

A service daemon to run Scrapy spiders

Python
Bijgewerkt 13 jun 2026

scrapely

1.888

A pure-python HTML screen-scraping library

HTML
Bijgewerkt 9 jun 2026

dirbot

1.628

Scrapy project to scrape public web directories (educational) [DEPRECATED]

Python
Bijgewerkt 12 jun 2026

quotesbot

1.357

This is a sample Scrapy project for educational purposes

Python
Bijgewerkt 8 jun 2026

parsel

1.333

Parsel lets you extract data from XML/HTML documents using XPath or CSS selectors

Python
Bijgewerkt 11 jun 2026

scrapyd-client

773

Command line client for Scrapyd server

Python
Bijgewerkt 3 jun 2026

w3lib

419

Python library of web-related functions

Python
Bijgewerkt 10 jun 2026

cssselect

309

CSS Selectors for Python

Python
Bijgewerkt 1 jun 2026

queuelib

299

Collection of persistent (disk-based) and non-persistent (memory-based) queues for Python

Python
Bijgewerkt 1 jun 2026

loginform

279

Fill HTML login forms automatically

Python
Bijgewerkt 29 mrt 2026

slybot

224

Geen beschrijving gegeven voor deze repository.

Onbekende taal
Bijgewerkt 12 jun 2026

protego

88

A pure-Python robots.txt parser with support for modern conventions.

DIGITAL Command Language
Bijgewerkt 11 jun 2026

itemadapter

70

Common interface for data container classes

Python
Bijgewerkt 1 jun 2026

scrapy.org

66

The scrapy.org website (old code)

HTML
Bijgewerkt 3 jun 2026

itemloaders

49

Library to populate items using XPath and CSS with a convenient API

Python
Bijgewerkt 2 jun 2026

booksbot

42

A crawler for http://books.toscrape.com

Python
Bijgewerkt 8 dec 2025

scrapy-bench

32

A CLI for benchmarking Scrapy.

Python
Bijgewerkt 15 sep 2025

scrapy-lint

22

A linter for Scrapy projects.

Python
Bijgewerkt 15 apr 2026

scurl

21

Performance-focused replacement for Python urllib

Python
Bijgewerkt 26 mei 2026

pypydispatcher

16

A fork of http://pydispatcher.sourceforge.net/ with PyPy support

Python
Bijgewerkt 12 jun 2024

xtractmime

13

https://mimesniff.spec.whatwg.org/ implementation for Python

Python
Bijgewerkt 10 jun 2026

base-chromium

8

base component forked from Chromium source https://chromium.googlesource.com/chromium/src/base/

C++
Bijgewerkt 10 mrt 2026

scrapy-itemloader

7

[Archived] Library to populate Scrapy items using XPath and CSS with a convenient API

Python
Bijgewerkt 10 mrt 2026

form2request

5

Python library to build HTTP requests out of HTML forms

Python
Bijgewerkt 12 jun 2026

url-chromium

4

url component from Chromium source code, forked from https://chromium.googlesource.com/chromium/src/url

C++
Bijgewerkt 10 mrt 2026

gsoc2014-integration-tests

3

GSoC2014 - Scrapy Integration tests project

Shell
Bijgewerkt 6 jul 2017

scrapy-bench-speedcenter

2

Codespeed for scrapy-bench

Python
Bijgewerkt 26 mei 2026

sphinx-scrapy

1

Sphinx extension for documentation in the Scrapy ecosystem

Python
Bijgewerkt 11 jun 2026

Veelgestelde vragen

Wat bouwt scrapy op GitHub?

Scrapy ontwikkelt een open source framework voor webscraping en gegevensextractie. Het biedt verschillende repositories zoals scrapy, scrapyd en parsel, die samen een uitgebreide toolkit vormen voor ontwikkelaars.

Welke programmeertalen gebruikt scrapy?

De primaire programmeertalen die door scrapy worden gebruikt zijn Python, HTML, C++, DIGITAL Command Language en Shell. Dit maakt het mogelijk om complexe webscraping-taken efficiënt uit te voeren.

Zijn de repositories van scrapy openbaar?

Ja, alle repositories van scrapy zijn openbaar op GitHub. Dit stelt ontwikkelaars in staat om de code te bekijken, bij te dragen aan projecten en de tools te gebruiken voor hun eigen toepassingen.

Is deze blootstelling bedoeld?

Monitor Scrapy project met RepoGuard en krijg een waarschuwing op het moment dat er een nieuwe publieke repository verschijnt.

Monitor dit account