Zaktualizowane 10 h ago

Organization

Publiczne ślady GitHub Scrapy project

An open source and collaborative framework for extracting the data you need from websites. In a fast, simple, yet extensible way.

Publiczne repozytoria

74 276

Łączna liczba gwiazdek

808

Obserwujący

Organizacja Scrapy na GitHubie prowadzi szereg projektów open source, które koncentrują się na ekstrakcji danych z witryn internetowych. Wśród jej publicznych repozytoriów znajdują się znane projekty, takie jak scrapy, scrapyd oraz parsel, które są napisane głównie w językach Python, HTML oraz C++. Ich obecność na GitHubie zwiększa widoczność i dostępność tych narzędzi dla społeczności programistycznej.

Najpopularniejsze języki

Python 22HTML 2C++ 2DIGITAL Command Language 1Shell 1

Publiczne repozytoria

scrapy

★62 224

Scrapy, a fast high-level web crawling & scraping framework for Python.

Python

Zaktualizowane 13 cze 2026

scrapyd

★3094

A service daemon to run Scrapy spiders

Python

Zaktualizowane 13 cze 2026

scrapely

★1888

A pure-python HTML screen-scraping library

HTML

Zaktualizowane 9 cze 2026

dirbot

★1628

Scrapy project to scrape public web directories (educational) [DEPRECATED]

Python

Zaktualizowane 12 cze 2026

quotesbot

★1357

This is a sample Scrapy project for educational purposes

Python

Zaktualizowane 8 cze 2026

parsel

★1333

Parsel lets you extract data from XML/HTML documents using XPath or CSS selectors

Python

Zaktualizowane 11 cze 2026

scrapyd-client

★773

Command line client for Scrapyd server

Python

Zaktualizowane 3 cze 2026

w3lib

★419

Python library of web-related functions

Python

Zaktualizowane 10 cze 2026

cssselect

★309

CSS Selectors for Python

Python

Zaktualizowane 1 cze 2026

queuelib

★299

Collection of persistent (disk-based) and non-persistent (memory-based) queues for Python

Python

Zaktualizowane 1 cze 2026

loginform

★279

Fill HTML login forms automatically

Python

Zaktualizowane 29 mar 2026

slybot

★224

Brak opisu dla tego repozytorium.

Nieznany język

Zaktualizowane 12 cze 2026

protego

★88

A pure-Python robots.txt parser with support for modern conventions.

DIGITAL Command Language

Zaktualizowane 11 cze 2026

itemadapter

★70

Common interface for data container classes

Python

Zaktualizowane 1 cze 2026

scrapy.org

★66

The scrapy.org website (old code)

HTML

Zaktualizowane 3 cze 2026

itemloaders

★49

Library to populate items using XPath and CSS with a convenient API

Python

Zaktualizowane 2 cze 2026

booksbot

★42

A crawler for http://books.toscrape.com

Python

Zaktualizowane 8 gru 2025

scrapy-bench

★32

A CLI for benchmarking Scrapy.

Python

Zaktualizowane 15 wrz 2025

scrapy-lint

★22

A linter for Scrapy projects.

Python

Zaktualizowane 15 kwi 2026

scurl

★21

Performance-focused replacement for Python urllib

Python

Zaktualizowane 26 maj 2026

pypydispatcher

★16

A fork of http://pydispatcher.sourceforge.net/ with PyPy support

Python

Zaktualizowane 12 cze 2024

xtractmime

★13

https://mimesniff.spec.whatwg.org/ implementation for Python

Python

Zaktualizowane 10 cze 2026

base-chromium

★8

base component forked from Chromium source https://chromium.googlesource.com/chromium/src/base/

C++

Zaktualizowane 10 mar 2026

scrapy-itemloader

★7

[Archived] Library to populate Scrapy items using XPath and CSS with a convenient API

Python

Zaktualizowane 10 mar 2026

form2request

★5

Python library to build HTTP requests out of HTML forms

Python

Zaktualizowane 12 cze 2026

url-chromium

★4

url component from Chromium source code, forked from https://chromium.googlesource.com/chromium/src/url

C++

Zaktualizowane 10 mar 2026

gsoc2014-integration-tests

★3

GSoC2014 - Scrapy Integration tests project

Shell

Zaktualizowane 6 lip 2017

scrapy-bench-speedcenter

★2

Codespeed for scrapy-bench

Python

Zaktualizowane 26 maj 2026

sphinx-scrapy

★1

Sphinx extension for documentation in the Scrapy ecosystem

Python

Zaktualizowane 11 cze 2026

Najczęściej zadawane pytania

Co buduje scrapy na GitHubie?

Scrapy buduje framework do web scrapingu i crawlowania, który pozwala na łatwe i szybkie wydobywanie danych z różnych witryn internetowych. Wspiera wiele projektów, takich jak scrapy, scrapyd oraz parsel.

Jakie języki programowania wykorzystuje scrapy?

Scrapy głównie wykorzystuje język Python, ale także HTML, C++, DIGITAL Command Language oraz Shell. Te języki są używane do rozwoju różnych narzędzi i bibliotek dostępnych w repozytoriach organizacji.

Czy repozytoria scrapy są publiczne?

Tak, wszystkie repozytoria organizacji scrapy są publiczne na GitHubie. Dzięki temu społeczność programistyczna ma dostęp do ich kodu źródłowego oraz możliwości wnoszenia wkładu w rozwój projektów.

Czy to ujawnienie jest zamierzone?

Monitoruj Scrapy project z RepoGuard i otrzymuj powiadomienia w momencie, gdy pojawi się nowe publiczne repozytorium.

Monitoruj to konto