RepoGuard
已更新 10 h ago
Scrapy project

Organization

Scrapy project 的公共 GitHub 足迹

@scrapy
在 GitHub 上查看个人资料

An open source and collaborative framework for extracting the data you need from websites. In a fast, simple, yet extensible way.

29

公共仓库

74,276

总星标

808

关注者

Scrapy是一个开源的协作框架,专门用于从网站中提取所需数据。其在GitHub上的公共存在包括使用Python、HTML和C++等多种编程语言的多个广泛使用的项目,如Scrapy、scrapyd和scrapely等。这些项目在数据抓取和网页爬虫领域具有重要影响。

顶级语言

Python 22HTML 2C++ 2DIGITAL Command Language 1Shell 1

公共仓库

scrapy

62,224

Scrapy, a fast high-level web crawling & scraping framework for Python.

Python
已更新 2026年6月13日

scrapyd

3,094

A service daemon to run Scrapy spiders

Python
已更新 2026年6月13日

scrapely

1,888

A pure-python HTML screen-scraping library

HTML
已更新 2026年6月9日

dirbot

1,628

Scrapy project to scrape public web directories (educational) [DEPRECATED]

Python
已更新 2026年6月12日

quotesbot

1,357

This is a sample Scrapy project for educational purposes

Python
已更新 2026年6月8日

parsel

1,333

Parsel lets you extract data from XML/HTML documents using XPath or CSS selectors

Python
已更新 2026年6月11日

scrapyd-client

773

Command line client for Scrapyd server

Python
已更新 2026年6月3日

w3lib

419

Python library of web-related functions

Python
已更新 2026年6月10日

cssselect

309

CSS Selectors for Python

Python
已更新 2026年6月1日

queuelib

299

Collection of persistent (disk-based) and non-persistent (memory-based) queues for Python

Python
已更新 2026年6月1日

loginform

279

Fill HTML login forms automatically

Python
已更新 2026年3月29日

slybot

224

此仓库未提供描述。

未知语言
已更新 2026年6月12日

protego

88

A pure-Python robots.txt parser with support for modern conventions.

DIGITAL Command Language
已更新 2026年6月11日

itemadapter

70

Common interface for data container classes

Python
已更新 2026年6月1日

scrapy.org

66

The scrapy.org website (old code)

HTML
已更新 2026年6月3日

itemloaders

49

Library to populate items using XPath and CSS with a convenient API

Python
已更新 2026年6月2日

booksbot

42

A crawler for http://books.toscrape.com

Python
已更新 2025年12月8日

scrapy-bench

32

A CLI for benchmarking Scrapy.

Python
已更新 2025年9月15日

scrapy-lint

22

A linter for Scrapy projects.

Python
已更新 2026年4月15日

scurl

21

Performance-focused replacement for Python urllib

Python
已更新 2026年5月26日

pypydispatcher

16

A fork of http://pydispatcher.sourceforge.net/ with PyPy support

Python
已更新 2024年6月12日

xtractmime

13

https://mimesniff.spec.whatwg.org/ implementation for Python

Python
已更新 2026年6月10日

base-chromium

8

base component forked from Chromium source https://chromium.googlesource.com/chromium/src/base/

C++
已更新 2026年3月10日

scrapy-itemloader

7

[Archived] Library to populate Scrapy items using XPath and CSS with a convenient API

Python
已更新 2026年3月10日

form2request

5

Python library to build HTTP requests out of HTML forms

Python
已更新 2026年6月12日

url-chromium

4

url component from Chromium source code, forked from https://chromium.googlesource.com/chromium/src/url

C++
已更新 2026年3月10日

gsoc2014-integration-tests

3

GSoC2014 - Scrapy Integration tests project

Shell
已更新 2017年7月6日

scrapy-bench-speedcenter

2

Codespeed for scrapy-bench

Python
已更新 2026年5月26日

sphinx-scrapy

1

Sphinx extension for documentation in the Scrapy ecosystem

Python
已更新 2026年6月11日

常见问题

scrapy在GitHub上构建了什么?

Scrapy在GitHub上构建了一系列与网页抓取和数据提取相关的项目,主要包括Scrapy框架、scrapyd服务守护进程和scrapely HTML抓取库等。

scrapy使用哪些编程语言?

Scrapy的主要编程语言包括Python、HTML、C++、DIGITAL Command Language和Shell。Python是其核心语言,广泛应用于多个项目中。

scrapy的代码库是公开的吗?

是的,scrapy的所有代码库都是公开的,这使得开发者和用户可以自由访问、使用和贡献代码,促进了社区的协作和创新。

这种曝光是有意的吗?

使用 RepoGuard 监控 Scrapy project,并在新公共仓库出现的瞬间提醒您。

监控此账户