av一区二区在线观看_亚洲男人的天堂网站_日韩亚洲视频_在线成人免费_欧美日韩精品免费观看视频_久草视

您的位置:首頁技術文章
文章詳情頁

Python爬蟲基礎之簡單說一下scrapy的框架結構

瀏覽:107日期:2022-06-15 17:22:21
scrapy 框架結構

思考

scrapy 為什么是框架而不是庫? scrapy是如何工作的?項目結構

在開始爬取之前,必須創建一個新的Scrapy項目。進入您打算存儲代碼的目錄中,運行下列命令:

注意:創建項目時,會在當前目錄下新建爬蟲項目的目錄。

這些文件分別是:

scrapy.cfg:項目的配置文件 quotes/:該項目的python模塊。之后您將在此加入代碼 quotes/items.py:項目中的item文件 quotes/middlewares.py:爬蟲中間件、下載中間件(處理請求體與響應體) quotes/pipelines.py:項目中的pipelines文件 quotes/settings.py:項目的設置文件 quotes/spiders/:放置spider代碼的目錄Scrapy原理圖

Python爬蟲基礎之簡單說一下scrapy的框架結構

各個組件的介紹

1.Engine。引擎,處理整個系統的數據流處理、觸發事務,是整個框架的核心。

2.ltem。項目,它定義了爬取結果的數據結構,爬取的數據會被賦值成該ltem對象。

3.Scheduler。調度器,接受引擎發過來的請求并將其加入隊列中,在引擎再次請求的時候將請求提供給引擎。

4.Downloader。下載器,下載網頁內容,并將網頁內容返回給蜘蛛。

5.Spiders。蜘蛛,其內定義了爬取的邏輯和網頁的解析規則,它主要負責解析響應并生成提結果和新的請求。

6.Item Pipeline。項目管道,負責處理由蜘蛛從網頁中抽取的項目,它的主要任務是清洗、驗證和存儲數據。

7.Downloader Middlewares。下載器中間件,位于引擎和下載器之間的鉤子框架,主要處理引擎與下載器之間的請求及響應。

8.Spider Middlewares。蜘蛛中間件,位于引擎和蜘蛛之間的鉤子框架,主要處理蜘蛛輸入的響應和輸出的結果及新的請求。

Python爬蟲基礎之簡單說一下scrapy的框架結構

數據的流動 Scrapy Engine(引擎):負責Spider、ltemPipeline、Downloader、Scheduler中間的通訊,信號、數據傳遞等。 Scheduler(調度器):負責接受引擎發送過來的Request請求,并按照一定的方式進行整理排列,入隊,當引擎需要時,交還給引擎。 Downloader(下載器):負責下載Scrapy Engine(引擎)發送的所有Requests請求,并將其獲取到的Responses交還給Scrapy Engine(引擎),由引擎交給Spider來處理, Spider(爬蟲)?負責處理所有Responses,從中分析提取數據,獲取ltem字段需要的數據,并將需要跟進的URL提交給引擎,再次進入Scheduler(調度器), ltem Pipeline(管道):負責處理Spider中獲取到的ltem,并進行進行后期處理(詳細分析、過濾、存儲等)的地方. Downloader Middlewares(下載中間件):你可以當作是一個可以自定義擴展下載功能的組件。 Spider Middlewares(Spider中間件):你可以理解為是一個可以自定擴展和操作引擎和Spider中間通信的功能組件(比如進入Spider的Responses;和從Spider出去的Requests)

到此這篇關于Python爬蟲基礎之簡單說一下scrapy的框架結構的文章就介紹到這了,更多相關scrapy的框架結構內容請搜索好吧啦網以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持好吧啦網!

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 亚洲视频在线免费观看 | 免费视频99 | 日本二区| 91久久精品一区二区三区 | 国产一区二区欧美 | 中文字幕中文字幕 | 天天拍夜夜爽 | 成人性视频免费网站 | 天堂va在线观看 | 欧美日韩视频在线播放 | 在线国产视频 | 国产一级大片 | 国产一区高清 | jizz在线免费观看 | 九九伊人sl水蜜桃色推荐 | 欧美日韩不卡 | 亚洲精品电影 | 婷婷丁香在线视频 | 亚洲黄色av | 99视频免费播放 | 精品九九 | 91精品国产91久久久久久 | 国产一区二区三区四区在线观看 | 亚洲色在线视频 | 欧美一区二区三区日韩 | 99久久99| 日韩视频精品在线 | 97精品超碰一区二区三区 | 青草久久免费视频 | 欧美日韩在线看 | 人人九九精 | 在线高清免费观看视频 | 男女视频在线观看 | 欧美久久电影 | 韩日精品一区 | 国产精品999 | 玖玖综合网| 国产成人综合在线 | 拍真实国产伦偷精品 | 久久黄色网 | 三级免费网|