文章詳情頁
python - 在編寫scrapy爬蟲的時(shí)候rules中allow的書寫問題
瀏覽:99日期:2022-08-01 16:58:44
問題描述
在編寫爬取58同城二手手機(jī)出售的信息的時(shí)候,rules里的allow應(yīng)該怎么寫?它里面給出的下一頁或者第二頁第三頁等等的鏈接給出的都是縮減的鏈接,那么rules里的allow應(yīng)該要怎么寫呢?有哪位高手可以指點(diǎn)一二嘛?謝謝~
問題解答
回答1:縮減的鏈接可以用urljoin()組合啊
相關(guān)文章:
1. mysql - 分庫分表、分區(qū)、讀寫分離 這些都是用在什么場(chǎng)景下 ,會(huì)帶來哪些效率或者其他方面的好處2. javascript - ios返回不執(zhí)行js怎么解決?3. python - 爬蟲模擬登錄后,爬取csdn后臺(tái)文章列表遇到的問題4. 視頻文件不能播放,怎么辦?5. python bottle跑起來以后,定時(shí)執(zhí)行的任務(wù)為什么每次都重復(fù)(多)執(zhí)行一次?6. html5 - HTML代碼中的文字亂碼是怎么回事?7. javascript - 求幫助 , ATOM不顯示界面!!!!8. mysql 查詢身份證號(hào)字段值有效的數(shù)據(jù)9. javascript - angular使從elastichearch中取出的文本高亮顯示,如圖所示10. javascript - 為什么在谷歌控制臺(tái) 輸出1的時(shí)候,輸出的1立馬就不見了
排行榜

熱門標(biāo)簽