文章詳情頁

python cookie反爬處理的實現

瀏覽：107日期：2022-07-06 16:27:19

Cookies的處理

作用保存客戶端的相關狀態

在爬蟲中如果遇到了cookie的反爬如何處理?

手動處理在抓包工具中捕獲cookie,將其封裝在headers中應用場景:cookie沒有有效時長且不是動態變化

自動處理使用session機制使用場景:動態變化的cookie session對象:該對象和requests模塊用法幾乎一致.如果在請求的過程中產生了cookie,如果該請求使用session發起的,則cookie會被自動存儲到session中.

案例

爬取雪球網中的新聞資訊數據:https://xueqiu.com/

#獲取一個session對象import requestsheaders = { ’User-Agent’:’Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36’}session = requests.Session()main_url = ’https://xueqiu.com’ #推測對該url發起請求會產生cookiesession.get(main_url,headers=headers)url = ’https://xueqiu.com/v4/statuses/public_timeline_by_category.json’params = { ’since_id’: ’-1’, ’max_id’: ’20346152’, ’count’: ’15’, ’category’: ’-1’,}page_text = session.get(url,headers=headers,params=params).json()page_text

到此這篇關于python cookie反爬處理的實現的文章就介紹到這了,更多相關python cookie反爬內容請搜索好吧啦網以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持好吧啦網！

Python 編程

上一條：Windows環境下Python3.6.8 importError: DLLload failed:找不到指定的模塊下一條：python Cartopy的基礎使用詳解

相關文章：

1. python爬蟲實戰之制作屬于自己的一個IP代理模塊2. 詳解Java實現拓撲排序算法3. python 基于Appium控制多設備并行執行4. python 實現圍棋游戲(純tkinter gui)5. 解決ajax請求后臺,有時收不到返回值的問題6. Python編寫nmap掃描工具7. .NET6打包部署到Windows Service的全過程8. .Net Core和RabbitMQ限制循環消費的方法9. HTML 絕對路徑與相對路徑概念詳細10. python 利用toapi庫自動生成api

排行榜

					
					python爬蟲實戰之制作屬于自己的一個IP代理模塊
python 實現圍棋游戲(純tkinter gui)
詳解Java實現拓撲排序算法
python 基于Appium控制多設備并行執行
Python編寫nmap掃描工具
python實現在內存中讀寫str和二進制數據代碼
IDEA部署Docker到WSL2的詳細過程
IntelliJ IDEA刪除類的方法步驟
HTML 絕對路徑與相對路徑概念詳細
python 利用toapi庫自動生成api
.Net Core和RabbitMQ限制循環消費的方法