網(wǎng)頁(yè)爬蟲 - Python requests.get 爬蟲 設(shè)置代理 IP地址未改變
問(wèn)題描述
工作需要爬取亞馬遜上面的信息,但是亞馬遜反爬蟲太厲害,同一個(gè)IP地址會(huì)被封。Python版本:3.6, IDE:Pycharm 2017.1在網(wǎng)上查了很多資料,requests庫(kù)的手冊(cè)也讀過(guò),但是都是同一個(gè)方法,代碼如下:
import requests’’’代理IP地址(高匿)’’’proxy = {’HTTPS’: ’117.85.105.170:808’}’’’head 信息’’’head = {’User-Agent’: ’Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36’, ’Connection’: ’keep-alive’}’’’http://icanhazip.com會(huì)返回當(dāng)前的IP地址’’’p = requests.get(’http://icanhazip.com’, headers=head, proxies=proxy)print(p.text)
根據(jù)我看過(guò)的許多教程的理論,如果代理設(shè)置成功,最后顯示的IP應(yīng)該是代理的IP地址,但是最終還是我真實(shí)的IP地址,這樣一來(lái)不就等于沒有設(shè)置代理么?
問(wèn)題解答
回答1:proxies在你訪問(wèn)http時(shí)用http的設(shè)置,訪問(wèn)https時(shí)用https的設(shè)置所以你的proxy需要同時(shí)包含http及https的配置,這樣才能生效
proxy = { ’http’: ’http://117.85.105.170:808’, ’https’: ’https://117.85.105.170:808’}
相關(guān)文章:
1. css - 對(duì)于類選擇器使用的問(wèn)題2. angular.js - angular ng-class里面的引號(hào)問(wèn)題3. python - 為什么在main()函數(shù)里result 會(huì)變成那樣?4. javascript - Web微信聊天輸入框解決方案5. docker - 如何修改運(yùn)行中容器的配置6. javascript - 有沒有什么好的圖片懶加載的插件,需要包含監(jiān)聽頁(yè)面滾動(dòng)高度,然后再加載的功能7. 網(wǎng)頁(yè)爬蟲 - 用Python3的requests庫(kù)模擬登陸B(tài)ilibili總是提示驗(yàn)證碼錯(cuò)誤怎么辦?8. mysql無(wú)法添加外鍵9. javascript - es6將類數(shù)組轉(zhuǎn)化成數(shù)組的問(wèn)題10. html - vue項(xiàng)目中用到了elementUI問(wèn)題
