文章詳情頁

linux - python 抓取公眾號文章遇到驗證問題

瀏覽：111日期：2022-06-25 14:22:41

問題描述

linux 下抓取微信公眾號文章遇到驗證問題！！！！！！！！

這是我要抓取的人民日報鏈接：http://mp.weixin.qq.com/profile?src=3&timestamp=1492739045&ver=1&signature=bSSQMK1LY77M4O22qTi37cbhjhwNV7C9V4aor9HLhAvbGc2ybWX*qg3WqxntZ7iq0kvYe87oPpcSJKFdmGMx5g==1：首先瀏覽器上訪問是正常的。2：linux下訪問提示需要驗證，以下是簡單的代碼

url = http://mp.weixin.qq.com/profile?src=3&timestamp=1492738883&ver=1&signature=bSSQMK1LY77M4O22qTi37cbhjhwNV7C9V4aor9HLhAvbGc2ybWX*qg3WqxntZ7iq2xTLUTfxAMzK79UGvalY1A==response = urllib2.urlopen(url)print response.read()

訪問的結果如下： linux - python 抓取公眾號文章遇到驗證問題

補充說明下公眾號鏈接的獲取方式：1：先訪問鏈接：http://weixin.sogou.com/weixi...2：再獲取人民日報公眾號的鏈接進行跳轉。

問題解答

回答1：

都不模擬header請求頭的，就能抓取嗎，建議先模擬request header再試一下

回答2：

# coding: utf-8import requestsheaders = {}headers[’User-Agent’] = ’Mozilla/5.0 (Windows NT 10.0; WOW64; rv:52.0) Gecko/20100101 Firefox/52.0’url = ’http://mp.weixin.qq.com/profile?src=3&timestamp=1492739045&ver=1&signature=bSSQMK1LY77M4O22qTi37cbhjhwNV7C9V4aor9HLhAvbGc2ybWX*qg3WqxntZ7iq0kvYe87oPpcSJKFdmGMx5g==’r = requests.get(url, headers=headers)print r.text回答3：

linux - python 抓取公眾號文章遇到驗證問題

現在在請求中加了header后，返回的錯誤是這樣的。請各位大神麻煩再支下招

回答4：用request可以,本地環境Mac OSX , python3.6.1

import requestsheaders = {’user-agent’ : ’Mozilla/5.0’}respon = requests.get(’http://mp.weixin.qq.com/profile?src=3&timestamp=1492831080&ver=1&signature=bSSQMK1LY77M4O22qTi37cbhjhwNV7C9V4aor9HLhAvbGc2ybWX*qg3WqxntZ7iqB7vsPUlOS3zhl-8n5FUODg==’, headers = headers)respon.encoding = ’utf-8’print(respon.text)內容在紅色框那一行

linux - python 抓取公眾號文章遇到驗證問題

Python 編程

上一條：python - linux 下用wsgifunc 運行web.py該如何修改代碼下一條：linux - python 安裝 Anaconda 環境變量問題請教

相關文章：

1. python - 使用from XXX import (XXX, XXX, XXX,) 導入模塊時, 括號()的意義何在?2. javascript - 有適合開發手機端Html5網頁小游戲的前端框架嗎？3. python判斷字符串相等？4. python - pandas按照列A和列B分組，將列C求平均數，怎樣才能生成一個列A,B,C的dataframe5. MySQL中的enum類型有什么優點？6. c++ - 如何在python的阻塞的函數中獲取變量值7. pdo - mysql 簡單注入疑問8. 谷歌訪問助手安裝不了9. html5 - 在一個頁面中初始了兩個swiper 不知道哪里錯了一直不對10. Python中使用超長的List導致內存占用過大

排行榜

					
					html5 - 在一個頁面中 初始了兩個swiper 不知道哪里錯了 一直不對
java中Enumeration與Enum兩個接口沒什么區別呀？
pdo - mysql 簡單注入疑問
java - android 有沒有離線版的sdk文檔 不用聯網就可以本地查找的，提高查閱文檔的速度？
docker容器呢SSH為什么連不通呢？
docker綁定了nginx端口 外部訪問不到
javascript - main head .intro-text{width:40%} main head{display:flex}為何無效？
css - input中transition 設置background-color過渡，chrome瀏覽器頁面初始化渲染會有過度效果
javascript - webpack打包css 導致頁面加載樣式慢 FOUC
html - css氣泡，實現“倒三角（不知道算不算三角了）”可透明的。
javascript - 表單ajax提交后跳轉,手機按返回又進入這個表單頁了!!
				

熱門標簽

av一区二区在线观看_亚洲男人的天堂网站_日韩亚洲视频_在线成人免费_欧美日韩精品免费观看视频_久草视

linux - python 抓取公眾號文章遇到驗證問題