av一区二区在线观看_亚洲男人的天堂网站_日韩亚洲视频_在线成人免费_欧美日韩精品免费观看视频_久草视

您的位置:首頁技術文章
文章詳情頁

python中urllib.request和requests的使用及區別詳解

瀏覽:54日期:2022-07-26 13:28:36

urllib.request

我們都知道,urlopen()方法能發起最基本對的請求發起,但僅僅這些在我們的實際應用中一般都是不夠的,可能我們需要加入headers之類的參數,那需要用功能更為強大的Request類來構建了

在不需要任何其他參數配置的時候,可直接通過urlopen()方法來發起一個簡單的web請求

發起一個簡單的請求

import urllib.requesturl=’https://www.douban.com’webPage=urllib.request.urlopen(url)print(webPage)data=webPage.read()print(data)print(data.decode(’utf-8’))

urlopen()方法返回的是一個http.client.HTTPResponse對象,需要通過read()方法做進一步的處理。一般使用read()后,我們需要用decode()進行解碼,通常為utf-8,經過這些步驟后,最終才獲取到我們想要的網頁。

添加Headers信息

import urllib.requesturl=’https://www.douban.com’headers = { ’User-Agent’: ’Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.186 Safari/537.36’, }response=urllib.request.Request(url=url,headers=headers)webPage=urllib.request.urlopen(response)print(webPage.read().decode(’utf-8’))

使用Request類返回的又是一個urllib.request.Request對象了。

通常我們爬取網頁,在構造http請求的時候,都需要加上一些額外信息,什么Useragent,cookie等之類的信息,或者添加代理服務器。往往這些都是一些必要的反爬機制

requests

通常而言,在我們使用python爬蟲時,更建議用requests庫,因為requests比urllib更為便捷,requests可以直接構造get,post請求并發起,而urllib.request只能先構造get,post請求,再發起。

import requestsurl=’https://www.douban.com’headers = { ’User-Agent’: ’Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.186 Safari/537.36’,}get_response = requests.get(url,headers=headers,params=None)post_response=requests.post(url,headers=headers,data=None,json=None)print(post_response)print(get_response.text)print(get_response.content)print(get_response.json)

get_response.text得到的是str數據類型。

get_response.content得到的是Bytes類型,需要進行解碼。作用和get_response.text類似。

get_response.json得到的是json數據。

總而言之,requests是對urllib的進一步封裝,因此在使用上顯得更加的便捷,建議小伙伴們在實際應用當中盡量使用requests。

補充知識:python中urllib.request.Request()與urllib.request.urlopen()區別

蟒蛇中urllib.request.Request()與urllib.request.urlopen()的區別:

相對于urllib.request.urlopen()來說urllib.request.Request是進一步的包裝請求,下面是請求類的源碼示例:

class Request: # 主要看這塊,構造函數中指明了Request進一步包裝請求中可以傳遞的參數有(url,data,headers, # origin_req_host,unverifiable,method) def __init__(self, url, data=None, headers={}, origin_req_host=None, unverifiable=False, method=None): self.full_url = url self.headers = {} self.unredirected_hdrs = {} self._data = None self.data = data self._tunnel_host = None for key, value in headers.items(): self.add_header(key, value) if origin_req_host is None: origin_req_host = request_host(self) self.origin_req_host = origin_req_host self.unverifiable = unverifiable if method: self.method = method pass

我們可以這樣使用(以下是模擬有道字典翻譯發送的請求):

# 請求地址urlurl = 'http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule' # 請求頭request_headers = { ’Host’:’fanyi.youdao.com’, 'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.108 Safari/537.36',} # 發送給服務器的表單form_data = { 'i': word, 'from': 'AUTO', 'to': 'AUTO', 'smartresult': 'dict', 'doctype': 'json', 'version': '2.1', 'keyfrom': 'fanyi.web', 'action': 'FY_BY_REALTIME', 'typoResult': 'false'} # POST發送的data必須為bytes或bytes類型的可迭代對象,不能是字符串form_data = urllib.parse.urlencode(form_data).encode() # 構造請求對象Requestreq = urllib.request.Request(url, data=form_data, headers=request_headers) # 發起請求response = urllib.request.urlopen(req)data = response.read().decode()print(data)

所以,總的來說,如果我們在獲取請求對象時,不需要過多的參數傳遞,我么可以直接選擇urllib.request.urlopen();如果需要進一步的包裝請求,則需要用urllib.request里。的urlopen()進行包裝處理。

以上這篇python中urllib.request和requests的使用及區別詳解就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持好吧啦網。

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 91精品一区二区 | 久久电影一区 | 欧美理伦片在线播放 | 日本成年免费网站 | 欧美成人在线免费 | 亚洲 精品 综合 精品 自拍 | www.中文字幕.com | 一区二区三区久久久 | 欧美日日| 亚洲日产精品 | 国产色黄 | 91精品国产91久久综合桃花 | 日韩欧美在线观看视频 | 免费国产视频在线观看 | 午夜丰满少妇一级毛片 | 久久久久中文字幕 | 自拍偷拍在线视频 | 欧区一欧区二欧区三免费 | 久久久激情视频 | 亚洲一级黄色 | 亚洲日本成人 | 成人在线电影网站 | 中文在线视频观看 | 日韩三级 | 天天看天天摸天天操 | 久久精品国产免费 | 国产a视频 | 91精品国产91久久久久久 | 久久久久久久久久久一区二区 | 欧产日产国产精品99 | 一区二区三区视频在线观看 | 中文字幕伊人 | 欧美亚洲另类丝袜综合网动图 | 久久久久国产一区二区三区四区 | 欧美精品一区二区三区在线播放 | 日本不卡在线观看 | 日韩精品在线免费 | 久久精品免费一区二区 | 亚洲欧美一区二区三区国产精品 | 在线成人一区 | 成人免费看片网 |