文章詳情頁

基于python實(shí)現(xiàn)獲取網(wǎng)頁圖片過程解析

瀏覽：3日期：2022-07-26 08:15:53

環(huán)境：python3，要安裝bs4這個(gè)第三方庫

獲取請(qǐng)求頭的方法

這里使用的是Chrome瀏覽器。

打開你想查詢的網(wǎng)站，按F12，或者鼠標(biāo)右鍵一下選擇檢查。會(huì)彈出如下的審查元素頁面：

基于python實(shí)現(xiàn)獲取網(wǎng)頁圖片過程解析

然后點(diǎn)擊上方選項(xiàng)中的Network選項(xiàng)：

基于python實(shí)現(xiàn)獲取網(wǎng)頁圖片過程解析

此時(shí)在按Ctrl+R:

基于python實(shí)現(xiàn)獲取網(wǎng)頁圖片過程解析

選擇下方框中的第一個(gè)，單擊：

基于python實(shí)現(xiàn)獲取網(wǎng)頁圖片過程解析

選擇Headers選項(xiàng)，其中就會(huì)有Request Headers，包括你需要的信息。

介紹：這個(gè)程序是用來批量獲取網(wǎng)頁的圖片，用于新手入門

注意：由于是入門的程序在獲取某些網(wǎng)頁的圖片時(shí)會(huì)出問題！！！！！

import osimport urllib.requestfrom bs4 import BeautifulSoup# 網(wǎng)址url = 'http://www2017.tyut.edu.cn/'# 建立請(qǐng)求對(duì)象request = urllib.request.Request(url)# 加入請(qǐng)求頭（一定要換成自己的！！！！）request.add_header(’User-Agent’, ’Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36’)# 獲取請(qǐng)求code = urllib.request.urlopen(request)# 得到html代碼html = code.read().decode(’utf-8’)# 將html的標(biāo)簽轉(zhuǎn)成對(duì)象（方便后面的操作）bs = BeautifulSoup(html, ’html.parser’)# 提取所有的img標(biāo)簽imagesUrl = bs.find_all(’img’)sources = []# 建立存放的路徑（路徑一定要存在！！！！！！）filepath = os.getcwd() + ’images’def createFile(path: str, fpath): urllib.request.urlretrieve(path, fpath)# 獲取圖片的路徑(網(wǎng)址+img標(biāo)簽的src屬性的值)for img in imagesUrl: sources.append(url + str(img.get(’src’)))for src in sources: # 用split是防止請(qǐng)求帶參 baseName = os.path.basename(src).split(’?’) # 圖片名 fileName = filepath + baseName[0] print('url=' + src, 'filename=' + fileName) createFile(src, fileName)print(’這次您一共下載了圖片’ + str(len(sources)) + ’張’)

以上就是本文的全部內(nèi)容，希望對(duì)大家的學(xué)習(xí)有所幫助，也希望大家多多支持好吧啦網(wǎng)。

Python 編程

上一條：python函數(shù)中將變量名轉(zhuǎn)換成字符串實(shí)例下一條：python將unicode和str互相轉(zhuǎn)化的實(shí)現(xiàn)

相關(guān)文章：

1. python爬蟲實(shí)戰(zhàn)之制作屬于自己的一個(gè)IP代理模塊2. Spring如何使用xml創(chuàng)建bean對(duì)象3. python實(shí)現(xiàn)在內(nèi)存中讀寫str和二進(jìn)制數(shù)據(jù)代碼4. python實(shí)現(xiàn)PolynomialFeatures多項(xiàng)式的方法5. HTML 絕對(duì)路徑與相對(duì)路徑概念詳細(xì)6. python 利用toapi庫自動(dòng)生成api7. IntelliJ IDEA設(shè)置默認(rèn)瀏覽器的方法8. Android Studio設(shè)置顏色拾色器工具Color Picker教程9. Java程序的編碼規(guī)范（6）10. python實(shí)現(xiàn)讀取類別頻數(shù)數(shù)據(jù)畫水平條形圖案例

排行榜

					
					python爬蟲實(shí)戰(zhàn)之制作屬于自己的一個(gè)IP代理模塊
python實(shí)現(xiàn)在內(nèi)存中讀寫str和二進(jìn)制數(shù)據(jù)代碼
HTML 絕對(duì)路徑與相對(duì)路徑概念詳細(xì)
python 利用toapi庫自動(dòng)生成api
Java程序的編碼規(guī)范（6）
python實(shí)現(xiàn)PolynomialFeatures多項(xiàng)式的方法
IntelliJ IDEA設(shè)置默認(rèn)瀏覽器的方法
Spring如何使用xml創(chuàng)建bean對(duì)象
Android Studio設(shè)置顏色拾色器工具Color Picker教程
python實(shí)現(xiàn)讀取類別頻數(shù)數(shù)據(jù)畫水平條形圖案例
如何理解PHP核心特性命名空間