av一区二区在线观看_亚洲男人的天堂网站_日韩亚洲视频_在线成人免费_欧美日韩精品免费观看视频_久草视

您的位置:首頁技術文章
文章詳情頁

python 爬取免費簡歷模板網站的示例

瀏覽:2日期:2022-07-09 17:14:52

代碼

# 免費的簡歷模板進行爬取本地保存 # http://sc.chinaz.com/jianli/free.html# http://sc.chinaz.com/jianli/free_2.htmlimport requestsfrom lxml import etreeimport osdirName = ’./resumeLibs’if not os.path.exists(dirName): os.mkdir(dirName)headers = { ’User-Agent’:’Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.83 Safari/537.36’}url = ’http://sc.chinaz.com/jianli/free_%d.html’for page in range(1,2): if page == 1: new_url = ’http://sc.chinaz.com/jianli/free.html’ else: new_url = format(url%page) page_text = requests.get(url=new_url,headers=headers).text tree = etree.HTML(page_text) a_list = tree.xpath(’//div[@id='container']/div/p/a’) for a in a_list: a_src = a.xpath(’./@href’)[0] a_title = a.xpath(’./text()’)[0] a_title = a_title.encode(’iso-8859-1’).decode(’utf-8’) # 爬取下載頁面 page_text = requests.get(url=a_src,headers=headers).text tree = etree.HTML(page_text) dl_src = tree.xpath(’//div[@id='down']/div[2]/ul/li[8]/a/@href’)[0]resume_data = requests.get(url=dl_src,headers=headers).content resume_name = a_title resume_path = dirName + ’/’ + resume_name + ’.rar’ with open(resume_path,’wb’) as fp: fp.write(resume_data) print(resume_name,’下載成功!’)

爬取結果

python 爬取免費簡歷模板網站的示例

python 爬取免費簡歷模板網站的示例

以上就是python 爬取免費簡歷模板網站的示例的詳細內容,更多關于python 爬取網站的資料請關注好吧啦網其它相關文章!

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 最新日韩欧美 | 国产乱码精品一区二区三区中文 | 久久一区二区三区四区 | 久久精品| 欧美精品91 | 91精品国产乱码久久久久久 | 亚洲一区二区 | 成人精品在线视频 | 亚洲成人免费观看 | 精品一区二区三区91 | 国产精品观看 | 青春草国产 | 亚洲少妇综合网 | 亚洲 欧美 另类 综合 偷拍 | 亚洲免费片 | 国产精品久久九九 | 国产精品视频入口 | 色五月激情五月 | 丁香婷婷久久久综合精品国产 | 一区二区成人 | 日本中出视频 | 亚洲精品欧美一区二区三区 | 91视频一区 | 自拍偷拍亚洲视频 | 日日噜噜夜夜爽爽狠狠 | 国产精品久久久久久久久久久免费看 | 日本中文字幕在线观看 | 天天躁日日躁狠狠的躁天龙影院 | 久久国产精品无码网站 | 成人中文网| 做a视频 | 一区二区三区国产好 | 日韩一区二区免费视频 | 欧美一区二区二区 | 国产精品不卡视频 | 亚洲国产精品网站 | 亚洲在线一区二区 | 一呦二呦三呦国产精品 | 亚洲一区二区三区四区五区中文 | 99精品国自产在线 | 欧美二区三区 |