av一区二区在线观看_亚洲男人的天堂网站_日韩亚洲视频_在线成人免费_欧美日韩精品免费观看视频_久草视

您的位置:首頁技術文章
文章詳情頁

python爬取鏈家二手房的數據

瀏覽:47日期:2022-06-18 17:08:08
目錄一、查找數據所在位置:二、確定數據存放位置:三、獲取html數據:四、解析html,提取有用數據:一、查找數據所在位置:

打開鏈家官網,進入二手房頁面,選取某個城市,可以看到該城市房源總數以及房源列表數據。

python爬取鏈家二手房的數據

二、確定數據存放位置:

某些網站的數據是存放在html中,而有些卻api接口,甚至有些加密在js中,還好鏈家的房源數據是存放到html中:

python爬取鏈家二手房的數據

三、獲取html數據:

通過requests請求頁面,獲取每頁的html數據

# 爬取的url,默認爬取的南京的鏈家房產信息url = ’https://nj.lianjia.com/ershoufang/pg{}/’.format(page)# 請求urlresp = requests.get(url, headers=headers, timeout=10)四、解析html,提取有用數據:

通過BeautifulSoup解析html,并提取相應有用的數據

soup = BeautifulSoup(resp.content, ’lxml’)# 篩選全部的li標簽sellListContent = soup.select(’.sellListContent li.LOGCLICKDATA’)# 循環遍歷for sell in sellListContent: # 標題 title = sell.select(’div.title a’)[0].string # 先抓取全部的div信息,再針對每一條進行提取 houseInfo = list(sell.select(’div.houseInfo’)[0].stripped_strings) # 樓盤名字 loupan = houseInfo[0] # 對樓盤的信息進行分割 info = houseInfo[0].split(’|’) # 房子類型 house_type = info[1].strip() # 面積大小 area = info[2].strip() # 房間朝向 toward = info[3].strip() # 裝修類型 renovation = info[4].strip() # 房屋地址 positionInfo = ’’.join(list(sell.select(’div.positionInfo’)[0].stripped_strings)) # 房屋總價 totalPrice = ’’.join(list(sell.select(’div.totalPrice’)[0].stripped_strings)) # 房屋單價 unitPrice = list(sell.select(’div.unitPrice’)[0].stripped_strings)[0]

以上就是我的分享,如果有什么不足之處請指出,多交流,謝謝!

以上就是python爬取鏈家二手房的數據的詳細內容,更多關于python爬取鏈家二手房的資料請關注好吧啦網其它相關文章!

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 欧美精品一区二区三区四区 在线 | 色伊人| 久久国产欧美日韩精品 | 亚洲精品在线看 | 国产成人99久久亚洲综合精品 | 99视频在线免费观看 | 日韩资源 | 亚洲第一成年免费网站 | 欧美日高清 | 亚洲视频在线播放 | 午夜免费网| 欧美三级三级三级爽爽爽 | 色吊丝2288sds中文字幕 | 黄色av网站在线观看 | 56pao在线 | 9999国产精品欧美久久久久久 | 在线成人免费视频 | 精品96久久久久久中文字幕无 | 久久精品电影 | 中文字幕 国产 | 国产日产欧产精品精品推荐蛮挑 | 久久国产秒 | 91麻豆精品一区二区三区 | 99热最新 | 视频在线亚洲 | 国产日韩欧美 | 一级片网站视频 | 日本精品在线观看 | 欧美日韩电影免费观看 | 国产在线精品一区二区 | 成人午夜精品 | 日本一区二区三区精品视频 | 国产一级片精品 | 精品国产18久久久久久二百 | 男女羞羞视频免费看 | 国产精品不卡 | 日韩一区二区在线视频 | 韩日av片| 一区二区三区视频在线免费观看 | 天天插日日操 | 精品国产区 |