以后再也不用擔(dān)心寫爬蟲ip被封,不用擔(dān)心沒錢買代理ip的煩惱了 在使用python寫爬蟲時候,你會遇到所要爬取的網(wǎng)站有反爬取技術(shù)比如用同一個IP反復(fù)爬取同一個網(wǎng)頁,很可能會被封。如何有效的解決這個問題呢?我們可以使用代理ip,來設(shè)置代理ip池。 現(xiàn)在教大家一個可獲取大量免費有效快速的代理ip方法,我們訪問西刺免費代理ip網(wǎng)址 這里面提供了許多代理ip,但是我們嘗試過后會發(fā)現(xiàn)并不是每一個都是有效的。所以我們現(xiàn)在所要做的就是從里面提供的篩選出有效快速穩(wěn)定的ip。 以下介紹的免費獲取代理ip池的方法: 優(yōu)點:免費、數(shù)量多、有效、速度快 缺點:需要定期篩選 主要思路: 從網(wǎng)址上爬取ip地址并存儲 驗證ip是否能使用-(隨機訪問網(wǎng)址判斷響應(yīng)碼) 格式化ip地址 代碼如下: 1.導(dǎo)入包 import requests from lxml import etree import time 1 2 3 2.獲取西刺免費代理ip網(wǎng)址上的代理ip def get_all_proxy(): url = 'http://www.xicidaili.com/nn/1' headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36', } response = requests.get(url, headers=headers) html_ele = etree.HTML(response.text) ip_eles = html_ele.xpath('//table[@id="ip_list"]/tr/td[2]/text()') port_ele = html_ele.xpath('//table[@id="ip_list"]/tr/td[3]/text()') proxy_list = [] for i in range(0,len(ip_eles)): proxy_str = 'http://' + ip_eles[i] + ':' + port_ele[i] proxy_list.append(proxy_str) return proxy_list 1 2 3 4 5 6 7 8 9 10 11 12 13 14 3.驗證獲取的ip def check_all_proxy(proxy_list): valid_proxy_list = [] for proxy in proxy_list: url = 'http://www.baidu.com/' proxy_dict = { 'http': proxy } try: start_time = time.time() response = requests.get(url, proxies=proxy_dict, timeout=5) if response.status_code == 200: end_time = time.time() print('代理可用:' + proxy) print('耗時:' + str(end_time - start_time)) valid_proxy_list.append(proxy) else: print('代理超時') except: print('代理不可用--------------->'+proxy) return valid_proxy_list 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 4.輸出獲取ip池 if __name__ == '__main__': proxy_list = get_all_proxy() valid_proxy_list = check_all_proxy(proxy_list) print('--'*30) print(valid_proxy_list) 1 2 3 4 5 技術(shù)能力有限歡迎提出意見,保證積極向上不斷學(xué)習(xí) ———————————————— 版權(quán)聲明:本文為CSDN博主「彬小二」的原創(chuàng)文章,遵循 CC 4.0 BY-SA 版權(quán)協(xié)議,轉(zhuǎn)載請附上原文出處鏈接及本聲明。 原文鏈接:https://blog.csdn.net/qq_39884947/article/details/86609930
上傳時間: 2019-11-15
上傳用戶:fygwz1982
JESD9B-2011 微電子封裝及封蓋檢驗標(biāo)準(zhǔn) 此標(biāo)準(zhǔn)為英文版本。
上傳時間: 2022-07-25
上傳用戶:默默
PROCONN鉅航SD PUSH自彈式卡座封裝圖紙資料
上傳時間: 2013-07-18
上傳用戶:euroford
TF自彈卡座,超薄1.5mm,品牌鉅航,MSPN09-A0-4X00
上傳時間: 2013-04-24
上傳用戶:BK094
成功的一半,只要你能專心的看下去。一起加油!
標(biāo)簽: 單片機
上傳時間: 2013-07-21
上傳用戶:nanxia
在PC機上運行cadence需要先運行命令:source filename,此處filename指.cshrc,或其他具有該文件內(nèi)容但名字不同的文件,該文件必須有set DISPLAY 本機IP:0.0 語句,同時應(yīng)將其他雷同設(shè)置封住.可以先從工作站上下載.cshrc文件,然后用notepad修改顯示設(shè)置相,不可用其他編輯器,否則文本文件格式會不一樣.記住,必須將顯示器設(shè)置為256色.
上傳時間: 2013-09-05
上傳用戶:超凡大師
LTM®4616 是一款雙路輸入、雙路輸出 DC/DC μModule™ 穩(wěn)壓器,采用 15mm x 15mm x 2.8mm LGA 表面貼裝型封裝。由於開關(guān)控制器、MOSFET、電感器和其他支持元件均被集成在纖巧型封裝之內(nèi),因此只需少量的外部元件。
標(biāo)簽: uModule DCDC 16A 雙通道
上傳時間: 2013-10-27
上傳用戶:頂?shù)弥?/p>
設(shè)計時需要過一款簡單、低成本的閂鎖電路 (latch circuit) ?圖一顯示的就是這樣一款電路,基本上是一個可控矽整流器(SCR),結(jié)合了一些離散組件,只需低成本的元件便可以提供電源故障保護。
上傳時間: 2013-11-11
上傳用戶:zq70996813
結(jié)合大功率LED熱流模型和結(jié)構(gòu),我們不難看出,影響大功率LED熱阻的主要因素有:1. LED晶片的導(dǎo)熱能力;2. 固晶粘合膠的導(dǎo)熱能力以及粘合的品質(zhì);3. 器件(包括晶片)熱通道的長度;4. 灌封材料的熱導(dǎo)能力;5. 熱沉的熱導(dǎo)能力。
標(biāo)簽: LED 導(dǎo)熱 傳熱 散熱技術(shù)
上傳時間: 2013-11-11
上傳用戶:caoyuanyuan1818
產(chǎn)品說明 PS系列超小型隔離AC-DC開關(guān)電源模塊已生產(chǎn)銷售了9年,產(chǎn)品一直深受客戶歡迎。該系列產(chǎn)品具有體積小、重量輕、動態(tài)輸入電壓范圍寬等優(yōu)點,并且轉(zhuǎn)換效率高,性能可靠,具有輸出短路和過熱保護功能,可在板安裝。產(chǎn)品采用電膠木或金屬鋁外殼,樹脂灌封,出廠前全部經(jīng)過高溫老化并100%測試。
標(biāo)簽: AC-DC 隔離 開關(guān)電源
上傳時間: 2013-10-24
上傳用戶:a471778
蟲蟲下載站版權(quán)所有 京ICP備2021023401號-1