当前位置: 首页 > news >正文

怎么样做外链推广网站西安百度网站快速排名

怎么样做外链推广网站,西安百度网站快速排名,枣庄做网站公司,在线免费作图软件爬虫的过程中,当对方服务器发现你屡次爬取它,可能会遇到被封IP的苦痛,这时IP就应该换啦,打造IP池的意义十分重要,提供免费IP网站有很多,本次用的是西刺代理IP # -*- coding: utf-8 -*- """…

爬虫的过程中,当对方服务器发现你屡次爬取它,可能会遇到被封IP的苦痛,这时IP就应该换啦,打造IP池的意义十分重要,提供免费IP网站有很多,本次用的是西刺代理IP

# -*- coding: utf-8 -*-
"""
Created on Fri May 11 09:02:12 2018@author: JJ
"""
import urllib.request
import re
def get_proxy(n):url = 'http://www.xicidaili.com/nn/{}'.format(n)headers = ('User-Agent','Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36')opener = urllib.request.build_opener()opener.addheaders = [headers]urllib.request.install_opener(opener)html = opener.open(url).read().decode('utf8')ip_port_list = re.findall(r'<tr class(.*?)</tr>',html,re.S)proxy_list = []for i in ip_port_list:ip = re.findall(r'\d+\.\d+\.\d+\.\d+',i)[0]port = re.findall(r'<td>(\d+)</td>',i)[0]proxy = '{}:{}'.format(ip,port)proxy_list.append(proxy)print(proxy_list)if __name__=='__main__':get_proxy(1)

这段代码是爬取第一页,仅仅做个示范,大家可以在下面写个for循环,多爬几页也是可以的,来看看输出结果:

接下来来看看刚才做的IP池能不能用,或者说效率怎么样。测试网站http://httpbin.org/ip,话不多说上代码:

# -*- coding: utf-8 -*-
"""
Created on Fri May 11 09:02:12 2018@author: JJ
"""
import urllib.request
import re
import time
import random
def get_proxy(n):url = 'http://www.xicidaili.com/nn/{}'.format(n)headers = ('User-Agent','Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36')opener = urllib.request.build_opener()opener.addheaders = [headers]urllib.request.install_opener(opener)html = opener.open(url).read().decode('utf8')ip_port_list = re.findall(r'<tr class(.*?)</tr>',html,re.S)proxy_list = []for i in ip_port_list:ip = re.findall(r'\d+\.\d+\.\d+\.\d+',i)[0]port = re.findall(r'<td>(\d+)</td>',i)[0]proxy = '{}:{}'.format(ip,port)proxy_list.append(proxy)return proxy_listdef proxy_read(proxy_list,i):proxy = proxy_list[i]print('当前IP为:{}'.format(proxy))sleep_time = random.randint(1,3)print('等待{}秒'.format(sleep_time))time.sleep(sleep_time)print('开始测试')proxy_jj = urllib.request.ProxyHandler({'http':proxy})opener = urllib.reequest.build_opener(proxy_jj,urllib.request.HTTPHandler)urllib.request.install_opener(opener)try:html = urllib.request.urlopen('http://httpbin.org/ip')rhtml = html.read()print(rhtml)except Exception as e:print(e)print('-------IP不能用------')if __name__=='__main__':proxy_list = get_proxy(1)print('开始测试')for i in range(100):proxy_read(proxy_list,i)

结果如上图,总得来说,代码很简单,好啦,end啦,下一篇文章‘用xpath打造免费IP池‘。敬请期待

http://www.15wanjia.com/news/11670.html

相关文章:

  • 做门户网站用什么seo诊断站长
  • 承德建站公司网站推广营销的步骤
  • 用discuz做的大网站怎么接广告赚钱
  • 我想做自己网站怎么做淘宝seo搜索优化
  • 网络推广培训哪个好seo高端培训
  • 免费自己怎么注册网站网络营销策划的流程
  • 房地产销售赚钱吗seo优化啥意思
  • 网站规划与建设简短的营销软文范文
  • 网站做好了怎么办淄博seo推广
  • 做网站要考虑什么代做百度首页排名
  • 山东省建设监理协会网站南昌seo管理
  • 文山微网站建设市场营销推广方案模板
  • 曲周网站建设seo还有前景吗
  • 网站导航栏模板怎么做seo综合检测
  • wordpress 同城生活爱站网站seo查询工具
  • 双通网络网站建设价格网站优化哪个公司好
  • 企业管理网站系统seo搜索引擎优化案例
  • 手机网站域做什么广告sem是什么的英文缩写
  • 天津网站优化方案大二网络营销实训报告
  • 个体户可以做网站么搜索引擎营销的方法不包括
  • 日照商城网站建设郑州网站建设公司
  • 临沂专业网站建设公司电话广州市口碑seo推广外包
  • 毕业设计代写网站网店营销策划方案ppt
  • 做视频网站可行吗广告营销策划
  • h5制作网站哪个好百度提交网址多久才会收录
  • 服装店网页设计网站模板软件外包公司有哪些
  • 手机智能建网站网络销售模式有哪些
  • wordpress如何换图片不显示西安优化seo托管
  • 快站app制作seo诊断专家
  • 无锡网站优化公司品牌营销推广代运营