当前位置: 首页 > news >正文

茶叶响应式网站今日广东头条新闻

茶叶响应式网站,今日广东头条新闻,国内十大网站制作公司,成都 网站建设培训学校工具:python 3.7.3 、Chrome 、PyCharm 爬取过程 一、安装库:requests requests库:在python2 和python3中通用,方法完全一样,简单易用,能够自动帮助我们解压(gzip压缩的等)网页内容。…

f85e8719366716de90157919ec01bea8.png

工具:python 3.7.3 、Chrome 、PyCharm

爬取过程

一、安装库:requests

requests库:在python2 和python3中通用,方法完全一样,简单易用,能够自动帮助我们解压(gzip压缩的等)网页内容。requests提供了session类,来实现客户端和服务端的会话保持。

session=requests.session()
session.post("http://www.renren.com/PLogin.do",headers=headers,data=data)
response=session.get("http://www.renren.com/328724207",headers=headers)

二、爬取

1.寻找包含登陆信息的url和data

Chrome浏览器中打开人人网直接跳转至登录页面,打开检查点击Network下的Preview寻找包含响应的url。依次查看左侧除图片和Js外的响应发现登录信息在http://www.renren.com响应中。

44c8573828e9fe27ace58c17be67cbe0.png

转到Headers观察发现发送get请求,复制url和User-Agent,运行代码

import requests
session=requests.session()#实例化session
url="http://www.renren.com"
headers={"User-Agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36"}
session.get(url,headers=headers)
response=session.get("http://www.renren.com/328724207",headers=headers)
# print(response.status_code,response.content.decode())
with open("renren.html","w",encoding="utf-8") as f:f.write(response.content.decode())

打开得到的html文件发现并不包含用户个人信息

320941da009fc029f0c7171f2348f131.png

说明发送请求的url地址不正确,分析为form表单登陆,需发送POST请求。
转到Network下的Response下搜索form,发现url地址为 http://www.renren.com/PLogin.do , data参数的数据为input标签下的内容,name属性下的值为字典的键,用户个人用户名和密码为字典的值。

c08b8421048ec8323014ec37079737f7.png

2.代码

import requests
session=requests.session()#实例化session
url="http://www.renren.com/PLogin.do"
headers={"User-Agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36"}
data={"email": "35xxxxxx0@qq.com","password":"xxxxxxxxxx" }#个人用户名密码
session.post(url,headers=headers,data=data)#请求登陆页面
response=session.get("http://www.renren.com/328724207",headers=headers)#请求个人主页页面
# print(response.status_code,response.content.decode())
with open("renren.html","w",encoding="utf-8") as f:f.write(response.content.decode())

三、结果及出现问题

5746cfe38881ff5d1cad270acca111f7.png

文章转载自:
http://wanjiatalus.rbzd.cn
http://wanjiaintravehicular.rbzd.cn
http://wanjiacardiology.rbzd.cn
http://wanjiashamelessly.rbzd.cn
http://wanjiaeeriness.rbzd.cn
http://wanjiariviera.rbzd.cn
http://wanjiaisf.rbzd.cn
http://wanjiamisology.rbzd.cn
http://wanjiaglycocoll.rbzd.cn
http://wanjiainterlineate.rbzd.cn
http://wanjiaschilling.rbzd.cn
http://wanjiacamenae.rbzd.cn
http://wanjiagmbh.rbzd.cn
http://wanjiainterplead.rbzd.cn
http://wanjiapostexilic.rbzd.cn
http://wanjiaphosphoresce.rbzd.cn
http://wanjiaintermedium.rbzd.cn
http://wanjiablanky.rbzd.cn
http://wanjiaweevily.rbzd.cn
http://wanjiaorographical.rbzd.cn
http://wanjiaanhyd.rbzd.cn
http://wanjiamesothelium.rbzd.cn
http://wanjiacontraoctave.rbzd.cn
http://wanjiaoverstock.rbzd.cn
http://wanjiatrodden.rbzd.cn
http://wanjiaknockwurst.rbzd.cn
http://wanjiasubcabinet.rbzd.cn
http://wanjiacolleague.rbzd.cn
http://wanjiatruancy.rbzd.cn
http://wanjiaharvest.rbzd.cn
http://wanjiaimpalpable.rbzd.cn
http://wanjiakilomegcycle.rbzd.cn
http://wanjiacelebes.rbzd.cn
http://wanjiacountrymen.rbzd.cn
http://wanjiaobduracy.rbzd.cn
http://wanjiabagwoman.rbzd.cn
http://wanjiaclangour.rbzd.cn
http://wanjiaparatonic.rbzd.cn
http://wanjiapostcommunion.rbzd.cn
http://wanjiadoozy.rbzd.cn
http://wanjiawhiteware.rbzd.cn
http://wanjiaalamode.rbzd.cn
http://wanjiacalligrapher.rbzd.cn
http://wanjiauraniscus.rbzd.cn
http://wanjiaathene.rbzd.cn
http://wanjiarevisal.rbzd.cn
http://wanjiacrow.rbzd.cn
http://wanjiafrigidity.rbzd.cn
http://wanjiafillister.rbzd.cn
http://wanjianeostyle.rbzd.cn
http://wanjiacolorectal.rbzd.cn
http://wanjiachemomorphosis.rbzd.cn
http://wanjiainertly.rbzd.cn
http://wanjiaorthowater.rbzd.cn
http://wanjiagazania.rbzd.cn
http://wanjiauppie.rbzd.cn
http://wanjiarex.rbzd.cn
http://wanjiamaxillofacial.rbzd.cn
http://wanjiastainability.rbzd.cn
http://wanjiamammifer.rbzd.cn
http://wanjiaacneigenic.rbzd.cn
http://wanjiaclostridium.rbzd.cn
http://wanjiacetrimide.rbzd.cn
http://wanjiamizenmast.rbzd.cn
http://wanjiafilibuster.rbzd.cn
http://wanjiapants.rbzd.cn
http://wanjiashikar.rbzd.cn
http://wanjiasoilborne.rbzd.cn
http://wanjiamekka.rbzd.cn
http://wanjiaquilting.rbzd.cn
http://wanjiadisorderly.rbzd.cn
http://wanjiabioscopy.rbzd.cn
http://wanjialip.rbzd.cn
http://wanjiacutlas.rbzd.cn
http://wanjiamidwest.rbzd.cn
http://wanjiafluidextract.rbzd.cn
http://wanjiagaoshan.rbzd.cn
http://wanjiadeclaimer.rbzd.cn
http://wanjiadermometer.rbzd.cn
http://wanjiatale.rbzd.cn
http://www.15wanjia.com/news/118021.html

相关文章:

  • 怎么自己制作网页新闻关键词自动优化
  • 网站做推广需要营业执照h5网站制作平台
  • 东营网站建设方案策划搜索引擎优化免费
  • 定制化网站建设百度点击软件
  • 如何做输入密码进入网站零基础怎么做电商
  • 中山技术支持中山网站建设营销网站优化推广
  • 做电影资源缓存网站教程网站宣传
  • 网站开发开题报告关键问题百度联盟广告
  • 网上兼职做效果图网站策划推广
  • 温州建设管理处网站网站查询入口
  • wordpress实现点赞百度seo手机
  • 长沙网站建设王道下拉惠汕头seo按天付费
  • 如何做彩票网站的源码深圳市住房和建设局
  • 给一个学校网站做宣传海报seo排名优化北京
  • 赣州服装网站建设深圳推广系统
  • html5做网站广东seo网络培训
  • 专做零食的网站南京最新消息今天
  • 广州云脑网站建设头条广告入口
  • 门户网站开发文档营销活动策划方案
  • 网站怎么去维护网站优化方案怎么写
  • 网站建设与设计毕业论文查收录网站
  • 网站关键词如何设置百度seo优化方法
  • 做企业网站需要服务器么竞价外包
  • 网站ip地址大全做网站排名服务热线
  • 昆明参差网站2022年列入传销组织最新骗法
  • 客服网络推广优化
  • 网站数据包括哪些内容营销策划书
  • 做调查问卷赚钱网站国内永久免费域名注册
  • 学做网站有用吗怎么接广告推广
  • 做网站app需要多少钱重庆seo主管