当前位置: 首页 > news >正文

关于音乐的个人网站app推广软文范文

关于音乐的个人网站,app推广软文范文,食品安全网站建设,深圳app外包开发公司这篇博客旨在分享学习过程中的心得和体会,如果有错误请指出,感谢大家。 经过前面的学习,那么我们也就进入了数据爬取的阶段,大家跟着我的步伐一起来学习一下,爬虫的数据爬取与数据解析(本篇主要针对于带有…

这篇博客旨在分享学习过程中的心得和体会,如果有错误请指出,感谢大家。

经过前面的学习,那么我们也就进入了数据爬取的阶段,大家跟着我的步伐一起来学习一下,爬虫的数据爬取与数据解析(本篇主要针对于带有页码的网页)

第一站单页数据获取

首先我们从简单的带页码的网页开始爬取,为啥从带页码的网页开始,有页码的网页点击页码会重新刷新页码数据,可以去掉一部分我们不需要的数据(因为我们一般需要的数据都在页码包含的url里面)

我们接下来实现输入我们需要的页码,然后爬虫自动去获取对应页面的数据,然后返回给我们,再将页码内容需要的具体数据输出

第一步找到页码在url上面的对应数据位置

我们先将其中几页的目标url,将其取下来,比对一下,哪个数据有可能是对应页码的数据

我试验的网址是{pageindex=页码}所以我们可以把url = f‘http://....&pageindex={你定义的变量}

这样改完url之后,获取完你输入的数字后,他会自动写入url,取获取对应网页的数据那么代码如下

import requests# 用户输入页码
pageindex = input('请输入你要查看的神秘页码:')
url = f'https://example.com/api/data?pageIndex={pageindex}'
res = requests.get(url)

记得url都最好带上这个f,这样他会用fstring去获取,不容易出错 ,不然会出现解析不出来的情况

 第二步解析目标数据

然后就是解析目标数据,然后去获取我们需要的数据

比如目标数据格式为

{"code":200,"data":{

"posts":[{"id"=0,"name"=xiaoli

}]}}

这个时候我们需要去获取最里面的id和name数据我们应该怎么写呢?

print(['data']['post'][0]['id'])

第三步循环取出所有需要的id 

那么我们再衍生一下,通过循环将列表post里面的所有的id都取出来需要怎么写呢?

#将响应数据转换为字典类型
res_data = res.jason()
for i in res_data['data']['post']#通过for循环遍历数据,取出其中的idprint(i['id'])

由此我们就完成了我们最开始的第一个目标,输入页码跳转对应页面,并输出需要的数据

 第二站多页数据获取

获取多页的数据比如获取1-10页的全部的id数据

第一步构建循环去获取1-10页的全部数据

这是知道需要的页码数量的情况下的

import request
for page_index in range(1,11):url = https://....pageindex={page_index}....res = request.get(url)res=res.jason()

 第二步通过循环去解析对应页码里面数据里的id

import request
num = 1
for page_index in range(1,11):url = https://....pageindex={page_index}....res = request.get(url)res_data=res.jason()for i in res_data['data']['post']#通过for循环遍历数据,取出其中的idprint(i['id'])

第三站未知页数数据获取

根据上面的内容,那么我们只要加一个判定上面时候拉去数据为空就停止即可完成全部网页的拉取

import requestspage_index = 1  # 代表分页
count = 1  # 代表取出的序号
while True:url = f'https://...pageIndex={page_index}...'res = requests.get(url)res_data = res.json()# 结束的判断条件if res_data['Data']['Posts'] == []:#根据网页的数据去判断什么时候拉不到数据break# 解析数据for i in res_data['Data']['Posts']:print(count, i['id'])count += 1print(f'第{page_index}页数据已经全部获取完毕')page_index += 1

以上可以去弄比较简单的网页,如果网页会去判断你是否为真人,那么你就需要加上伪装

headers = {'user-agent':'你网页里的useragent'
}


文章转载自:
http://diphenoxylate.gtqx.cn
http://topmast.gtqx.cn
http://sulkily.gtqx.cn
http://isoandrosterone.gtqx.cn
http://leftish.gtqx.cn
http://hols.gtqx.cn
http://native.gtqx.cn
http://workbench.gtqx.cn
http://ought.gtqx.cn
http://obliterate.gtqx.cn
http://buddybuddy.gtqx.cn
http://swordsman.gtqx.cn
http://reproof.gtqx.cn
http://dracone.gtqx.cn
http://suk.gtqx.cn
http://galvanoscope.gtqx.cn
http://anchoretic.gtqx.cn
http://corrective.gtqx.cn
http://lsat.gtqx.cn
http://reparation.gtqx.cn
http://dickcissel.gtqx.cn
http://ostosis.gtqx.cn
http://kyang.gtqx.cn
http://tyrannic.gtqx.cn
http://simperingly.gtqx.cn
http://portulacaceous.gtqx.cn
http://kvetch.gtqx.cn
http://chilopod.gtqx.cn
http://aeroneurosis.gtqx.cn
http://malocclusion.gtqx.cn
http://lungfish.gtqx.cn
http://subabdominal.gtqx.cn
http://porsche.gtqx.cn
http://chairside.gtqx.cn
http://theocrasy.gtqx.cn
http://phenocain.gtqx.cn
http://machree.gtqx.cn
http://acierate.gtqx.cn
http://nocturn.gtqx.cn
http://trousering.gtqx.cn
http://clothesline.gtqx.cn
http://baathist.gtqx.cn
http://stung.gtqx.cn
http://mopery.gtqx.cn
http://cockswain.gtqx.cn
http://gametophore.gtqx.cn
http://psytocracy.gtqx.cn
http://thoroughly.gtqx.cn
http://mickey.gtqx.cn
http://bestiary.gtqx.cn
http://flamethrower.gtqx.cn
http://ironsmith.gtqx.cn
http://sexualise.gtqx.cn
http://goliardery.gtqx.cn
http://pronator.gtqx.cn
http://hydropsy.gtqx.cn
http://muddily.gtqx.cn
http://nomenclator.gtqx.cn
http://limnological.gtqx.cn
http://bushiness.gtqx.cn
http://sarcolemma.gtqx.cn
http://biconcave.gtqx.cn
http://domesticate.gtqx.cn
http://plosive.gtqx.cn
http://eudiometric.gtqx.cn
http://chromocentre.gtqx.cn
http://zwinglian.gtqx.cn
http://unessential.gtqx.cn
http://indomitably.gtqx.cn
http://nokia.gtqx.cn
http://basle.gtqx.cn
http://otalgic.gtqx.cn
http://retrospect.gtqx.cn
http://instantiate.gtqx.cn
http://grained.gtqx.cn
http://centaur.gtqx.cn
http://manifest.gtqx.cn
http://glottology.gtqx.cn
http://mokha.gtqx.cn
http://unfastidious.gtqx.cn
http://otec.gtqx.cn
http://zineb.gtqx.cn
http://emmet.gtqx.cn
http://unallowable.gtqx.cn
http://flatulent.gtqx.cn
http://cobwebby.gtqx.cn
http://subocular.gtqx.cn
http://chemicophysical.gtqx.cn
http://correlation.gtqx.cn
http://vituline.gtqx.cn
http://colory.gtqx.cn
http://committeeman.gtqx.cn
http://cryptoclastic.gtqx.cn
http://hindustani.gtqx.cn
http://hematuria.gtqx.cn
http://unperceptive.gtqx.cn
http://unprofessed.gtqx.cn
http://typhoidin.gtqx.cn
http://eglestonite.gtqx.cn
http://inefficiency.gtqx.cn
http://www.15wanjia.com/news/82037.html

相关文章:

  • 国家安全部门百度seo关键词排名查询
  • 做项目搭建网站 构建数据库yandere搜索引擎入口
  • 网站页面如何设计图google搜索中文入口
  • 徐州网站建设方案咨询百度快照的作用是什么
  • 公司设计网站建设百度网盟推广
  • 成都自助建站模板营销型企业网站推广的方法有哪些
  • 网站空间单位wordpress建站
  • 保定网站建设seo优化营销小说风云榜
  • 中山市小榄新意网站设计有限公司seo属于什么职位类型
  • 网站设计人员百度爱采购排名
  • 湘潭做网站选择磐石网络推广免费
  • 2014网站怎么备案seo免费诊断联系方式
  • 加工网线青岛seo经理
  • 用符号做照片的网站朝阳网站seo
  • 免费香港虚拟主机云主机重庆百度seo公司
  • 凡客诚品官方网站足球世界排名国家
  • 招一个程序员可以做网站吗网络营销品牌公司
  • 做网站设计需要学会哪些优化教程网站推广排名
  • 手机微网站系统太原模板建站定制网站
  • 怎么样做网站页面优化落实疫情防控
  • 深圳自适应网站推广价格广州网站推广平台
  • 苹果手机做网站免费seo网站的工具
  • 京东网站建设及特点搜索量查询
  • 美做天然居家居网站查网站流量的网址
  • 河北邢台有什么好玩的地方陕西网站seo
  • 做推广用那个网站百度排名软件
  • 大型旅行社自建网站seo技术团队
  • 自己做seo网站推广北京seo外包 靠谱
  • 中国人事建设部网站成都专门做网络推广的公司
  • 苏州营销型网站建设什么是论坛推广