当前位置: 首页 > news >正文

建设网站怎么输入分子式网络营销方法有什么

建设网站怎么输入分子式,网络营销方法有什么,优化网站推广,cms 免费案例需求: 1.爬取该新闻网站——(网易新闻)的数据,包括标题和链接 2.爬取所有数据(翻页参数) 3.利用jsonpath解析数据 分析: 该网站属于异步加载网站——直接网页中拿不到,需要…

案例需求:

1.爬取该新闻网站——(网易新闻)的数据,包括标题和链接

2.爬取所有数据(翻页参数)

3.利用jsonpath解析数据

分析:

该网站属于异步加载网站——直接网页中拿不到,需要借助fidder抓包工具拿取

可以看到第一页请求网址

https://news.163.com/special/cm_yaowen20200213/?callback=data_callback

6a92f0e00544494d8c21cf6b292dd5b6.png

第二页请求网址

https://news.163.com/special/cm_yaowen20200213_02/?callback=data_callback

4dc35985765e4390b31a2f426e9401c3.png

第五页(最后一页)请求网址:

https://news.163.com/special/cm_yaowen20200213_05/?callback=data_callback

2b51c098461745cd9e30bd5993d62358.png

所以翻页代码如下:

首页地址为第一页地址

for i in range(2,6):print('==========', '当前是第{}页'.format(i))page_url = 'https://news.163.com/special/cm_yaowen20200213_0{}/?callback=data_callback'.format(i)

利用josnpath解析数据

cd754152e4124f5d8cae70ca625e3d5b.png

因为该网页不是常规的josn源码数据,所以需要进行一些处理

text_data=data.split('data_callback(')[1]
# print(text_data)
text_data1 = text_data.split(')')[0]
# print(text_data1)
json_data = json.loads(text_data1)
title = jsonpath(json_data,'$..title')
url = jsonpath(json_data,'$..docurl')

处理解析数据

for i,j in zip(title,url):print(i)print(j)print('=======================================')

示例代码:

import requests
from jsonpath import jsonpath
import json
def get_data(url):headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36'}r = requests.get(url,headers=headers)# print(r.text)return r.text# print(r.text)# print(r.json())
def parse_data(data):text_data=data.split('data_callback(')[1]# print(text_data)text_data1 = text_data.split(')')[0]# print(text_data1)json_data = json.loads(text_data1)title = jsonpath(json_data,'$..title')url = jsonpath(json_data,'$..docurl')for i,j in zip(title,url):print(i)print(j)print('=======================================')# print(title)# print(url)
if __name__ == '__main__':url = "https://news.163.com/special/cm_yaowen20200213/?callback=data_callback "# h = get_data()# parse_data(h)for i in range(2,6):print('==========', '当前是第{}页'.format(i))page_url = 'https://news.163.com/special/cm_yaowen20200213_0{}/?callback=data_callback'.format(i)h = get_data(page_url)parse_data(h)

6fe1a5bc51994e42a2d68a1c2185b90f.png

 

http://www.15wanjia.com/news/21460.html

相关文章:

  • 寻找网站建设员好的竞价账户托管外包
  • 做网站怎样收费的湛江百度网站快速排名
  • 网站图片标题背景怎样做的网站制作费用
  • 电子商务网站有那些功能百度搜索引擎营销案例
  • 嘉兴网站开发网络推广员是干什么的
  • 如何用万网做自己的网站百度搜索热度指数
  • 深圳企业网站建设定制开发服务友情链接2598
  • 什么网站可以做ppt搜索引擎的关键词优化
  • 顺德手机网站设计价位国际最新十大新闻事件
  • 口碑营销的前提及好处有哪些江西网络推广seo
  • 国产成年做视频网站爱站网关键词查询网站
  • 做虚拟网站要花多少钱百度官方推广
  • 制作企业网站的一般流程站长之家查询工具
  • 登封网站制作网站建设seo还可以做哪些推广
  • 移动公司营销网站设计网站设计与制作教程
  • 帝国cms调用网站地址长沙seo推广公司
  • 中山网站建设提升网页优化排名
  • 怎么样在网站做产品推广网络营销的真实案例分析
  • 网站做全景图微信群推广
  • 深圳国内网站设计公司加盟
  • 舆情监测工作要怎么做广州seo工程师
  • wordpress explodeseo关键词排名优化哪家好
  • 做网站平台难在哪里梁水才seo优化专家
  • html编辑器中文版太原百度网站快速优化
  • 天空台108网站找手工活带回家做seo关键词优化要多少钱
  • 建站公司不给源码成都黑帽seo
  • 网站风格和色调软文营销软文推广
  • 建网站怎么分类目前好的推广平台
  • 网站建设与开发课程介绍公众号开发
  • 做外贸网站卖什么好收录优美图片