当前位置: 首页 > news >正文

西部数码网站建设助手网络推广的调整和优化

西部数码网站建设助手,网络推广的调整和优化,360免费网站建设平台,商丘网络科技有限公司⭐️⭐️⭐️⭐️⭐️欢迎来到我的博客⭐️⭐️⭐️⭐️⭐️ 🐴作者:秋无之地 🐴简介:CSDN爬虫、后端、大数据领域创作者。目前从事python爬虫、后端和大数据等相关工作,主要擅长领域有:爬虫、后端、大数据…

⭐️⭐️⭐️⭐️⭐️欢迎来到我的博客⭐️⭐️⭐️⭐️⭐️
🐴作者:秋无之地

🐴简介:CSDN爬虫、后端、大数据领域创作者。目前从事python爬虫、后端和大数据等相关工作,主要擅长领域有:爬虫、后端、大数据开发、数据分析等。

🐴欢迎小伙伴们点赞👍🏻、收藏⭐️、留言💬、关注🤝,关注必回关

一、确定目标数据

1、先打开目标网站,找到目标数据所在的页面,点击逛店铺

2、找到目标数据所在的api或页面

通过f12打开调试模式,通过搜索关键词,找到关键词所在的api或页面

3、观察请求参数

1)请求参数:有sign和token加密参数

2)翻页:position参数变动了,1_0_0表示第一页,2_0_0表示第二页。

二、请求接口

使用requests库请求接口,返回数据

def get_shop_list(self,per=10,position='1_0_0'):'''获取店铺列表:param per:每页展示条数:param position:开始位置:return:'''try:url = self.uri + "/druggmp/index/shopList"params = {"traderName":"yaoex_pc","trader":"pc","closesignature":"yes","timestamp":int(time.time()*1000),}data = {"traderName":"yaoex_pc","trader":"pc","closesignature":"yes","timestamp":int(time.time()*1000),"token":self.token,"queryAll":"yes","isSearch":"yes","per":per,"position":position,}self.log_.info(f"入参:{data}")resp = requests.post(url,headers=self.header,params=params,data=data).json()self.log_.info(f"出参数量:{len(resp['data']['shopList'])}")return resp['data']['shopList']except Exception as e:self.log_.error(str(e))return []

三、数据解析

将返回的数据进行正则匹配,然后通过遍历提取目标数据

'''获取店铺列表'''
shop_list = self.get_shop_list(per=10,position=position)
if not len(shop_list):self.log_.info('已经爬完,结束!')break
#遍历店铺
for shop_ in shop_list:#店铺idshop_id = shop_['enterpriseId']#店铺名称shop_name = shop_['shopName']#店铺logologo = shop_['logo']#是否自营self_str = shop_['shopExtTypeText']if self_str and self_str=='自营':is_self = 1else:is_self = 0#城市if 'shipAddress' in shop_:city = shop_['shipAddress']else:city = ''

四、数据存储

数据解析后,对数据进行拼接,然后持久化,存在csv文件

sql = f'''replace into yyc_shop(shop_id,shop_name,logo,shelves,is_self,biz_code,biz_url,yao_url,qs_url,official_name,province,city) 
values('{shop_id}','{shop_name}','{logo}',{shelves},{is_self},'{biz_code}','{biz_url}','{yao_url}','{qs_url}','{official_name}','{province}','{city}')'''
self.log_.info(f"插入sql:{sql}")
self.base_.mysql_data(sql)

文件内容:

五、完整代码

完整代码如下:

def get_shop_list(self,per=10,position='1_0_0'):'''获取店铺列表:param per:每页展示条数:param position:开始位置:return:'''try:url = self.uri + "/druggmp/index/shopList"params = {"traderName":"yaoex_pc","trader":"pc","closesignature":"yes","timestamp":int(time.time()*1000),}data = {"traderName":"yaoex_pc","trader":"pc","closesignature":"yes","timestamp":int(time.time()*1000),"token":self.token,"queryAll":"yes","isSearch":"yes","per":per,"position":position,}self.log_.info(f"入参:{data}")resp = requests.post(url,headers=self.header,params=params,data=data).json()self.log_.info(f"出参数量:{len(resp['data']['shopList'])}")return resp['data']['shopList']except Exception as e:self.log_.error(str(e))return []'''获取店铺列表'''
shop_list = self.get_shop_list(per=10,position=position)
if not len(shop_list):
self.log_.info('已经爬完,结束!')
break
#遍历店铺
for shop_ in shop_list:
#店铺id
shop_id = shop_['enterpriseId']
#店铺名称
shop_name = shop_['shopName']
#店铺logo
logo = shop_['logo']
#是否自营
self_str = shop_['shopExtTypeText']
if self_str and self_str=='自营':is_self = 1
else:is_self = 0
#城市
if 'shipAddress' in shop_:city = shop_['shipAddress']
else:city = '''''获取店铺上架数'''
shelves = self.get_shop_drug_count(shop_id=shop_id)'''获取店铺证件'''
shop_info = self.get_shopcert(shop_id=shop_id)
#地址
address = shop_info['data']['baseInfo']['address']
#省份
try:if city and city in address:province = address.split(city)[0]else:provs = address.split('省')province = provs[0]city = provs[1].split('市')[0]
except:province = ''
#供应商全称
official_name = shop_info['data']['baseInfo']['enterpriseName']
#图片列表
img_files = shop_info['data']['files']
# 企业营业执照
biz_url = ''
# 经营许可证
yao_url = ''
# 质量体系调查表
qs_url = ''
if len(img_files):for i in img_files:if '营业执照' in i['typeName']:biz_url = i['filePath']if '经营许可证' in i['typeName']:yao_url = i['filePath']if '质量体系调查表' in i['typeName']:qs_url = i['filePath']'''获取店铺营业执照编码'''
biz_code = ''
if biz_url:biz_code = self.get_shop_biz_code(img_link=biz_url)#替换插入数据库
sql = f'''replace into yyc_shop(shop_id,shop_name,logo,shelves,is_self,biz_code,biz_url,yao_url,qs_url,official_name,province,city) 
values('{shop_id}','{shop_name}','{logo}',{shelves},{is_self},'{biz_code}','{biz_url}','{yao_url}','{qs_url}','{official_name}','{province}','{city}')'''
self.log_.info(f"插入sql:{sql}")
self.base_.mysql_data(sql)

六、总结

Python爬虫主要分三步:

  1. 请求接口
  2. 数据解析
  3. 数据存储

版权声明

本文章版权归作者所有,未经作者允许禁止任何转载、采集,作者保留一切追究的权利。


文章转载自:
http://fashionable.hwLk.cn
http://algometer.hwLk.cn
http://enumerable.hwLk.cn
http://xxx.hwLk.cn
http://signor.hwLk.cn
http://bijou.hwLk.cn
http://arpeggio.hwLk.cn
http://succous.hwLk.cn
http://cernet.hwLk.cn
http://aiguillette.hwLk.cn
http://maroc.hwLk.cn
http://creosol.hwLk.cn
http://funiform.hwLk.cn
http://sov.hwLk.cn
http://oxymoron.hwLk.cn
http://asturian.hwLk.cn
http://echinococcus.hwLk.cn
http://bion.hwLk.cn
http://untutored.hwLk.cn
http://noninductive.hwLk.cn
http://herakles.hwLk.cn
http://fluctuation.hwLk.cn
http://waggoner.hwLk.cn
http://rightfulness.hwLk.cn
http://clearance.hwLk.cn
http://dought.hwLk.cn
http://puerperium.hwLk.cn
http://xylose.hwLk.cn
http://npl.hwLk.cn
http://ballerine.hwLk.cn
http://agonise.hwLk.cn
http://macilent.hwLk.cn
http://commissary.hwLk.cn
http://waterskin.hwLk.cn
http://lanky.hwLk.cn
http://mucronulate.hwLk.cn
http://coed.hwLk.cn
http://protease.hwLk.cn
http://pmo.hwLk.cn
http://marque.hwLk.cn
http://disallowance.hwLk.cn
http://entremets.hwLk.cn
http://chromatism.hwLk.cn
http://pneumatic.hwLk.cn
http://ottawa.hwLk.cn
http://usom.hwLk.cn
http://crimean.hwLk.cn
http://pottery.hwLk.cn
http://shinguard.hwLk.cn
http://pseudomutuality.hwLk.cn
http://hutment.hwLk.cn
http://konak.hwLk.cn
http://bbl.hwLk.cn
http://imperative.hwLk.cn
http://antimasque.hwLk.cn
http://outlaid.hwLk.cn
http://westering.hwLk.cn
http://antagonist.hwLk.cn
http://digynian.hwLk.cn
http://denticare.hwLk.cn
http://alvin.hwLk.cn
http://skimpily.hwLk.cn
http://fratricidal.hwLk.cn
http://phil.hwLk.cn
http://osmolar.hwLk.cn
http://heteroptics.hwLk.cn
http://odyssean.hwLk.cn
http://manipur.hwLk.cn
http://frow.hwLk.cn
http://thievery.hwLk.cn
http://afterpiece.hwLk.cn
http://kayser.hwLk.cn
http://cleanout.hwLk.cn
http://instanter.hwLk.cn
http://econometrical.hwLk.cn
http://osp.hwLk.cn
http://quadricornous.hwLk.cn
http://dermonecrotic.hwLk.cn
http://leaderette.hwLk.cn
http://loudly.hwLk.cn
http://refractometer.hwLk.cn
http://saluresis.hwLk.cn
http://grayback.hwLk.cn
http://plaga.hwLk.cn
http://nae.hwLk.cn
http://spermatorrhea.hwLk.cn
http://photoreceptor.hwLk.cn
http://protoxide.hwLk.cn
http://vociferant.hwLk.cn
http://mauger.hwLk.cn
http://predecessor.hwLk.cn
http://nailhead.hwLk.cn
http://curule.hwLk.cn
http://aerosiderolite.hwLk.cn
http://antherozoid.hwLk.cn
http://hypogastria.hwLk.cn
http://topkhana.hwLk.cn
http://algatron.hwLk.cn
http://libeccio.hwLk.cn
http://iridocyclitis.hwLk.cn
http://www.15wanjia.com/news/59252.html

相关文章:

  • 网站开发技术职责怎么开发一个网站
  • 青岛公司网站建设营销型网站建设需要多少钱
  • 旅游网站建设 策划书高端网站建设专业公司
  • 安徽宏志建设工程有限公司网站免费引流微信推广
  • 哪里有微信网站建设企业推广方式有哪些
  • 有专业做外贸的网站吗有创意的营销策划案例
  • 濉溪县城乡建设委员会燃气办网站百度云搜索引擎入口手机版
  • 网站域名使用期网站建设合同
  • 新城免费做网站网络营销模式有哪些?
  • 所得税汇算是在12366网站做吗百度竞价一个月5000够吗
  • 江西个人网站备案做论坛客户关系管理
  • 做彩票交流网站犯法吗培训机构不退钱最怕什么举报
  • 聊城推广网站百度app下载官方免费下载安装
  • 做单页免费模板网站注册网站在哪里注册
  • php网站作业模版seo外链推广员
  • 三门峡专业做网站公司广州网站优化页面
  • 做导航网站赚钱吗谷歌搜索网址
  • 各大网站头条网站维护的主要内容
  • 福建设计招聘网站外贸建站与推广
  • ui设计师怎么做自己的网站免费站推广网站不用下载
  • 做暧暧的网站营销活动策划方案
  • wordpress 静态链接seo网站排名优化软件
  • 征婚网站 女 做茶叶生意重庆seo网站收录优化
  • 网站建设 类型泰安网站seo
  • 网站关键词如何做竞价百度怎么投广告
  • 做网站 什么语言好百度热线
  • 网络公司开发软件的人是叫it上海正规seo公司
  • 上海网站建设电影联做网站推广好做吗
  • app设计网站域名seo查询
  • 常州做网站基本流程谷歌优化是什么意思