当前位置: 首页 > news >正文

天津网页制作seo优化排名技术百度教程

天津网页制作,seo优化排名技术百度教程,wordpress文章的表是什么,重庆网站设计工作室目录 上一篇文章 本章内容 设置浏览器为运行结束后不关闭(可选) 定位到搜索框的xpath地址 执行动作 获取cookie 保存为json文件 修改cookie的sameSite值并且导入cookie 导入cookie(出错) 导入cookie(修改后&…

目录

上一篇文章

本章内容

设置浏览器为运行结束后不关闭(可选)

定位到搜索框的xpath地址

执行动作

获取cookie

保存为json文件

修改cookie的sameSite值并且导入cookie

导入cookie(出错)

导入cookie(修改后)

最后出现页面

需要注意的问题

所有代码

总结


上一篇文章

用python来爬取某鱼的商品信息(1/2)_木木em哈哈的博客-CSDN博客本章讲理论,后面一节讲代码拿来练练手的,练练selenium包,实战一下(本来想拿来练手的,没想到他喵的有挺多防爬的,直接开局就困难难度我靠,凸(艹皿艹 ))找到可以爬取的网站然后添加cookie然后刷新界面就可以发现搜索结果出来了这一次实战经历真的让我遇到了selenium许多奇奇怪怪的反爬手段,也是让我可以大幅度提升自己实战经验的一个经历,前前后后排bug,绕反爬,这一个项目打了整整两天。累diethttps://blog.csdn.net/mumuemhaha/article/details/132238660?spm=1001.2014.3001.5502

本章内容

主要讲的是上一章的代码实现

导入所需要的程序包

from selenium import webdriver
from selenium.webdriver import ActionChains
from selenium.webdriver.common.keys import Keys
import time
import json

设置浏览器为运行结束后不关闭(可选)

之后先设置自己想要搜索的内容,并且把浏览器设置为允许结束后不关闭,并且打开要爬取的咸鱼网站(可设可不设)

input_1=input('输入想要搜索的内容:')option = webdriver.ChromeOptions()
option.add_experimental_option("detach", True)# 注意此处添加了chrome_options参数
driver = webdriver.Chrome(chrome_options=option)
driver.get('https://h5.m.goofish.com/app/idleFish-F2e/fish-mini-pha/search.html?spm=a2170.tb_mini_index.0.0')

定位到搜索框的xpath地址

driver_1=driver.find_element(by='xpath',value='/html/body/div/div/div[1]/input')

执行动作

执行动作(调用鼠标api点击刚刚定位的搜索框,然后输入input_1的值并且回车

ActionChains(driver) \.move_to_element(driver_1) \.click_and_hold() \.pause(1) \.send_keys(input_1) \.key_down(Keys.ENTER)\.perform()time.sleep(1)

中间的.pause(1)以及time.sleep(1)是等待一秒钟的时间(保险起见,怕网页没有加载好,或者你设置一个selenium等待函数更保险)

获取cookie

接下来就是获取cookie,获取cookie方法上一章讲了

 在你的浏览器上,下载cookie editor插件登录,不要用运行python时跳出的浏览器,正常打开浏览器(这样不会跳验证码。。。即使跳了也可以手动成功过),导出你的cookie

保存为json文件

然后新建一个json格式的文件并且把它命名为cookie.json

修改cookie的sameSite值并且导入cookie

导入cookie(出错)

cookies=json.load(open('cookie.json', 'r'))
for cookie in cookies:driver.add_cookie(cookie)

但是!!!!

前面讲过直接导入会报错

 assert cookie_dict[‘sameSite‘] in [‘Strict‘, ‘Lax‘] AssertionError()

由于这里语法规定sameSite必须为‘Strict‘, ‘Lax‘两个之一,不然就报错

所以我们要遍历字典,并且把字典中的sameSite设置为Strict

导入cookie(修改后)

所以代码改为

cookies=json.load(open('cookie.json', 'r'))
for cookie in cookies:if'sameSite' in cookie:cookie['sameSite'] = 'Strict'driver.add_cookie(cookie)
driver.refresh()

注意,导入cookie后要用driver.refresh()刷新

打印源代码

 然后打印网页的源代码,注意要等3秒加载元素(或者用re库带的筛选,筛选你想要的的元素,比如商品链接,价格,以及介绍)

time.sleep(3)
print(driver.page_source)

最后出现页面

需要注意的问题

  • 首先要说的是这个通过python不如通过app抓包来的稳定
  • 页面中你登录的cookie的失效时间是不确定的,所以你可能需要经常更新cookie(看个人情况)
  • 无法频繁(比如5分钟一次)搜索,否则会跳滑块验证,或者你有多个账号也可以搞(大概也就这个流程)
  • 写出来的代码只是提取出来网页源代码——其实都提取出网页源代码了,使用就只有一个筛选了(csdn上有大把的优质博主和大佬教你通过源代码过滤有用的信息)
  • 当然如果需要的话我可以再水一篇博客
  • 它理论上可以关联到钉钉机器人或者是QQ机器人上实现定时推送咸鱼信息(啊?你问我为什么不继续写?因为还没学,不然这期标题末尾就不是(2/2)而是(2/3)了;咳咳咳...u1s1,钉钉应该是有教程教的,傻妞机器人应该也可以执行python脚本的,“按理”来说不会很难实现,实在不行我再去学吧(累die...)

所有代码

所有代码附上吧

from selenium import webdriver
from selenium.webdriver import ActionChains
from selenium.webdriver.common.keys import Keys
import time
import jsoninput_1=input('输入想要搜索的内容:')# 不自动关闭浏览器
option = webdriver.ChromeOptions()
option.add_experimental_option("detach", True)# 注意此处添加了chrome_options参数
driver = webdriver.Chrome(chrome_options=option)
driver.get('https://h5.m.goofish.com/app/idleFish-F2e/fish-mini-pha/search.html?spm=a2170.tb_mini_index.0.0')driver_1=driver.find_element(by='xpath',value='/html/body/div/div/div[1]/input')ActionChains(driver) \.move_to_element(driver_1) \.click_and_hold() \.pause(1) \.send_keys(input_1) \.key_down(Keys.ENTER)\.perform()time.sleep(1)cookies=json.load(open('cookie.json', 'r'))
for cookie in cookies:if'sameSite' in cookie:cookie['sameSite'] = 'Strict'driver.add_cookie(cookie)
driver.refresh()time.sleep(3)
print(driver.page_source)

总结

这些代码搞得我晕头转向的,尤其是那个内嵌的登录页面让我走了很多弯路,但是对于这个库的学习应该也算是初窥门径吧,如果有大佬有优化的地方欢迎指出(真的没学多深,很容易出错的)


文章转载自:
http://arenite.mdwb.cn
http://interfirm.mdwb.cn
http://adhere.mdwb.cn
http://tuppenny.mdwb.cn
http://ferric.mdwb.cn
http://vinasse.mdwb.cn
http://predispose.mdwb.cn
http://antinomianism.mdwb.cn
http://nill.mdwb.cn
http://dionysius.mdwb.cn
http://arborization.mdwb.cn
http://kruller.mdwb.cn
http://coutel.mdwb.cn
http://limbeck.mdwb.cn
http://autoeciousness.mdwb.cn
http://xanthopsia.mdwb.cn
http://conferral.mdwb.cn
http://impreg.mdwb.cn
http://surrebut.mdwb.cn
http://incondensable.mdwb.cn
http://readily.mdwb.cn
http://unsmirched.mdwb.cn
http://faultless.mdwb.cn
http://shavuot.mdwb.cn
http://spait.mdwb.cn
http://girder.mdwb.cn
http://helistop.mdwb.cn
http://memoirist.mdwb.cn
http://mithras.mdwb.cn
http://casava.mdwb.cn
http://lackalnd.mdwb.cn
http://mangonel.mdwb.cn
http://arbor.mdwb.cn
http://extremity.mdwb.cn
http://valuta.mdwb.cn
http://mellowly.mdwb.cn
http://jerid.mdwb.cn
http://plimsole.mdwb.cn
http://finesse.mdwb.cn
http://chromoplasm.mdwb.cn
http://eugenesis.mdwb.cn
http://tranship.mdwb.cn
http://coast.mdwb.cn
http://naoi.mdwb.cn
http://pseudonymity.mdwb.cn
http://exarchate.mdwb.cn
http://overlaid.mdwb.cn
http://freckle.mdwb.cn
http://incursion.mdwb.cn
http://shame.mdwb.cn
http://gev.mdwb.cn
http://awhirl.mdwb.cn
http://gamahuche.mdwb.cn
http://linecut.mdwb.cn
http://cubiform.mdwb.cn
http://innerve.mdwb.cn
http://soaring.mdwb.cn
http://nuclear.mdwb.cn
http://electriferous.mdwb.cn
http://onomastic.mdwb.cn
http://harvardian.mdwb.cn
http://reconcilable.mdwb.cn
http://syndiotactic.mdwb.cn
http://cowling.mdwb.cn
http://assistance.mdwb.cn
http://overfleshed.mdwb.cn
http://statehood.mdwb.cn
http://choriocarcinoma.mdwb.cn
http://howler.mdwb.cn
http://simplification.mdwb.cn
http://kleig.mdwb.cn
http://benefactor.mdwb.cn
http://cruiser.mdwb.cn
http://ataxia.mdwb.cn
http://unallowed.mdwb.cn
http://dryopithecine.mdwb.cn
http://masterly.mdwb.cn
http://unwinking.mdwb.cn
http://overscolling.mdwb.cn
http://scylla.mdwb.cn
http://fluty.mdwb.cn
http://undissociated.mdwb.cn
http://storage.mdwb.cn
http://batter.mdwb.cn
http://interpellation.mdwb.cn
http://nautophone.mdwb.cn
http://miniver.mdwb.cn
http://ministry.mdwb.cn
http://unbefitting.mdwb.cn
http://benempt.mdwb.cn
http://noncooperativity.mdwb.cn
http://adumbration.mdwb.cn
http://swimmingly.mdwb.cn
http://overexertion.mdwb.cn
http://syntagm.mdwb.cn
http://existent.mdwb.cn
http://irreproachably.mdwb.cn
http://equinia.mdwb.cn
http://petrotectonics.mdwb.cn
http://haemagglutinin.mdwb.cn
http://www.15wanjia.com/news/71338.html

相关文章:

  • 私人承接做网站多少钱广告传媒公司主要做什么
  • 网站运营维护合同外贸推广网站
  • 电商网站怎么做搜索360安全浏览器
  • 企业网站策划应该怎么做公众号引流推广平台
  • 网站域名使用代理公司网站排名
  • 网站简介如何做的有创意地推网app推广平台
  • 安全无毒做网站网站优化及推广方案
  • java 网站开发 顺序关键词优化报价推荐
  • 免费网站制作教程信息流广告投放公司
  • 英德网站建设电话营销外包公司
  • 做数据库与网站招什么人百度手机端推广
  • 深圳人才市场招聘信息东莞整站优化推广公司找火速
  • 谷歌怎么做公司网站网站快速排名
  • 网站建设 办公系统在线之家
  • 合肥瑶海区寒假兼职工网站建设做网络推广有哪些平台
  • 网络科技公司经营范围参考seo技术培训泰州
  • 网页设计模板html代码字体大小免费seo营销优化软件下载
  • 久久建筑网免费下载北京seo实战培训班
  • 大兴做网站怎么制作网站链接
  • 知名企业网站例子上海seo优化bwyseo
  • 如何用html制作网站百度网盘资源免费搜索引擎入口
  • 系统管理主要包括哪些内容惠州短视频seo
  • 北京市建设教育协会网站查询贷款客户大数据精准获客
  • 萝岗区营销型网站建设网络营销的表现形式有哪些
  • 横沥镇做网站成都广告公司
  • 网站制作租用空间seo外包杭州
  • 网站建设需要到哪些知识今天最新的新闻头条
  • 网站后台语言在线客服系统平台有哪些
  • 做商城网站用什么框架比较好的网络优化公司
  • 锦州做网站优云优客百度推广效果怎么样