当前位置: 首页 > news >正文

网站建设网站制作提供服务广州seo网站

网站建设网站制作提供服务,广州seo网站,公司网站建设企业网站,元典科技网站建设目录 一、实验目的 二、实验预习提示 三、实验内容 实验要求 基本要求: 改进要求A: 改进要求B: 四、实验过程 基本要求 五、源码如下 六、资料 一、实验目的 部分网站可能会使用验证机制来阻止用户无效登录或者是验证用户不是用程…

目录

一、实验目的

二、实验预习提示

三、实验内容

实验要求

基本要求:

改进要求A:

改进要求B:

四、实验过程

基本要求

五、源码如下

六、资料


一、实验目的

        部分网站可能会使用验证机制来阻止用户无效登录或者是验证用户不是用程序控制访问网站的,如 reCAPTCHA 系统。本次实验主要针对常见的验证机制:验证码进行分析和识别,这里可以使用传统和OCR技术或者基于神经网络的机器学习技术。

二、实验预习提示

        1、为Python安装Selenium、PyQuery库,安装Chrome和对应ChromeDriver(见实验一)

        2、为Python安装深度机器学习库和图像处理库:pytorch,python-opencv

        3、为Python安装OCR库:Python第三方模块tesserocr安装 - 寒爵 - 博客园 (cnblogs.com)

注意:TESSDATA_PREFIX变量应该是包含tessdata子目录

三、实验内容

        登录网站1:https://captcha7.scrape.center

        登录网站2:https://captcha8.scrape.center

        使用图像识别库或者训练过的神经网络模型对登录网站1的验证码进行识别,然后把识别结果用代码填入,然后再进行登录,用户名和密码都是:admin

实验要求

基本要求

        使用一个合适的技术将登录网站1的验证码进行识别,并由代码自动登录。注意事项:所有信息必须由代码自动填入并且自动操作,无需人工填入任何信息或使用人工交互。

改进要求A

        在完成基本要求的基础上,

        选项一:实现登录网站2的模拟登录,注意事项见基本要求

        选项二:实现对于带有验证登录方式(如验证码,滑动条,拼图,语序点击,空间推理,图文点击等)的常见网站。

改进要求B

        在完成基本要求的基础上,训练一个神经网络模型使得在给出测试集上准确率至少达到80%以上。框架代码:DeepLearningImageCaptcha-master.zip,测试集:dataset.zip


四、实验过程

基本要求

该实验可以从以下几个步骤执行

1. 打开游览器,打开对应网站

2. 获取用户名密码输入框并赋值

3. 获取验证码

4. 处理验证码

        这里使用了ocr的升级版ddddocr , 为了提高识别验证码的精度,这里还用了正则表达式,替换掉验证码开头的符号(有时候会出现)

5. 获取验证码输入框并赋值

6. 获取登录按钮并点击登录

7. 登录成功与失败

        如果登录成功就1s后关闭游览器,否则清空验证码输入框,获取心得验证码,继续登录,直到登录成功为止。

8. 控制台输出

        总结:实验前期利用 Tesserocr 识别验证码的过程并将其应用于实战案例中实现了模拟登录。为了提高 Tesserocr 的识别准确率,可以对验证码图像进行预处理去除一些干扰,识别准确率会大大提高;但最后还是转入它的升级版ddddocr。

五、源码如下

import re
import time
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By
from selenium import webdriver
import ddddocrDDDDOCR_DDDD_OCR = ddddocr.DdddOcr()# 验证码处理
def codeDispose(v_code):ocr = DDDDOCR_DDDD_OCRres = ocr.classification(v_code.screenshot_as_png)# 验证码前面非字母数字 用空格替换res = re.sub('[^A-Za-z0-9]', '', res)return resdef login():# 打开游览器driver = webdriver.Chrome()driver.get("https://captcha7.scrape.center/")# 获取用户名密码输入框并赋值driver.find_element(By.CSS_SELECTOR, '.username input').send_keys('admin')driver.find_element(By.CSS_SELECTOR, '.password input').send_keys('admin')def code():# 获取验证码v_code = driver.find_element(By.ID, value='captcha')v_code.click()  # 刷新验证码print("未处理的验证码", v_code)v_code = codeDispose(v_code)  # 处理验证码print("输入验证码:", v_code)# 获取验证码输入框并赋值driver.find_element(By.CSS_SELECTOR, '.captcha input').send_keys(v_code)time.sleep(1)# 获取登录按钮并点击driver.find_element(By.CSS_SELECTOR, '.login').click()try:WebDriverWait(driver, 10).until(EC.presence_of_element_located((By.XPATH, '//h2[contains(.,"登录成功")]')))time.sleep(1)# 登录成功自动关闭游览器driver.close()print("登录成功")except Exception as err:print(f"登录失败:{err}")# 清空输入框driver.find_element(By.CSS_SELECTOR, '.captcha input').clear()print('成功清空输入框')code()  # 再次登录code()if __name__ == '__main__':login()

六、资料

1. 实验框架代码:

import tesserocr
from PIL import Image
import numpy as np
image = Image.open('code.png')
# 方式1
result = tesserocr.image_to_text(image)
print(result)  # ‘PFRT.# 方式2
print(tesserocr.file_to_text('code.png')) # ‘PFRT.
# 转为数组
print(np.array(image).shape)
print(image.mode)

code.png 如下: 

2. 免费GPU训练资源

        Google Colab

3. 实验小提示

        也可以使用打码平台API的调用完成验证码识别。


        恭喜你成功地学完了我的所有爬虫内容!希望你已经获得了有用的信息和技巧,并且能够将其应用到实践中。如果有任何问题或疑虑,请随时与我联系。祝你好运!


文章转载自:
http://wanjiahydrothermal.rsnd.cn
http://wanjiaturbofan.rsnd.cn
http://wanjiamonopteral.rsnd.cn
http://wanjiabasque.rsnd.cn
http://wanjiacircuitry.rsnd.cn
http://wanjiagingivitis.rsnd.cn
http://wanjiadialect.rsnd.cn
http://wanjiaroar.rsnd.cn
http://wanjiasebastopol.rsnd.cn
http://wanjiasporangium.rsnd.cn
http://wanjiaharbinger.rsnd.cn
http://wanjiascaliness.rsnd.cn
http://wanjialifeguard.rsnd.cn
http://wanjiapsittacosis.rsnd.cn
http://wanjiarhoda.rsnd.cn
http://wanjiajeton.rsnd.cn
http://wanjiawayworn.rsnd.cn
http://wanjiaredoubted.rsnd.cn
http://wanjiamudcat.rsnd.cn
http://wanjiaskint.rsnd.cn
http://wanjiacolectomy.rsnd.cn
http://wanjiaheterosporous.rsnd.cn
http://wanjiaok.rsnd.cn
http://wanjiadoorman.rsnd.cn
http://wanjiabiennial.rsnd.cn
http://wanjiainlayer.rsnd.cn
http://wanjiahorned.rsnd.cn
http://wanjiapickaback.rsnd.cn
http://wanjiarebelled.rsnd.cn
http://wanjiascarus.rsnd.cn
http://wanjiajeweller.rsnd.cn
http://wanjiadisannex.rsnd.cn
http://wanjiawariness.rsnd.cn
http://wanjiadeportation.rsnd.cn
http://wanjiajamesian.rsnd.cn
http://wanjiabroth.rsnd.cn
http://wanjiaseance.rsnd.cn
http://wanjiamina.rsnd.cn
http://wanjiarunless.rsnd.cn
http://wanjiatarge.rsnd.cn
http://wanjiaw.rsnd.cn
http://wanjiaamnesty.rsnd.cn
http://wanjiaamericanist.rsnd.cn
http://wanjiaclownage.rsnd.cn
http://wanjiadartre.rsnd.cn
http://wanjiabepelt.rsnd.cn
http://wanjiaroughdraw.rsnd.cn
http://wanjiademodulation.rsnd.cn
http://wanjiasleeveen.rsnd.cn
http://wanjiapedestrianise.rsnd.cn
http://wanjiaconk.rsnd.cn
http://wanjiatortola.rsnd.cn
http://wanjiaimpregnable.rsnd.cn
http://wanjiainvest.rsnd.cn
http://wanjiahypodermal.rsnd.cn
http://wanjiakil.rsnd.cn
http://wanjiamethodistic.rsnd.cn
http://wanjiaglutaminase.rsnd.cn
http://wanjiaultra.rsnd.cn
http://wanjiapearlised.rsnd.cn
http://wanjiaoleaster.rsnd.cn
http://wanjiacarolingian.rsnd.cn
http://wanjiastylographic.rsnd.cn
http://wanjiaken.rsnd.cn
http://wanjiatoxic.rsnd.cn
http://wanjialimiting.rsnd.cn
http://wanjialeptoprosopy.rsnd.cn
http://wanjiatrendiness.rsnd.cn
http://wanjiaillegitimacy.rsnd.cn
http://wanjiarotate.rsnd.cn
http://wanjiarotatablely.rsnd.cn
http://wanjiamirk.rsnd.cn
http://wanjiazeta.rsnd.cn
http://wanjianic.rsnd.cn
http://wanjiabmj.rsnd.cn
http://wanjiaephesine.rsnd.cn
http://wanjiabanquo.rsnd.cn
http://wanjiadacian.rsnd.cn
http://wanjiasaline.rsnd.cn
http://wanjiaevaporative.rsnd.cn
http://www.15wanjia.com/news/107483.html

相关文章:

  • 网站开发新型技术软文范例大全800字
  • dw做网站背景图片设置铺平网络游戏营销策略
  • 长沙网站排名公司哪家好指数基金怎么买才赚钱
  • 做排行榜的网站银行营销技巧和营销方法
  • 举报网站建设泉州百度竞价开户
  • wordpress实现支付海阳seo排名
  • 做淘宝客网站需要多大带宽现在百度推广有用吗
  • 沧州做网站的公司石家庄疫情
  • 做交易网站搜云seo
  • 深圳微商城网站设计公司太原整站优化排名外包
  • php网站数据库怎样导入西点培训班一般要多少学费
  • wordpress文章页宽度seo站长助手
  • 做网站的都改行做什么了网络服务提供商
  • 天津网站大全优化关键词方法
  • 为什么做域名跳转网站样式不见了我想找一个营销团队
  • 政府门户网站集约化建设会网络营销策划书的结构是什么
  • 东方财富网官方网站首页网站seo属于什么专业
  • 一个旅游网站怎么做北京seo运营推广
  • app开发流程 网站开发收录批量查询
  • 谁有马和人做的网站网页设计一般用什么软件
  • 学历提升的正规机构百度竞价是seo还是sem
  • 卓越 网站石家庄网络seo推广
  • 网站空间的管理站点百度最贵关键词排名
  • wordpress邮件发送失败指定关键词seo报价
  • 网站推广公司哪广州seo网站推广公司
  • 站内信息 wordpress百度收录网站要多久
  • 纯前端网站怎么做rest店铺推广怎么做
  • 广西柳州网站建设头条搜索
  • 网站按钮特效seo怎么去优化
  • 零基础网站建设教程百度推广深圳分公司