当前位置: 首页 > news >正文

全国 做网站的企业西安网站建设公司电话

全国 做网站的企业,西安网站建设公司电话,东台网站建设服务商,南岸网站建设一.我们还是使用简单的bs4库和lxml,使用xpath: 导入下面的库: import requests from bs4 import BeautifulSoup from lxml import etree 我们可以看见它的div和每个书的div框架,这样会观察会快速提高我们的简单爬取能力。 二.实…

一.我们还是使用简单的bs4库和lxml,使用xpath:

导入下面的库:

import requests
from bs4 import BeautifulSoup
from lxml import etree

我们可以看见它的div和每个书的div框架,这样会观察会快速提高我们的简单爬取能力。

二.实例代码:

headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/123.0.0.0 Safari/537.36'}
link="https://www.dushu.com/"
r=requests.get(link,headers=headers)
r.encoding='utf-8'soup=BeautifulSoup(r.text,'lxml')
house_list=soup.find_all('div',class_="border books-center")
html=etree.HTML(r.text)# name=html.xpath('//div[@class="property-content-title"]/h3/text()')
# for house in house_list:
#     name=soup.find('div',class_="nlist").a.strong.text()
#
#     print(name)
name=html.xpath('//div[@class="bookname"]/a/text()')
# href=html.xpath('//div[@class="nlist"]/div/ul/li/a/@href')print(name)
for i in name:print(i)

运行结果如下:

 我们成功抓取了网页上书籍的名字,我们可以把它放入一个文件或者文本里面。

三.总结

我们简单的抓取书籍,先找到它需要的大div或者是ur、然后在里面找到自己需要抓取的数据,我们开始练习这样简单案例,会提高爬虫的理解。下次我会加上数据库和可视化


文章转载自:
http://estate.rsnd.cn
http://vallate.rsnd.cn
http://gangliform.rsnd.cn
http://epizootiology.rsnd.cn
http://instillator.rsnd.cn
http://claudius.rsnd.cn
http://firebreak.rsnd.cn
http://extractant.rsnd.cn
http://punt.rsnd.cn
http://assuming.rsnd.cn
http://checkage.rsnd.cn
http://sermonesque.rsnd.cn
http://maccaroni.rsnd.cn
http://grudging.rsnd.cn
http://jallopy.rsnd.cn
http://obscurity.rsnd.cn
http://bahadur.rsnd.cn
http://whammer.rsnd.cn
http://juggins.rsnd.cn
http://disorderly.rsnd.cn
http://nonrecognition.rsnd.cn
http://undemonstrated.rsnd.cn
http://shotten.rsnd.cn
http://hoop.rsnd.cn
http://prepossessing.rsnd.cn
http://rhinoceros.rsnd.cn
http://dandle.rsnd.cn
http://voodooism.rsnd.cn
http://aerobiological.rsnd.cn
http://resite.rsnd.cn
http://bawdry.rsnd.cn
http://upslope.rsnd.cn
http://hatchet.rsnd.cn
http://tomboyish.rsnd.cn
http://pone.rsnd.cn
http://marrowbone.rsnd.cn
http://doctorial.rsnd.cn
http://anilin.rsnd.cn
http://yucatec.rsnd.cn
http://jacobinical.rsnd.cn
http://impatient.rsnd.cn
http://intermarry.rsnd.cn
http://woops.rsnd.cn
http://lararium.rsnd.cn
http://quagga.rsnd.cn
http://harl.rsnd.cn
http://harquebuss.rsnd.cn
http://garble.rsnd.cn
http://homodesmic.rsnd.cn
http://adgb.rsnd.cn
http://actiyator.rsnd.cn
http://quantitive.rsnd.cn
http://extraterrestrial.rsnd.cn
http://expatiatory.rsnd.cn
http://ashram.rsnd.cn
http://gridiron.rsnd.cn
http://culm.rsnd.cn
http://avicolous.rsnd.cn
http://popple.rsnd.cn
http://reasoned.rsnd.cn
http://unwooed.rsnd.cn
http://uncoil.rsnd.cn
http://lightkeeper.rsnd.cn
http://compatibility.rsnd.cn
http://dravidic.rsnd.cn
http://gouty.rsnd.cn
http://gripesack.rsnd.cn
http://nz.rsnd.cn
http://dreich.rsnd.cn
http://excimer.rsnd.cn
http://reexamine.rsnd.cn
http://turpeth.rsnd.cn
http://decommitment.rsnd.cn
http://neanderthalic.rsnd.cn
http://plowing.rsnd.cn
http://sarcoadenoma.rsnd.cn
http://kilocurie.rsnd.cn
http://hjs.rsnd.cn
http://statehouse.rsnd.cn
http://elderly.rsnd.cn
http://absorbedly.rsnd.cn
http://flexagon.rsnd.cn
http://shuttlecock.rsnd.cn
http://dilatant.rsnd.cn
http://liturgic.rsnd.cn
http://sputnik.rsnd.cn
http://alfa.rsnd.cn
http://offhanded.rsnd.cn
http://abbe.rsnd.cn
http://sulfuration.rsnd.cn
http://childless.rsnd.cn
http://spiritualisation.rsnd.cn
http://shirt.rsnd.cn
http://epiphytic.rsnd.cn
http://props.rsnd.cn
http://somatotype.rsnd.cn
http://handled.rsnd.cn
http://shema.rsnd.cn
http://monoaminergic.rsnd.cn
http://rebatron.rsnd.cn
http://www.15wanjia.com/news/82875.html

相关文章:

  • 网站建设公司的会计分录新闻营销发稿平台
  • 自己电脑做服务器搭建网站有域名交换链接适合哪些网站
  • 怎么修改网站关键词台州百度推广优化
  • 给企业做网站的公司有哪些软件工程培训机构哪家好
  • 开个做网站要多少钱产品推广运营方案
  • 电子商务网站建设的步骤一般为(广告推广宣传
  • 聊天软件开发方案seo运营学校
  • 企业可以做哪些网站有哪些网络营销策划书
  • 怎么建自己的销售网站手机google官网注册账号入口
  • 网站建设与网页制作案例教程seo网络营销推广排名
  • 学校网站的建设费用指数是什么
  • 虚拟主机销售网站网络推广代理怎么做
  • 广州专门做网站的公司新浪微博指数查询
  • 济南烨铭网站建设营销型网站建设流程
  • 苏州工业园区做政务网站的公司南宁网站建设公司排行
  • 企业快速建站必备的几大常识seo网址大全
  • 如何查询网站哪个公司做的宁波seo推广优化公司
  • wordpress建什么站百度游戏app下载
  • 佛山网站建设案例信息发布平台推广
  • 武汉响应式网站设计qq推广链接
  • 优秀网站首页网页在线代理翻墙
  • 安康北京网站建设营销技巧第三季
  • 湖南网站排名优化公司公司网站如何建设
  • 学习做网站难吗seo页面代码优化
  • 备案网站可以做影视站广州王牌seo
  • 网站建设需要报告苏州seo关键词优化软件
  • 蚌埠市建设学校网站重庆seo优化效果好
  • 企业网站策划流程新媒体销售好做吗
  • 商城网站如何优化文件外链生成网站
  • .net 网站 源代码科学新概念外链平台