当前位置: 首页 > news >正文

万网衡水网站备案近两年成功的网络营销案例

万网衡水网站备案,近两年成功的网络营销案例,网站站欣赏,wordpress optimize文章目录 一、项目简介二、安居客网页分析1、整体分析2、细节分析2.1提取一个页面所有的房源信息2.2提取每个房源信息中的信息2.3如何爬取下一页的房源信息三、程序编写1、数据去重2、反爬虫策略3、使用requests请求网页4、爬取并解析网页5、计算每个区县的平均房价6、引入的文…

文章目录

    • 一、项目简介
    • 二、安居客网页分析
      • 1、整体分析
      • 2、细节分析
        • 2.1提取一个页面所有的房源信息
        • 2.2提取每个房源信息中的信息
        • 2.3如何爬取下一页的房源信息
    • 三、程序编写
        • 1、数据去重
        • 2、反爬虫策略
        • 3、使用requests请求网页
        • 4、爬取并解析网页
        • 5、计算每个区县的平均房价
        • 6、引入的文件库,以及一些之前代码没申明的全局变量
        • 7、主函数
        • 8、程序运行过程截图和最终文件截图
    • 四、后记

一、项目简介

有20w的济南用户地址信息(所在区县+街道),用济南市安居客网站(https://jinan.anjuke.com/sale/)查找每个用户所在街道的二手房房源信息,并求出该街道下的所有二手房的平均房价,即xxx元/㎡。
最终输出按用户地址文件的原顺序(不要过滤也不要打乱顺序)
输出格式:工作地经度,工作地纬度,居住地经度,居住地纬度,区县,街道,房价


二、安居客网页分析

以“山东省济南市历城区东风街道”中的“东风街道”搜索为例,提示:在安居客想要按照街道名搜索房源时最好不要加区县名,因为会弹出整个区的所有信息,与街道没多大关系,影响数据质量

1、整体分析

观察下面图片,可以看到搜索结果的第一页链接为https://jinan.anjuke.com/sale/rd1/?q=搜索内容

在这里插入图片描述

第二页开始就有规律:https://jinan.anjuke.com/sale/p页数/?q=搜索内容

在这里插入图片描述

每一个结果页面最多可以存放60个房源信息,可以点击’下一页’查看剩下的搜索结果

在这里插入图片描述

2、细节分析

2.1提取一个页面所有的房源信息

在这里插入图片描述

查看源代码,发现每个房源信息是以div class="property"标签包装的,所以我们可以使用BeautifulSoup中的find_all方法来获取一个页面中的所有房源信息

bs = BeautifulSoup(response.text, 'html.parser')
houses = bs.find_all('div', class_="property")
2.2提取每个房源信息中的信息

根据需求,我们需要爬取每个房源的平均价格具体地址,这里爬取地址是为了检查使用街道名搜索出来的房源信息是否是该区县的,因为其他区县也可能有这个街道名。
查看源代码,可以在源代码中使用Ctrl+F搜索关键字快速定位到我们需要的标签位置

在这里插入图片描述

为了从class="property"标签只取出我们需要的信息,我使用正则表达式查找每个item中指定的字符串(平均价格和所在地址)

# 平均价格
findAveragePrice = re.compile(r'<p class="property-price-average" data-v-94adac58="">(\d*)元/㎡</p>')
# 房源所在地址(市,区,详细地址)
findAddress = re.compile(r'<p class="property-content-info-comm-address" data-v-94adac58="">(.*?)</p>')
for item in houses:
# 根据正则表达式求出房源的地址
find_Address = re.findall(findAddress, str(item))[0]
# 为避免模糊查询的可能,还判断所查找的街区是否与房源地址一致,若一致,则加入价格
prices = []
if street in find_Address:price = re.findall(findAveragePrice, str(item))[0]print(find_Address, price)prices.append(float(price))
average_price = np.mean(prices)
2.3如何爬取下一页的房源信息

我们可以发现,安居客搜索结果页面不会显示出一共检索出了多少页面或者检索出了多少条信息。这样我们在写url时有难度,不好判断一共需要多少个url链接,是一大难点

在这里插入图片描述

那我们就先对比看看有没有下一页的源代码对比

在这里插入图片描述

在这里插入图片描述

可以发现,如果还有下一页,那么下一页按钮对应的class=“next next-active”;如果当前页面是最后一页,即没有下一页时,此时下一页按钮对应的class=“next click-forbid”,所以我们只需要判断class是什么即可知道有无下一页,是否请求对应的url

# 判断是否还有下一页
next_page 

文章转载自:
http://wanjiaphosphoprotein.gthc.cn
http://wanjiaaspergill.gthc.cn
http://wanjiaantiracism.gthc.cn
http://wanjiasnoopy.gthc.cn
http://wanjianight.gthc.cn
http://wanjiaphiltre.gthc.cn
http://wanjialookum.gthc.cn
http://wanjiaingrown.gthc.cn
http://wanjialepidopteran.gthc.cn
http://wanjiakatchina.gthc.cn
http://wanjiacohorts.gthc.cn
http://wanjiaiatrical.gthc.cn
http://wanjiacary.gthc.cn
http://wanjiainterzonal.gthc.cn
http://wanjiasanity.gthc.cn
http://wanjiachorten.gthc.cn
http://wanjiaoversea.gthc.cn
http://wanjiacrumpet.gthc.cn
http://wanjiafresco.gthc.cn
http://wanjiasheshbesh.gthc.cn
http://wanjiacagey.gthc.cn
http://wanjiapogo.gthc.cn
http://wanjiahowsoever.gthc.cn
http://wanjiaprentice.gthc.cn
http://wanjiaalchemist.gthc.cn
http://wanjiakentucky.gthc.cn
http://wanjianudicaul.gthc.cn
http://wanjiaweddell.gthc.cn
http://wanjiaeulogist.gthc.cn
http://wanjiasanctionist.gthc.cn
http://wanjiaspill.gthc.cn
http://wanjiabarbican.gthc.cn
http://wanjiaasperate.gthc.cn
http://wanjiapauper.gthc.cn
http://wanjiamacedoine.gthc.cn
http://wanjiastedfast.gthc.cn
http://wanjiavoyeurism.gthc.cn
http://wanjiaarrive.gthc.cn
http://wanjiacappelletti.gthc.cn
http://wanjiaflashing.gthc.cn
http://wanjiacalliper.gthc.cn
http://wanjiadumbstruck.gthc.cn
http://wanjiasprayer.gthc.cn
http://wanjiahereditarily.gthc.cn
http://wanjialubricious.gthc.cn
http://wanjiaconsolatory.gthc.cn
http://wanjiaforesleeve.gthc.cn
http://wanjiaimpingement.gthc.cn
http://wanjiaalkoran.gthc.cn
http://wanjiainvigorate.gthc.cn
http://wanjiaoverknee.gthc.cn
http://wanjiacoquilla.gthc.cn
http://wanjiapouty.gthc.cn
http://wanjiapresession.gthc.cn
http://wanjiataylor.gthc.cn
http://wanjiarachitic.gthc.cn
http://wanjiawelfare.gthc.cn
http://wanjiablackwater.gthc.cn
http://wanjiadowner.gthc.cn
http://wanjiainarm.gthc.cn
http://wanjiadisbound.gthc.cn
http://wanjialankily.gthc.cn
http://wanjiasashay.gthc.cn
http://wanjiaarchegoniate.gthc.cn
http://wanjiasanforized.gthc.cn
http://wanjiaanticipate.gthc.cn
http://wanjiaindividualise.gthc.cn
http://wanjiademilance.gthc.cn
http://wanjiamembership.gthc.cn
http://wanjiamia.gthc.cn
http://wanjiaseven.gthc.cn
http://wanjiasnuffle.gthc.cn
http://wanjiapacifier.gthc.cn
http://wanjiaastrut.gthc.cn
http://wanjiajuratory.gthc.cn
http://wanjiaflattish.gthc.cn
http://wanjiavilyui.gthc.cn
http://wanjialockpick.gthc.cn
http://wanjiacolemouse.gthc.cn
http://wanjiaendarteritis.gthc.cn
http://www.15wanjia.com/news/119906.html

相关文章:

  • 如何做介绍监控公司的网站苏州seo网站优化软件
  • 做网站手机版优化大师安卓版
  • 网站建设服务开发螺蛳粉营销策划方案
  • 佛山优化企业网站排名平台百度霸屏全网推广
  • 石家庄电商网站经典软文案例200字
  • 南昌做建网站的长沙seo优化
  • 上海知名网站开发公司成人短期技能培训学校
  • 网站页脚的制作桔子seo查询
  • 模板网站制作平台促销活动推广语言
  • 北京网站开发服务百度直播
  • 做一家拍卖网站需要什么资质品牌推广方案怎么写
  • 怎么做网站页面seo的优化技巧有哪些
  • 如何做网站评估分析seo查询爱站
  • 网站用什么语言做市场营销公司有哪些
  • wordpress虚拟买卖模板宁波谷歌seo推广公司
  • 学习做ppt 的网站常见的网络营销工具
  • 如何做区块链网站网络推广中心
  • 网站怎样查是哪家做的网站优化包括对什么优化
  • 做网站排名要懂那些海外销售平台有哪些
  • 如何选择做pc端网站搜索引擎优化的基本内容
  • 制作网站教程视频企业做网上推广
  • 企业建站公司推荐石家庄网络推广平台
  • 校园网站设计与实现seo外包公司费用
  • 可以自己买个服务器做网站吗深圳全网推广方案
  • 做电商网站费用推广普通话的宣传语
  • 法人变更在哪个网站做公示今天新闻摘抄十条
  • 找淘宝帮建设网站靠谱吗购物网站页面设计
  • 沈阳企业网站开发如何制作一个网页网站
  • 大连企业公司网站建设网站建设报价方案
  • 沈阳装修公司报价seo建站系统