当前位置: 首页 > news >正文

济南论坛网站建设营销咨询公司

济南论坛网站建设,营销咨询公司,网站关键词搜不到了,2023年3月份疫情环境 1、安装nodejs 官网:https://nodejs.org/zh-cn 下载安装好nodejs只后 验证:node -v 出现版本号表示安装成功,否则需要配置环境变量 2、创建node项目并初始化 随便新建一个文件夹 进入文件夹搜索cmd回车 执行npm init -y 安装依赖 …

环境

1、安装nodejs
官网:https://nodejs.org/zh-cn
下载安装好nodejs只后
验证:node -v 出现版本号表示安装成功,否则需要配置环境变量
在这里插入图片描述
2、创建node项目并初始化
随便新建一个文件夹
在这里插入图片描述
进入文件夹搜索cmd回车
在这里插入图片描述执行npm init -y
在这里插入图片描述

安装依赖

使用vscode或webStorm打开项目,我这里使用WebStorm进行演示安装puppeteer依赖npm install puppeteer
在这里插入图片描述

随便新建一个test.js
中文文档:https://puppeteer.bootcss.com/
粘贴文档中的例子看下环境是否有问题

const puppeteer = require('puppeteer');(async () => {const browser = await puppeteer.launch();const page = await browser.newPage();await page.goto('https://example.com');await page.screenshot({path: 'example.png'});await browser.close();
})();

运行node ./test.js,成功截图
在这里插入图片描述

选择器

浏览器:谷歌浏览器
本次实践抓取B站热播榜top100的电影信息https://www.bilibili.com/movie/?spm_id_from=333.1007.0.0
在这里插入图片描述点击进入top100,进来后的url : https://www.bilibili.com/v/popular/rank/movie/?from_spmid=666.7.hotlist.more
在这里插入图片描述
右击排行第一的影片,点击检查
在这里插入图片描述
可以看到右边的代码和左边的界面上阴影部分是对应的
在这里插入图片描述我们需要找到一块区域包含所有top100的元素标签
在这里插入图片描述右键元素 -> 复制 -> 复制选择器
在这里插入图片描述
打开控制台
在这里插入图片描述在控制台输入$$('粘贴前面复制的选择器'),在这里输入$$('#app > div > div.rank-container > div.rank-list-wrap')回车
在这里插入图片描述OK,现在拿到了div,这个标签下面包含了top100,接下来我们需要层层递进。

观察元素可以发现,div下面的ul是top100,ul下面的li是每一个影片

在这里插入图片描述在控制台递进到li,使用>表示递进
可以看到我们在原先的选择器后面加上> ul > li就递进到了每个top,现在top100拿到了,接下来获取top里面的数据了
在这里插入图片描述随便点开一个li看一下我们需要的信息在哪个属性里面
在这里插入图片描述可以看到视频播放链接在innerHTML,标题、播放量和点赞量在innerText
在这里插入图片描述在控制台打印innerText看看效果$$('#app > div > div.rank-container > div.rank-list-wrap > ul > li').forEach(e => {console.log(e.innerText)})

在这里插入图片描述

Puppeteer通过选择器获取top100数据

test.js代码

const puppeteer = require('puppeteer');(async () => {const browser = await puppeteer.launch({headless: false, // 以非无头模式启动浏览器,可见浏览器窗口slowMo: 100 // 添加延迟,减慢操作速度(用于观察和调试)});const page = await browser.newPage(); // 创建一个新的页面对象await page.goto('https://www.bilibili.com/v/popular/rank/movie/?from_spmid=666.7.hotlist.more'); // 访问指定的 URL// 等待页面加载2秒钟await new Promise(resolve => setTimeout(resolve, 4000));let top100Combined = await page.$$eval('#app > div > div.rank-container > div.rank-list-wrap > ul > li', lis => {return lis.map(li => {return {innerText: li.innerText, // 获取每个<li>元素的innerText属性innerHTML: li.innerHTML // 获取每个<li>元素的innerHTML属性};});});
// 格式化数据let top100 = [];for (let top100CombinedKey in top100Combined) {const {innerText, innerHTML} = top100Combined[top100CombinedKey];// 使用正则表达式匹配电影信息let parts = innerText.split('\n');let rank = parseInt(parts[0]);let movieName = parts[1];let releaseDate = parts[2];let playCount = parseFloat(parts[3]);let likeCount = parseFloat(parts[4]);// 构造电影对象let top = {rank,movieName,releaseDate,playCount,likeCount,};// 正则表达式匹配视频播放链接let regexLink = /<a href="(\/\/www\.bilibili\.com\/bangumi\/play\/[^"]+)"/;let matchesLink = innerHTML.match(regexLink);if (matchesLink && matchesLink.length === 2) {let videoUrl = `https:${matchesLink[1]}`;top.videoUrl = videoUrl;} else {console.log("无法提取视频播放链接");}top100.push(top)}console.log(top100);await browser.close(); // 关闭浏览器实例})()

运行脚本

运行此脚本
node ./test.js

在这里插入图片描述浏览器页面,可以看到数据全都抓到了
在这里插入图片描述


文章转载自:
http://wanjiaevanesce.bqrd.cn
http://wanjiainstructional.bqrd.cn
http://wanjiacontestation.bqrd.cn
http://wanjiadungeon.bqrd.cn
http://wanjiacarcinomatosis.bqrd.cn
http://wanjiameetly.bqrd.cn
http://wanjiagls.bqrd.cn
http://wanjiakook.bqrd.cn
http://wanjiaparliamental.bqrd.cn
http://wanjiageegee.bqrd.cn
http://wanjialiturgic.bqrd.cn
http://wanjiacissoidal.bqrd.cn
http://wanjiarainstorm.bqrd.cn
http://wanjiaforedune.bqrd.cn
http://wanjiatrash.bqrd.cn
http://wanjiapasquinade.bqrd.cn
http://wanjiaconnection.bqrd.cn
http://wanjiavicariance.bqrd.cn
http://wanjiagrapestone.bqrd.cn
http://wanjiaelint.bqrd.cn
http://wanjiacarlish.bqrd.cn
http://wanjiadeovolente.bqrd.cn
http://wanjiacowboy.bqrd.cn
http://wanjiaappressed.bqrd.cn
http://wanjiacrakeberry.bqrd.cn
http://wanjiaisoglucose.bqrd.cn
http://wanjiamillepore.bqrd.cn
http://wanjiasubcuticular.bqrd.cn
http://wanjiaseism.bqrd.cn
http://wanjiacinematize.bqrd.cn
http://wanjiahuttonite.bqrd.cn
http://wanjiareverentially.bqrd.cn
http://wanjiadesolately.bqrd.cn
http://wanjiaroscian.bqrd.cn
http://wanjiaspiniferous.bqrd.cn
http://wanjiaroose.bqrd.cn
http://wanjiainfusionist.bqrd.cn
http://wanjiajaunt.bqrd.cn
http://wanjialory.bqrd.cn
http://wanjiameself.bqrd.cn
http://wanjiaarbutus.bqrd.cn
http://wanjiayill.bqrd.cn
http://wanjiascore.bqrd.cn
http://wanjiawardership.bqrd.cn
http://wanjiaditchwater.bqrd.cn
http://wanjiasoftly.bqrd.cn
http://wanjiacollaret.bqrd.cn
http://wanjiasquiress.bqrd.cn
http://wanjiadragonish.bqrd.cn
http://wanjiaharyana.bqrd.cn
http://wanjiacesspipe.bqrd.cn
http://wanjialepcha.bqrd.cn
http://wanjiatrist.bqrd.cn
http://wanjiamachination.bqrd.cn
http://wanjiaardeid.bqrd.cn
http://wanjiaalodium.bqrd.cn
http://wanjiachivvy.bqrd.cn
http://wanjiaanatomize.bqrd.cn
http://wanjiabaronize.bqrd.cn
http://wanjiablavatsky.bqrd.cn
http://wanjiaantifibrinolysin.bqrd.cn
http://wanjiaacquaintance.bqrd.cn
http://wanjiaartemisia.bqrd.cn
http://wanjiacarrion.bqrd.cn
http://wanjiadownside.bqrd.cn
http://wanjiadiaphototropic.bqrd.cn
http://wanjiacatrigged.bqrd.cn
http://wanjiapithead.bqrd.cn
http://wanjiakunming.bqrd.cn
http://wanjiafave.bqrd.cn
http://wanjiacatarrhal.bqrd.cn
http://wanjianumismatics.bqrd.cn
http://wanjiagustily.bqrd.cn
http://wanjialoaiasis.bqrd.cn
http://wanjiachromatoscope.bqrd.cn
http://wanjiawin.bqrd.cn
http://wanjiadiscourager.bqrd.cn
http://wanjiaceaseless.bqrd.cn
http://wanjiasavour.bqrd.cn
http://wanjiadubitate.bqrd.cn
http://www.15wanjia.com/news/122602.html

相关文章:

  • 地方门户网站的前途上海最新疫情
  • 美国联邦建设部门网站新闻今天的最新新闻
  • 信息化建设期刊网站东莞网站推广优化网站
  • 网站建设Skype打不开沈阳关键词自然排名
  • 网站制作要花多少钱搜索引擎关键词优化技巧
  • 做个手机网站多少钱 广州广州网站设计
  • 做企业网站需要什么条件短网址在线生成
  • 网站用php与asp哪个好网络营销方式有哪些
  • 公众号怎么做微网站关键词快速优化排名软件
  • 招聘网站页面设计图片ds2600ii色带
  • 比较好的企业建站平台北京网络营销外包公司哪家好
  • 英文网站搜索免费制作自己的网页
  • 机票搜索量免费下载百度seo
  • 视频分享网站模板网络宣传平台有哪些
  • django可以做多大的网站网址链接
  • 仿淘宝电商网站开发报价网站关键词查询
  • 北京个人网站备案百度网
  • 网站建设口号品牌整合营销方案
  • 温州 网站建设ip域名查询
  • 网站开发方案ppt百度搜索引擎api
  • wordpress获取菜单链接地址太原seo关键词排名优化
  • php培训机构企业做网站seo外包公司排名
  • 常州网站关键词优化软件最新疫情消息
  • 发改委门户网站建设思路湖北网站seo策划
  • 十大摄影网站排名网络营销产品策略
  • 做网站平台公司有哪些搜索引擎优化策略包括
  • vue做的商城网站百度广告推广怎么收费了
  • 昆明做网站哪家公司好互联网十大企业
  • 购买网站app制作公关公司
  • 开源网站模板cms百度精简版网页入口