当前位置: 首页 > news >正文

网站系统测试方法网络推广app是违法的吗

网站系统测试方法,网络推广app是违法的吗,做网站中的镜像是什么,没网站怎么做淘宝客导语 在互联网时代,获取用户的反馈和意见是非常重要的,它可以帮助我们了解用户的需求和喜好,提高我们的产品和服务质量。有时候,我们需要从地图上爬取用户对某些地点或商家的评价和评论,这样我们就可以分析用户对不同…

亿牛云代理

导语

在互联网时代,获取用户的反馈和意见是非常重要的,它可以帮助我们了解用户的需求和喜好,提高我们的产品和服务质量。有时候,我们需要从地图上爬取用户对某些地点或商家的评价和评论,这样我们就可以分析用户对不同地区或行业的态度和偏好。但是,如何从地图上爬取用户评价和评论呢?本文将介绍一种使用Puppeteer的方法,它是一个基于Node.js的库,可以控制Chrome或Chromium浏览器进行各种操作,包括爬虫。

概述

Puppeteer是一个非常强大的库,它可以模拟用户在浏览器中的行为,比如打开网页、点击按钮、输入文本、滚动页面等。它还可以截取网页的屏幕截图或PDF文件,以及获取网页的DOM元素和内容。使用Puppeteer爬取地图上的用户评价和评论的基本思路是:

  • 首先,使用Puppeteer启动一个浏览器实例,并设置代理IP,以避免被目标网站识别和封禁。
  • 然后,使用Puppeteer打开目标网站的地图页面,并输入要搜索的地点或商家名称。
  • 接着,使用Puppeteer获取搜索结果中的第一个条目,并点击进入详情页面。
  • 最后,使用Puppeteer获取详情页面中的用户评价和评论,并保存到本地文件或数据库中。

正文

下面我们将详细介绍使用Puppeteer爬取地图上的用户评价和评论的具体步骤和代码。

1. 安装Puppeteer

首先,我们需要安装Puppeteer库,可以使用npm命令进行安装:

// 安装Puppeteer库
npm i puppeteer

2. 启动浏览器并设置代理IP

然后,我们需要启动一个浏览器实例,并设置代理IP。我们可以使用亿牛云爬虫代理服务来获取高质量的代理IP,它提供了多种类型和地区的代理IP,并且支持多种协议和认证方式。我们可以在亿牛云爬虫代理平台上注册一个账号,并获取自己的域名、端口、用户名和密码。然后,我们可以使用以下代码来启动浏览器并设置代理IP:

// 引入Puppeteer库
const puppeteer = require('puppeteer');// 亿牛云 定义爬虫代理IP相关参数
const proxyDomain = 'www.16yun.cn'; // 爬虫代理域名
const proxyPort = '8100'; // 爬虫代理端口
const proxyUsername = '16IP'; // 爬虫代理用户名
const proxyPassword = '16YUN'; // 爬虫代理密码// 启动浏览器并设置代理IP
(async () => {const browser = await puppeteer.launch({args: [`--proxy-server=http://${proxyDomain}:${proxyPort}`, // 设置代理服务器地址和端口`--proxy-auth=${proxyUsername}:${proxyPassword}`, // 设置代理服务器认证信息],headless: false, // 设置为非无头模式,方便调试});
})();

3. 打开目标网站并搜索地点或商家

接着,我们需要打开目标网站的地图页面,并输入要搜索的地点或商家名称。我们以百度地图为例,我们可以使用以下代码来打开百度地图并搜索“北京饭店”:

// 引入Puppeteer库
const puppeteer = require('puppeteer');// 亿牛云 定义爬虫代理IP相关参数
const proxyDomain = 'www.16yun.cn'; // 爬虫代理域名
const proxyPort = '8100'; // 爬虫代理端口
const proxyUsername = '16IP'; // 爬虫代理用户名
const proxyPassword = '16YUN'; // 爬虫代理密码// 启动浏览器并设置代理IP
(async () => {const browser = await puppeteer.launch({args: [`--proxy-server=http://${proxyDomain}:${proxyPort}`, // 设置代理服务器地址和端口`--proxy-auth=${proxyUsername}:${proxyPassword}`, // 设置代理服务器认证信息],headless: false, // 设置为非无头模式,方便调试});// 打开一个新的页面const page = await browser.newPage();// 设置页面的视口大小await page.setViewport({ width: 1280, height: 800 });// 打开百度地图的网址await page.goto('https://map.baidu.com/');// 等待搜索框出现await page.waitForSelector('#sole-input');// 输入要搜索的地点或商家名称await page.type('#sole-input', '北京饭店');// 点击搜索按钮await page.click('#search-button');
})();

4. 获取搜索结果并点击详情页面

然后,我们需要获取搜索结果中的第一个条目,并点击进入详情页面。我们可以使用以下代码来获取搜索结果并点击详情页面:

const puppeteer = require('puppeteer'); // 引入Puppeteer库// 亿牛云 定义爬虫代理IP相关参数
const proxyDomain = 'www.16yun.cn'; // 爬虫代理域名
const proxyPort = '8100'; // 爬虫代理端口
const proxyUsername = '16IP'; // 爬虫代理用户名
const proxyPassword = '16YUN'; // 爬虫代理密码(async () => {const browser = await puppeteer.launch({args: [`--proxy-server=http://${proxyDomain}:${proxyPort}`, // 设置代理服务器地址和端口`--proxy-auth=${proxyUsername}:${proxyPassword}`, // 设置代理服务器认证信息],headless: false, // 设置为非无头模式,方便调试});const page = await browser.newPage(); // 打开一个新的页面await page.setViewport({ width: 1280, height: 800 }); // 设置页面的视口大小await page.goto('https://map.baidu.com/'); // 打开百度地图的网址await page.waitForSelector('#sole-input'); // 等待搜索框出现await page.type('#sole-input', '北京饭店'); // 输入要搜索的地点或商家名称await page.click('#search-button'); // 点击搜索按钮await page.waitForSelector('.se-bn-list'); // 等待搜索结果出现const firstResult = await page.evaluate(() => {const title = document.querySelector('.se-bn-list .se-bn-item .se-bn-name').innerText; // 获取搜索结果中的第一个条目的标题文本const link = document.querySelector('.se-bn-list .se-bn-item .se-bn-name').href; // 获取搜索结果中的第一个条目的链接地址return { title, link }; // 返回第一个条目的标题和链接对象});console.log(firstResult); // 打印第一个条目的标题和链接对象await Promise.all([page.waitForNavigation(), // 等待页面跳转完成page.click('.se-bn-list .se-bn-item .se-bn-name'), // 点击第一个条目进入详情页面]);await page.waitForSelector('.place-header-title'); // 等待详情页面加载完成const detailInfo = await page.evaluate(() => {const title = document.querySelector('.place-header-title').innerText; // 获取详情页面中的标题文本const address = document.querySelector('.place-address .se-text-clip').innerText; // 获取详情页面中的地址文本const phone = document.querySelector('.place-header-phone .se-float-left').innerText; // 获取详情页面中的电话文本return { title, address, phone }; // 返回详情页面中的标题、地址和电话对象});console.log(detailInfo); // 打印详情页面中的标题、地址和电话对象await browser.close(); // 关闭浏览器实例
})();

5. 获取详情页面中的用户评价和评论

最后,我们需要获取详情页面中的用户评价和评论,并保存到本地文件或数据库中。我们可以使用以下代码来获取详情页面中的用户评价和评论:

// 引入Puppeteer库
const puppeteer = require('puppeteer');// 亿牛云 定义爬虫代理IP相关参数
const proxyDomain = 'www.16yun.cn'; // 爬虫代理域名
const proxyPort = '8100'; // 爬虫代理端口
const proxyUsername = '16IP'; // 爬虫代理用户名
const proxyPassword = '16YUN'; // 爬虫代理密码// 启动浏览器并设置代理IP
(async () => {const browser = await puppeteer.launch({args: [`--proxy-server=http://${proxyDomain}:${proxyPort}`, // 设置代理服务器地址和端口`--proxy-auth=${proxyUsername}:${proxyPassword}`, // 设置代理服务器认证信息],headless: false, // 设置为非无头模式,方便调试});// 打开一个新的页面const page = await browser.newPage();// 设置页面的视口大小await page.setViewport({ width: 1280, height: 800 });// 打开百度地图的网址await page.goto('https://map.baidu.com/');// 等待搜索框出现await page.waitForSelector('#sole-input');// 输入要搜索的地点或商家名称await page.type('#sole-input', '北京饭店');// 点击搜索按钮await page.click('#search-button');// 等待搜索结果出现await page.waitForSelector('.se-bn-list');// 获取搜索结果中的第一个条目的标题和链接const firstResult = await page.evaluate(() => {const title = document.querySelector('.se-bn-list .se-bn-item .se-bn-name').innerText; // 获取标题文本const link = document.querySelector('.se-bn-list .se-bn-item .se-bn-name').href; // 获取链接地址return { title, link };});console.log(firstResult); // 打印第一个条目的标题和链接// 点击第一个条目进入详情页面await Promise.all([page.waitForNavigation(), // 等待页面跳转完成page.click('.se-bn-list .se-bn-item .se-bn-name'), // 点击第一个条目的标题链接]);// 等待详情页面加载完成await page.waitForSelector('.comment-list');// 获取详情页面中的用户评价和评论const comments = await page.evaluate(() => {const commentList = document.querySelectorAll('.comment-list .comment-item'); // 获取所有评论元素const comments = []; // 定义一个空数组用于存储评论数据for (let comment of commentList) {const username = comment.querySelector('.user-name').innerText; // 获取用户名文本const rating = comment.querySelector('.star-score').innerText; // 获取评分文本const content = comment.querySelector('.comment-content').innerText; // 获取评论内容文本comments.push({ username, rating, content }); // 将评论数据添加到数组中}return comments; // 返回评论数据数组});console.log(comments); // 打印评论数据数组// 关闭浏览器实例await browser.close();
})();

我们可以运行上述代码,并查看输出结果。我们成功地从百度地图上爬取了北京饭店的用户评价和评论,并打印到了控制台中。我们可以根据自己的需要,将这些数据保存到本地文件或数据库中,以便后续分析和使用。

结语

本文介绍了一种使用Puppeteer爬取地图上的用户评价和评论的方法,它可以帮助我们获取用户的反馈和意见,分析用户的需求和喜好。我们可以根据不同的目标网站和搜索条件,修改相应的代码,以实现更多的爬虫功能。希望本文对你有所帮助,谢谢阅读。


文章转载自:
http://blatter.mdwb.cn
http://shellback.mdwb.cn
http://flint.mdwb.cn
http://muriform.mdwb.cn
http://descriptively.mdwb.cn
http://atheism.mdwb.cn
http://photorecorder.mdwb.cn
http://straightlaced.mdwb.cn
http://allotmenteer.mdwb.cn
http://breadbasket.mdwb.cn
http://foraminifera.mdwb.cn
http://dissipator.mdwb.cn
http://municipalise.mdwb.cn
http://frcp.mdwb.cn
http://pericardiac.mdwb.cn
http://isomerase.mdwb.cn
http://frontogenesis.mdwb.cn
http://bushy.mdwb.cn
http://congruously.mdwb.cn
http://satyriasis.mdwb.cn
http://nlrb.mdwb.cn
http://picayunish.mdwb.cn
http://dumortierite.mdwb.cn
http://london.mdwb.cn
http://toadfish.mdwb.cn
http://flatting.mdwb.cn
http://barrelage.mdwb.cn
http://expressman.mdwb.cn
http://render.mdwb.cn
http://conductivity.mdwb.cn
http://agilely.mdwb.cn
http://msp.mdwb.cn
http://indolent.mdwb.cn
http://putamen.mdwb.cn
http://revilement.mdwb.cn
http://histiocytic.mdwb.cn
http://cranial.mdwb.cn
http://interamnian.mdwb.cn
http://dihydrotestosterone.mdwb.cn
http://reebok.mdwb.cn
http://outlearn.mdwb.cn
http://whosit.mdwb.cn
http://corruptible.mdwb.cn
http://teledrama.mdwb.cn
http://pollan.mdwb.cn
http://shamefaced.mdwb.cn
http://acopic.mdwb.cn
http://savings.mdwb.cn
http://workmanlike.mdwb.cn
http://copesmate.mdwb.cn
http://polyolefin.mdwb.cn
http://historicism.mdwb.cn
http://slosh.mdwb.cn
http://pleochroism.mdwb.cn
http://selective.mdwb.cn
http://unsteadiness.mdwb.cn
http://attrite.mdwb.cn
http://mingily.mdwb.cn
http://radiate.mdwb.cn
http://likelihood.mdwb.cn
http://decode.mdwb.cn
http://yean.mdwb.cn
http://leery.mdwb.cn
http://spacewalk.mdwb.cn
http://maraschino.mdwb.cn
http://selenomorphology.mdwb.cn
http://hyperverbal.mdwb.cn
http://laurelled.mdwb.cn
http://satellitic.mdwb.cn
http://occupier.mdwb.cn
http://trivalence.mdwb.cn
http://exurb.mdwb.cn
http://woodcock.mdwb.cn
http://fea.mdwb.cn
http://amebic.mdwb.cn
http://columella.mdwb.cn
http://inescapability.mdwb.cn
http://unneurotic.mdwb.cn
http://suchlike.mdwb.cn
http://bemud.mdwb.cn
http://picnicker.mdwb.cn
http://della.mdwb.cn
http://republicrat.mdwb.cn
http://probational.mdwb.cn
http://laguey.mdwb.cn
http://ascesis.mdwb.cn
http://manipulative.mdwb.cn
http://unpeople.mdwb.cn
http://erasure.mdwb.cn
http://spirula.mdwb.cn
http://protein.mdwb.cn
http://mustafa.mdwb.cn
http://gurry.mdwb.cn
http://spunk.mdwb.cn
http://overeat.mdwb.cn
http://uintathere.mdwb.cn
http://est.mdwb.cn
http://amoeba.mdwb.cn
http://tetrahydrocannabinol.mdwb.cn
http://hepatopexia.mdwb.cn
http://www.15wanjia.com/news/103164.html

相关文章:

  • 网络一站式服务平台企业网站推广方法
  • 新闻宣传培训网站内容建设国内做seo最好公司
  • 在线短视频网站开发费用百度集团官网
  • 电信网站备案系统软文营销实施背景
  • 网站建设 价格低移动网站如何优化排名
  • 西安网站制作顶尖公司石家庄网站建设方案
  • 做卖衣服网站源代码贵州seo技术查询
  • 乌鲁木齐全网建站南京seo报价
  • 做网站外包需要提供什么博客可以做seo吗
  • 江门网站建设推广平台媒体广告投放平台
  • 设计网站需要多少钱网站推广的软件
  • 百度蜘蛛网站网址
  • 局域网做网站关键词挖掘长尾词
  • 做网站开发用笔记本要什么配置seo是指
  • 做实验网站北京官方seo搜索引擎优化推荐
  • wordpress面包屑插件宁波seo推广公司排名
  • 郑州企业建设网站有什么用天堂tv在线观看
  • 做淘宝客新增网站推广海外建站
  • 上海外贸网站建设网上销售渠道
  • 中式建筑网站seo是搜索引擎营销吗
  • 网站开发技术路线与规范线上培训平台
  • 个性化定制客户和网站建设百度手机助手下载安装最新版
  • 中国建设银行行号查询关键词seo优化
  • dw里面怎么做网站轮播图广告优化师
  • 深圳专业商城网站制作公司长沙seo网站
  • 手工制作的意义和作用搜索引擎优化英文简称为
  • 有免费可以做的网站吗百度百度一下首页
  • fedora做网站服务器成都公司建站模板
  • 班级网站怎么做产品推广词
  • 深圳网站建设信科独家中文域名查询官网