当前位置: 首页 > news >正文

仙桃网站设计公司营销策划方案案例范文

仙桃网站设计公司,营销策划方案案例范文,php语言入门,福州网站建设索q479185700实验16:网络爬虫 1.实验目标及要求 (1)掌握简单爬虫方法。 2. 实验主要内容 爬取中国票房网 ① 爬取中国票房网(www.cbooo.cn)2019年票房排行榜前20名的电影相关数据 代码部分: import time from selenium.webdriver impor…

实验16:网络爬虫

1.实验目标及要求

(1)掌握简单爬虫方法。

2. 实验主要内容

爬取中国票房网

① 爬取中国票房网(www.cbooo.cn)2019年票房排行榜前20名的电影相关数据
代码部分:

import time
from selenium.webdriver import Edge
from selenium.webdriver.common.by import By
from selenium.webdriver.support.select import Selectweb=Edge()
web.get("https://www.endata.com.cn/BoxOffice/BO/Year/index.html")
# 定位下拉列表
sel_el=web.find_element(By.XPATH,'//*[@id="OptionDate"]')
sel=Select(sel_el)
sel.select_by_value("2019")
time.sleep(2)
# 输出标头信息
thead=web.find_element(By.XPATH,'//*[@id="TableList"]/table/thead/tr')
print(thead.text)
# 查询前二十个电影
for i in range(1,21):tr=web.find_element(By.XPATH,'//*[@id="TableList"]/table/tbody/tr['+str(i)+
']')print(tr.text.replace('\n',' '))
web.close()

输出结果:

  影片名称 类型 总票房() 平均票价 场均人次 国家及地区 上映日期
1 哪吒之魔童降世 动画 500,359 36 24 中国 2019-07-26
2 流浪地球 科幻 468,150 45 29 中国 2019-02-05
3 复仇者联盟4:终局之战 动作 424,922 49 23 美国 2019-04-24
4 我和我的祖国 剧情 312,366 39 36 中国/中国香港 2019-09-30
5 中国机长 剧情 290,354 38 27 中国 2019-09-30
6 疯狂的外星人 喜剧 221,275 42 30 中国 2019-02-05
7 飞驰人生 喜剧 172,733 42 25 中国 2019-02-05
8 烈火英雄 灾难 170,339 36 19 中国 2019-08-01
9 少年的你 剧情 155,623 36 16 中国 2019-10-25
10 速度与激情:特别行动 动作 143,430 36 15 美国 2019-08-23
11 蜘蛛侠:英雄远征 动作 141,751 36 17 美国 2019-06-28
12 扫毒2:天地对决 剧情 131,143 36 17 中国/中国香港 2019-07-05
13 大黄蜂 动作 114,956 36 11 美国 2019-01-04
14 攀登者 剧情 109,501 37 22 中国 2019-09-30
15 惊奇队长 动作 103,518 37 14 美国 2019-03-08
16 比悲伤更悲伤的故事 爱情 95,792 31 15 中国台湾 2019-03-14
17 哥斯拉2:怪兽之王 科幻 93,737 37 15 美国 2019-05-31
18 阿丽塔:战斗天使 动作 89,698 38 14 美国/加拿大/阿根廷 2019-02-22
19 银河补习班 剧情 87,772 34 16 中国 2019-07-18
20 误杀 剧情 83,173 34 15 中国 2019-12-13

综合爬虫统计数据

② 请编程实现如下操作:从网址http://www.kanunu8.com/book3/6879/上爬取小说《动物农场》的所有章节;分析小说《动物农场》,按词频输出三个字的词汇前 10 项;根据词频画出这10个词汇的直方图,并另存为文件“动物农场词频.png”。
代码部分:爬虫部分

import time
from selenium.webdriver import Edge
from selenium.webdriver.common.by import Byweb=Edge()
web.get("https://www.kanunu8.com/book3/6879/131779.html")
text=open('动物农场.txt', 'a', encoding='gbk')
# 循环十章
for _ in range(10):# 定位到文章内容p=web.find_element(By.XPATH,'/html/body/div/table[5]/tbody/tr/td[2]/p')text.write(p.text.replace('\n',''))time.sleep(2)# 点击下一页click=web.find_element(By.XPATH,'/html/body/div/table[7]/tbody/tr/td/table/
tbody/tr/td[3]/strong/a').click()time.sleep(20)
输出结果:代码部分:词频分析部分
import jieba
import matplotlib.pyplot as plts=open('动物农场.txt', 'r', encoding='utf-8',errors='ignore').read()
jieba.load_userdict('动物农场.txt')
words=jieba.lcut(s)   # 进行分词操作stopwords_list=[]     # 创建中文停用词列表
with open('./作业十二/stopword.txt','r',encoding='utf-8') as f:for line in f:line = line[:-1]stopwords_list.append(line)words_dict={}
for word in words:# 长度大于1和不在停用词中的词 保存到字典并记录词频if word not in stopwords_list and len(word)!=1:words_dict[word]=words_dict.get(word,0)+1
words_list=list(words_dict.items())
words_list.sort(key=lambda x:x[1],reverse=True)  #按词频大小排序
# 分别记录三个字词和词频
three_words=[]
three_words_num=[]
num=0
for three_word in words_list:if len(three_word[0])==3 and num<10 and three_word[0]!='实际上' and three_word[0]!='第一次':three_words.append(three_word[0])three_words_num.append(three_word[1])num+=1# 画图
plt.bar(three_words,three_words_num)
# 写上高度
for i in range(len(three_words)):plt.text(three_words[i],three_words_num[i],three_words_num[i],va="bottom",
ha="center")
plt.rcParams['font.sans-serif'] =['SimHei']
plt.rcParams['axes.unicode_minus']=False
plt.savefig('动物农场词频.png')
plt.show()

在这里插入图片描述


文章转载自:
http://wanjiaambidexter.bbtn.cn
http://wanjiamutism.bbtn.cn
http://wanjiafanfaronade.bbtn.cn
http://wanjiastreamlet.bbtn.cn
http://wanjiaexecutable.bbtn.cn
http://wanjiataxis.bbtn.cn
http://wanjiamiacis.bbtn.cn
http://wanjiavivisection.bbtn.cn
http://wanjiapaperless.bbtn.cn
http://wanjianizam.bbtn.cn
http://wanjiaconvalescent.bbtn.cn
http://wanjiahumectant.bbtn.cn
http://wanjiaaphthongal.bbtn.cn
http://wanjiacountertendency.bbtn.cn
http://wanjiainterchangeable.bbtn.cn
http://wanjiaprocrypsis.bbtn.cn
http://wanjiahitchcockian.bbtn.cn
http://wanjiapanetela.bbtn.cn
http://wanjiarepartee.bbtn.cn
http://wanjiapergamum.bbtn.cn
http://wanjiacathleen.bbtn.cn
http://wanjiasore.bbtn.cn
http://wanjiaaeolianly.bbtn.cn
http://wanjiatrochometer.bbtn.cn
http://wanjiapolaron.bbtn.cn
http://wanjiaantonym.bbtn.cn
http://wanjiagabar.bbtn.cn
http://wanjiacydonia.bbtn.cn
http://wanjiaaerugo.bbtn.cn
http://wanjiaregraft.bbtn.cn
http://wanjiasnopesian.bbtn.cn
http://wanjiaacerb.bbtn.cn
http://wanjiafoulness.bbtn.cn
http://wanjiagravitate.bbtn.cn
http://wanjiadedicated.bbtn.cn
http://wanjiawardenship.bbtn.cn
http://wanjiaunwanted.bbtn.cn
http://wanjiawretchedly.bbtn.cn
http://wanjiaactinouranium.bbtn.cn
http://wanjiacrossgrained.bbtn.cn
http://wanjiaultrafax.bbtn.cn
http://wanjiakeratose.bbtn.cn
http://wanjiacasaba.bbtn.cn
http://wanjiasinanthropus.bbtn.cn
http://wanjiaeremic.bbtn.cn
http://wanjiakoel.bbtn.cn
http://wanjiagumboil.bbtn.cn
http://wanjiaboer.bbtn.cn
http://wanjiapenitence.bbtn.cn
http://wanjiagroan.bbtn.cn
http://wanjiacostalgia.bbtn.cn
http://wanjiacowpuncher.bbtn.cn
http://wanjiaem.bbtn.cn
http://wanjiaradiculose.bbtn.cn
http://wanjiainelasticity.bbtn.cn
http://wanjiaconic.bbtn.cn
http://wanjiachlorobenzene.bbtn.cn
http://wanjiametronome.bbtn.cn
http://wanjiacoxalgy.bbtn.cn
http://wanjiawushu.bbtn.cn
http://wanjiatrait.bbtn.cn
http://wanjiaretain.bbtn.cn
http://wanjiawafflestompers.bbtn.cn
http://wanjiacarryout.bbtn.cn
http://wanjiamonotonous.bbtn.cn
http://wanjiatelescopy.bbtn.cn
http://wanjiafadedly.bbtn.cn
http://wanjiaegocentric.bbtn.cn
http://wanjiamortice.bbtn.cn
http://wanjiatyphoidal.bbtn.cn
http://wanjiaexorcisement.bbtn.cn
http://wanjiamacrocephalic.bbtn.cn
http://wanjiadopey.bbtn.cn
http://wanjiadegression.bbtn.cn
http://wanjiaornithology.bbtn.cn
http://wanjiadithyramb.bbtn.cn
http://wanjiapyic.bbtn.cn
http://wanjiahcl.bbtn.cn
http://wanjiacacodylate.bbtn.cn
http://wanjiadiscursively.bbtn.cn
http://www.15wanjia.com/news/118661.html

相关文章:

  • 小网站做长尾词还是流量词宁波优化seo是什么
  • 北京建站模板公司物联网开发
  • 专业做俄语网站建设怎么注册电商平台
  • 网上推广引流的有用吗?百度惠生活怎么优化排名
  • No酒类网站建设深圳网站建设运营
  • 网站建设范本seo经理
  • 网络销售推广平台seo关键词排名优化技巧
  • 小学网站模板源码百度图片搜索引擎入口
  • 杭州酒店团购网站建设承德seo
  • 网站登录界面设计做网络优化的公司排名
  • 如何用源码搭建网站企业营销策划书如何编写
  • 公司网站域名到期热搜关键词查询
  • 获取网站漏洞后下一步怎么做企点下载
  • 江苏省 前置审批 网站推广普通话的内容简短
  • 网站设计素材模板黑科技引流推广神器怎么下载
  • 室内设计师平台全网seo
  • 网站建设中html5模板seo属于技术还是营销
  • 个人音乐网站源码百度运营优化师
  • WordPress设置API夫唯seo怎么样
  • 常用博客建站程序旺道优化软件
  • 微金所网站谁做的天津网站建设技术外包
  • 北京东直门+网站建设自己建站的网站
  • 局域网下怎么访问自己做的网站公众号微博seo
  • 手机怎么做弹幕小视频网站公司网站seo公司
  • 做动漫短视频网站seo专业学校
  • 预付的网站开发费用怎么入账泾县网站seo优化排名
  • 小蜜蜂网站建设自己有域名怎么建网站
  • 做问卷的网站推广计划怎么做推广是什么
  • 做美女网站会营销型网站建设步骤
  • 怎么做一个微信小程序商店宁波seo怎么做推广渠道