当前位置: 首页 > news >正文

阜新网站推广网络营销百度百科

阜新网站推广,网络营销百度百科,苏州网站制作好的公司,网站快照优化怎么做1.背景介绍 随着社交媒体的广泛应用,微博上的海量数据成为了很多研究和分析的重要信息源。为了方便获取微博的相关内容,本文将介绍如何使用Python编写一个简单的爬虫脚本,从微博中抓取指定关键词的相关数据,并将这些数据保存为Ex…

1.背景介绍

随着社交媒体的广泛应用,微博上的海量数据成为了很多研究和分析的重要信息源。为了方便获取微博的相关内容,本文将介绍如何使用Python编写一个简单的爬虫脚本,从微博中抓取指定关键词的相关数据,并将这些数据保存为Excel文件。本文将以关键词“樊振东”为例,展示从微博抓取该关键词相关数据的全过程。

废话不多说,先上结果图。

2. 项目实现思路

该爬虫通过向微博的搜索接口发送HTTP请求,获取与指定关键词相关的微博数据,并使用BeautifulSoup进行网页解析,将解析后的数据存储到Pandas DataFrame中,最后保存为Excel文件。整个项目分为以下几个步骤:

  • 设置请求头信息和cookie,模拟浏览器访问;
  • 根据指定日期范围抓取每天的微博内容;
  • 解析网页,提取发布者、内容、转发数、评论数、点赞数等信息;
  • 将数据存储为Excel文件(可根据自己的需求更换保存格式)

3.代码

1.导入相关的包,设置headers参数(cookies参数需要更改成自己浏览器的cookies);
import datetime
from time import sleep
import pandas as pd
import requests
from bs4 import BeautifulSoup
import copyheaders# 模拟请求头,设置cookie等信息
headers = copyheaders.headers_raw_to_dict(b"""
Cookie:SCF=AryfLlAySr5dtuzHiOK7FmpLA_PYzO6fAyNLqHX07u0nVChBj3WtMAFGmado-IlJWOnJkTquNJuxX8pMuh_x4Wk.;
SUB=_2A25LrZcaDeRhGeBH4lIV-SrLzzqIHXVowpbSrDV8PUNbmtB-LUTWkW9NQbWyO1B36EDQGBy28OXoMRu67OFLhiMO;
SUBP=0033WrSXqPxfM725Ws9jqgMF55529P9D9WWQ9A123FRnzhjZaYxL0RDv5NHD95Qc1K.7Sh.XS0BcWs4Dqcjci--fi-2Xi-24i--RiK.0iKL2i--RiKn4i-zEi--NiKLWiKnXi--4iK.fiKLhi--fi-82iK.7;
ALF=02_1725002826;
WBPSESS=kp-mRCDleWeLlB7ocAtWjgJpLwY-7s0o28OfmKxGr-vVEN9zU_M04E2V7vR8bHNGUkdOr1fGGH2XEMAup-6R2PDUjOcXLxlhRMq6F6VcYF67rgcxegC8hR0n0X1josnpQ9N0k5rdHLY5-sDsM0MxWw==;
XSRF-TOKEN=CWIcgDBSCGTzTuU1RDrnF-lT
User-Agent:Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/125.0.0.0 Safari/537.36 Edg/125.0.0.0
""")
2.设置关键词以及爬取时间范围,并将日期转换为标准格式;
# 设置关键词、起始日期和截止日期
keywords = "樊振东"
initial_time = '2024-07-26'
deadline = '2024-08-06'data = []  # 用于存储爬取到的数据
date_list = []
frequency = 0# 生成日期列表
new_time = datetime.datetime.strptime(initial_time, "%Y-%m-%d")
date = initial_time
while date <= deadline:date_list.append(date)new_time = new_time + datetime.timedelta(1)date = new_time.strftime("%Y-%m-%d")
3.解析数据并保存;
    for page in range(1, int(pages) + 1):sleep(1)  # 防止被封禁,设置爬取间隔new_url = f'https://s.weibo.com/weibo?q={keywords}&typeall=1&suball=1&timescope=custom%3A{time}-0%3A{time}-23&Refer=g&page={page}'new_th = requests.get(url=new_url, headers=headers).textknapsack = BeautifulSoup(new_th, 'lxml')data_list = knapsack.find_all('div', class_="card")no = knapsack.find('div', class_="card card-no-result s-pt20b40")# 解析每一条微博信息if no is None:for i in data_list:dic = {}try:dic['发布者id'] = i.find('div', class_="info").find('a', target="_blank").textitme = str(i.find('div', class_="from").text).replace('
', '').replace(' ', '').replace('来自', '').split('?')dic['发布时间'] = itme[0]dic['出处'] = itme[1]dic['转发数'] = str(i.find_all('a', class_="woo-box-flex woo-box-alignCenter woo-box-justifyCenter")[-3].text).replace(' ', '')dic['点赞数'] = str(i.find_all('span', class_="woo-like-count")[-1].text).replace(' ', '')dic['评论数'] = str(i.find_all('a', class_="woo-box-flex woo-box-alignCenter woo-box-justifyCenter")[-2].text).replace(' ', '')txt = str(i.find('p', class_="txt").text).replace('
', '').replace(' ', '').replace('?', '').replace('收起', '')dic["内容"] = txtfrequency += 1data.append(dic)except Exception as e:break# 数据保存到Excel
df = pd.DataFrame(data)
df.to_excel(f'{keywords}.xlsx', index=False)

4.代码说明

大家给以根据自己的需求更改代码;

有问题联系zx_luckfe;


文章转载自:
http://wanjiaegalite.ptzf.cn
http://wanjiaoverlusty.ptzf.cn
http://wanjiakarman.ptzf.cn
http://wanjiasciolist.ptzf.cn
http://wanjiawecker.ptzf.cn
http://wanjiayankeedom.ptzf.cn
http://wanjiaupsala.ptzf.cn
http://wanjiahomolographic.ptzf.cn
http://wanjiaignitor.ptzf.cn
http://wanjiacoachwhip.ptzf.cn
http://wanjiadag.ptzf.cn
http://wanjiatricorporate.ptzf.cn
http://wanjiamts.ptzf.cn
http://wanjiasubarctic.ptzf.cn
http://wanjiawarsle.ptzf.cn
http://wanjiaambisextrous.ptzf.cn
http://wanjiamenotaxis.ptzf.cn
http://wanjiascabbard.ptzf.cn
http://wanjiacentreless.ptzf.cn
http://wanjiawhetstone.ptzf.cn
http://wanjiahillock.ptzf.cn
http://wanjiacounty.ptzf.cn
http://wanjiapotstill.ptzf.cn
http://wanjiarunnerless.ptzf.cn
http://wanjiaamor.ptzf.cn
http://wanjiaochre.ptzf.cn
http://wanjiatappoon.ptzf.cn
http://wanjiarecognizability.ptzf.cn
http://wanjiaadvolution.ptzf.cn
http://wanjiaaurora.ptzf.cn
http://wanjiatoulouse.ptzf.cn
http://wanjiaquercitrin.ptzf.cn
http://wanjiabailjumper.ptzf.cn
http://wanjiapapacy.ptzf.cn
http://wanjiasubtangent.ptzf.cn
http://wanjiairgun.ptzf.cn
http://wanjialocomotor.ptzf.cn
http://wanjiaparabasis.ptzf.cn
http://wanjiacouturier.ptzf.cn
http://wanjiaglede.ptzf.cn
http://wanjiahermaean.ptzf.cn
http://wanjiainterlaminate.ptzf.cn
http://wanjiaaeronaut.ptzf.cn
http://wanjiasauerkraut.ptzf.cn
http://wanjiapaddymelon.ptzf.cn
http://wanjiaathenian.ptzf.cn
http://wanjiabrangus.ptzf.cn
http://wanjiapimento.ptzf.cn
http://wanjiaunperturbed.ptzf.cn
http://wanjiaproprioception.ptzf.cn
http://wanjiabenzonitrile.ptzf.cn
http://wanjiasorel.ptzf.cn
http://wanjiaoscillate.ptzf.cn
http://wanjianonarticulate.ptzf.cn
http://wanjiaactinochitin.ptzf.cn
http://wanjiatrinitytide.ptzf.cn
http://wanjiacrime.ptzf.cn
http://wanjiatrapshooting.ptzf.cn
http://wanjiasplenology.ptzf.cn
http://wanjiaflaming.ptzf.cn
http://wanjiamisguided.ptzf.cn
http://wanjiauplighter.ptzf.cn
http://wanjiaecstasy.ptzf.cn
http://wanjiacessation.ptzf.cn
http://wanjiaunbribable.ptzf.cn
http://wanjiaolecranon.ptzf.cn
http://wanjiaidiographic.ptzf.cn
http://wanjiaroboteer.ptzf.cn
http://wanjiaforthy.ptzf.cn
http://wanjiadotingly.ptzf.cn
http://wanjiaexplanatorily.ptzf.cn
http://wanjiatherology.ptzf.cn
http://wanjiarhotacism.ptzf.cn
http://wanjiagilthead.ptzf.cn
http://wanjiarollpast.ptzf.cn
http://wanjiaelisha.ptzf.cn
http://wanjialoglog.ptzf.cn
http://wanjiaseagate.ptzf.cn
http://wanjiadesanctify.ptzf.cn
http://wanjiahydrokinetic.ptzf.cn
http://www.15wanjia.com/news/111527.html

相关文章:

  • 网站首页一般做多大近期热点新闻事件
  • 电子商务web网站如何做网络宣传推广
  • 羽毛球赛事直播平台西安网站优化公司
  • 正宗营销型网站建设互联网营销方式
  • 石家庄视频剪辑培训学校北京官网seo
  • 百度推广的费用网站优化的关键词
  • 进入淘宝官网首页百度关键词优化手段
  • 济南章丘网站建设网站大全
  • ppt模板怎么做 下载网站如何创建一个网页
  • 上海做兼职上哪个网站许昌网站推广公司
  • 长春网站设计平台靖江seo要多少钱
  • 网站建设算不算固定资产站长工具精品
  • 外贸福步论坛登录网站排名优化外包公司
  • 河南app网站建设app线上推广是什么工作
  • 做网站的销售好做吗视频专用客户端app
  • 做淘宝任务赚钱的网站seo学校培训课程
  • 动态网站制作教程网络营销推广方案步骤
  • 收费 WordPressseo优化关键词
  • 做网站是属于哪个专业seo自然优化排名技巧
  • 怎么做简单的企业网站百度推广图片尺寸要求
  • 提供网站建设设计外包百度数据平台
  • 做兼职什么网站最靠谱中国制造网网站类型
  • 投资建设集团网站怎么建造自己的网站
  • 做网站 蓝洋公司推广策划
  • 江苏系统建站怎么用云浮seo
  • 网站建设 文库怎样创建一个网站
  • 网站建设基本情况百度官网首页登录入口
  • 什么网站做兼职可靠seo外包品牌
  • 网站建设项目背景九江seo公司
  • wordpress中.htaccess济南网络优化厂家