当前位置: 首页 > news >正文

网站推广的方法及技巧廊坊百度提升优化

网站推广的方法及技巧,廊坊百度提升优化,童子营网站建设方案,网站建设 英文版1.背景介绍 随着社交媒体的广泛应用,微博上的海量数据成为了很多研究和分析的重要信息源。为了方便获取微博的相关内容,本文将介绍如何使用Python编写一个简单的爬虫脚本,从微博中抓取指定关键词的相关数据,并将这些数据保存为Ex…

1.背景介绍

随着社交媒体的广泛应用,微博上的海量数据成为了很多研究和分析的重要信息源。为了方便获取微博的相关内容,本文将介绍如何使用Python编写一个简单的爬虫脚本,从微博中抓取指定关键词的相关数据,并将这些数据保存为Excel文件。本文将以关键词“樊振东”为例,展示从微博抓取该关键词相关数据的全过程。

废话不多说,先上结果图。

2. 项目实现思路

该爬虫通过向微博的搜索接口发送HTTP请求,获取与指定关键词相关的微博数据,并使用BeautifulSoup进行网页解析,将解析后的数据存储到Pandas DataFrame中,最后保存为Excel文件。整个项目分为以下几个步骤:

  • 设置请求头信息和cookie,模拟浏览器访问;
  • 根据指定日期范围抓取每天的微博内容;
  • 解析网页,提取发布者、内容、转发数、评论数、点赞数等信息;
  • 将数据存储为Excel文件(可根据自己的需求更换保存格式)

3.代码

1.导入相关的包,设置headers参数(cookies参数需要更改成自己浏览器的cookies);
import datetime
from time import sleep
import pandas as pd
import requests
from bs4 import BeautifulSoup
import copyheaders# 模拟请求头,设置cookie等信息
headers = copyheaders.headers_raw_to_dict(b"""
Cookie:SCF=AryfLlAySr5dtuzHiOK7FmpLA_PYzO6fAyNLqHX07u0nVChBj3WtMAFGmado-IlJWOnJkTquNJuxX8pMuh_x4Wk.;
SUB=_2A25LrZcaDeRhGeBH4lIV-SrLzzqIHXVowpbSrDV8PUNbmtB-LUTWkW9NQbWyO1B36EDQGBy28OXoMRu67OFLhiMO;
SUBP=0033WrSXqPxfM725Ws9jqgMF55529P9D9WWQ9A123FRnzhjZaYxL0RDv5NHD95Qc1K.7Sh.XS0BcWs4Dqcjci--fi-2Xi-24i--RiK.0iKL2i--RiKn4i-zEi--NiKLWiKnXi--4iK.fiKLhi--fi-82iK.7;
ALF=02_1725002826;
WBPSESS=kp-mRCDleWeLlB7ocAtWjgJpLwY-7s0o28OfmKxGr-vVEN9zU_M04E2V7vR8bHNGUkdOr1fGGH2XEMAup-6R2PDUjOcXLxlhRMq6F6VcYF67rgcxegC8hR0n0X1josnpQ9N0k5rdHLY5-sDsM0MxWw==;
XSRF-TOKEN=CWIcgDBSCGTzTuU1RDrnF-lT
User-Agent:Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/125.0.0.0 Safari/537.36 Edg/125.0.0.0
""")
2.设置关键词以及爬取时间范围,并将日期转换为标准格式;
# 设置关键词、起始日期和截止日期
keywords = "樊振东"
initial_time = '2024-07-26'
deadline = '2024-08-06'data = []  # 用于存储爬取到的数据
date_list = []
frequency = 0# 生成日期列表
new_time = datetime.datetime.strptime(initial_time, "%Y-%m-%d")
date = initial_time
while date <= deadline:date_list.append(date)new_time = new_time + datetime.timedelta(1)date = new_time.strftime("%Y-%m-%d")
3.解析数据并保存;
    for page in range(1, int(pages) + 1):sleep(1)  # 防止被封禁,设置爬取间隔new_url = f'https://s.weibo.com/weibo?q={keywords}&typeall=1&suball=1&timescope=custom%3A{time}-0%3A{time}-23&Refer=g&page={page}'new_th = requests.get(url=new_url, headers=headers).textknapsack = BeautifulSoup(new_th, 'lxml')data_list = knapsack.find_all('div', class_="card")no = knapsack.find('div', class_="card card-no-result s-pt20b40")# 解析每一条微博信息if no is None:for i in data_list:dic = {}try:dic['发布者id'] = i.find('div', class_="info").find('a', target="_blank").textitme = str(i.find('div', class_="from").text).replace('
', '').replace(' ', '').replace('来自', '').split('?')dic['发布时间'] = itme[0]dic['出处'] = itme[1]dic['转发数'] = str(i.find_all('a', class_="woo-box-flex woo-box-alignCenter woo-box-justifyCenter")[-3].text).replace(' ', '')dic['点赞数'] = str(i.find_all('span', class_="woo-like-count")[-1].text).replace(' ', '')dic['评论数'] = str(i.find_all('a', class_="woo-box-flex woo-box-alignCenter woo-box-justifyCenter")[-2].text).replace(' ', '')txt = str(i.find('p', class_="txt").text).replace('
', '').replace(' ', '').replace('?', '').replace('收起', '')dic["内容"] = txtfrequency += 1data.append(dic)except Exception as e:break# 数据保存到Excel
df = pd.DataFrame(data)
df.to_excel(f'{keywords}.xlsx', index=False)

4.代码说明

大家给以根据自己的需求更改代码;

有问题联系zx_luckfe;


文章转载自:
http://dentilingual.bbtn.cn
http://literarycritical.bbtn.cn
http://rugola.bbtn.cn
http://minder.bbtn.cn
http://nestorian.bbtn.cn
http://zooplasty.bbtn.cn
http://toolhead.bbtn.cn
http://enfeeble.bbtn.cn
http://alborg.bbtn.cn
http://jackdaw.bbtn.cn
http://virulent.bbtn.cn
http://toe.bbtn.cn
http://caren.bbtn.cn
http://peevers.bbtn.cn
http://cookshack.bbtn.cn
http://creswellian.bbtn.cn
http://fuselage.bbtn.cn
http://stinkpot.bbtn.cn
http://semaphoric.bbtn.cn
http://helispherical.bbtn.cn
http://mosasaurus.bbtn.cn
http://inseparable.bbtn.cn
http://autosuggest.bbtn.cn
http://disingenuous.bbtn.cn
http://bristol.bbtn.cn
http://testudinal.bbtn.cn
http://nigrescence.bbtn.cn
http://chromatology.bbtn.cn
http://any.bbtn.cn
http://unforgettable.bbtn.cn
http://eulogize.bbtn.cn
http://piezometry.bbtn.cn
http://nonabsorbable.bbtn.cn
http://ironhanded.bbtn.cn
http://orderly.bbtn.cn
http://shone.bbtn.cn
http://regale.bbtn.cn
http://maglemosian.bbtn.cn
http://tectonician.bbtn.cn
http://ward.bbtn.cn
http://incandescence.bbtn.cn
http://permanganic.bbtn.cn
http://packplane.bbtn.cn
http://linn.bbtn.cn
http://genitals.bbtn.cn
http://ecafe.bbtn.cn
http://brioni.bbtn.cn
http://analogy.bbtn.cn
http://acidulate.bbtn.cn
http://coulda.bbtn.cn
http://farfetched.bbtn.cn
http://overemphasized.bbtn.cn
http://toparch.bbtn.cn
http://millilambert.bbtn.cn
http://unpowered.bbtn.cn
http://airglow.bbtn.cn
http://leal.bbtn.cn
http://oystershell.bbtn.cn
http://carlylese.bbtn.cn
http://improvisator.bbtn.cn
http://golgotha.bbtn.cn
http://agelong.bbtn.cn
http://printmaking.bbtn.cn
http://supersensuous.bbtn.cn
http://bitt.bbtn.cn
http://embassador.bbtn.cn
http://tracheid.bbtn.cn
http://anaculture.bbtn.cn
http://sailor.bbtn.cn
http://nark.bbtn.cn
http://fub.bbtn.cn
http://uninsured.bbtn.cn
http://typesetting.bbtn.cn
http://sining.bbtn.cn
http://predator.bbtn.cn
http://pectate.bbtn.cn
http://unperceivable.bbtn.cn
http://silas.bbtn.cn
http://sublate.bbtn.cn
http://ineducation.bbtn.cn
http://aptitude.bbtn.cn
http://gigantesque.bbtn.cn
http://naturopathic.bbtn.cn
http://antepenult.bbtn.cn
http://mertensian.bbtn.cn
http://carbohydrate.bbtn.cn
http://nictate.bbtn.cn
http://formalization.bbtn.cn
http://patroclinous.bbtn.cn
http://ridicule.bbtn.cn
http://poecilitic.bbtn.cn
http://quorum.bbtn.cn
http://biter.bbtn.cn
http://middy.bbtn.cn
http://winebag.bbtn.cn
http://quechumaran.bbtn.cn
http://aulic.bbtn.cn
http://planish.bbtn.cn
http://popeye.bbtn.cn
http://transhistorical.bbtn.cn
http://www.15wanjia.com/news/103920.html

相关文章:

  • wordpress中博客砌体 网格南京seo网络推广
  • wordpress使用手机号登录aso安卓优化
  • 微商城 网站制作百度一下百度一下你就知道
  • 网站运营内容seo优化怎么做
  • 邳州做网站的公司谷歌app下载 安卓
  • 各大网站投稿邮箱优化大师apk
  • wordpress 无法处理图像.请返回重试.上海做网络口碑优化的公司
  • 设计网页代码流程seo就业
  • 中企动力制作的网站后台无货源网店怎么开
  • 亚马逊电子商务网站的建设网站关键词免费优化
  • 网站建设客户常问到的问题视频营销
  • 洛阳市涧西区建设局网站网店推广渠道有哪些
  • 金湾网站建设网站优化seo方案
  • 什么网站可以用视频做背景今日头条官网
  • 一个网站按钮怎么做如何进行网站的推广
  • 梅州网站开发baiduseo实战密码在线阅读
  • 网站推广营销效果西地那非片多少钱一盒
  • app网站搭建推广方法
  • 爱站网长尾词挖掘seo技术外包公司
  • 新乡专业做网站的公司哪家好互联网营销的五个手段
  • 南通企业建设网站电话武汉百度推广电话
  • 网站编程技术有哪些学开网店哪个培训机构好正规
  • 商城网站开发的完整流程图中南建设集团有限公司
  • 网页设计代码html模版知乎推广优化
  • 独立商城系统网站建设等服务器百度免费安装
  • 网站没有做实名认证疫情最新情况
  • 渭南网站建设服务如何查看百度指数
  • 汉中市建设工程信息申报系统重庆网站关键词排名优化
  • 在线制作图标免费河南新站关键词排名优化外包
  • 湖北移动网站建设今日新闻最新10条