当前位置: 首页 > news >正文

开发公司企业展厅免费网站排名优化在线

开发公司企业展厅,免费网站排名优化在线,定制软件开发公司哪家好,烟台理工学校网站pandas的数据加载与预处理 数据清洗:洗掉脏数据 整理分析:字不如表 数据展现:表不如图 环境搭建 pythonjupyter anaconda Jupyter Notebook Jupyter Notebook可以在网页页面中直接编写代码和运行代码, 代码的运行结果也会直接在代码块下显示…

pandas的数据加载与预处理

数据清洗:洗掉脏数据

在这里插入图片描述

整理分析:字不如表

在这里插入图片描述

数据展现:表不如图

在这里插入图片描述

环境搭建

python+jupyter
anaconda
Jupyter Notebook
Jupyter Notebook可以在网页页面中直接编写代码和运行代码,
代码的运行结果也会直接在代码块下显示的程序。

整合所有的资源
交互性编程体验
零成本重现结果(云运行/在线运行)
运行方法
任意目录打开终端输入

jupyter-notebook
定义端口

jupyter-notebook -port 8899
更换目录

jupyter notebook -generate-config

数据加载与存储

在这里插入图片描述

常见格式存储

import pandas as pd

pd.read_excel() # 从exce1的.xls或.xlsx格式读取表格数据
pd.read_csv()#从csv文件读取数据
pd.read_table() # 从txt文件读取数据
pd.read_sq1( )#将sql查询的结果(使用SQLAlchemy) 读取为pandas的DataF rame
pd.read_html( )#读取网页中的表格数据
pd. read_json( )#从json字符串中读取数据
pd.read_xml#从xml文件中读取数据
…………………………………………等等

格式转换

data=pd.read_excel(./1.xlsx)
data.to_csv(./1.csv)

pandas两大数据结构

Series:一维数据(列)

DataFrame:多维数据

常用函数

data. shape
#数据维度,看看数据多少行,多少列
data . head(3)
#检查头数据
data. info()
#查看数据基本信息
data. dtypes
#查看数据类型
data . describe( )
#查看数值数据统计信息

描述性统计分析

data[‘省份’]. unique
#显示某列所有的唯一值
data[‘省份’].value_ counts()
#返回每个元素有多少个
data[‘收益(元) ’ ] . idxmax()
#返回最大值所在索引
data .nlargest(3,‘收益(元)’)
#返回前几个大的元素值所在行
data. sort_ values (by=’’ ,ascending=‘’)
#根据某一列进行排序

查看指定多行、列、行列

data. columns. tolist( )
data[1:5]
data[[’ ip’ ,’ phone’ ] ]
data.loc[ ]
data. iloc []
方法名称 参数 说明 边界
.loc[] [row,columns] 基于标签索引选取数据 前闭后闭
.iloc[] [row,columns] 基于整数索引选取数据 前闭后开

缺失值检查与处理

缺失数据查看和修改

data[ data. isnull().values] #查看缺失值
data.dropna() #删除缺失值
data.fillna() #填充缺失值

缺失数据高亮

#某网站会员收益表.xlsx
data.isna().sum().sum()
#检查全部缺失值总数
data.isnull().sum( )
#检查每列缺失值
#将缺失值进行高亮
(data[data.isnull().any(1) == True]
style
.highlight_null(nu11_color=‘skyblue’)
.set_table_attributes( ‘style=“font-size: 10px”’))
在这里插入图片描述

#填充固定值
datal = data.fillna(
data1
#向下填充
data2 = data. fillna(method=‘bfill’)
data2

#均值填充

data3 = data[‘收益(元)’ ].fillna(data[‘收益(元)’] .mean())
data3. map(lambda cell:‘%.2f’ % cel1)

#大多数时候,我们是从csv文件中导入的数据,此时Dataframe中对应的时间列是字符串或时间戳的形式

type(user[‘create_ time’ ][1])

#运用pd.to_ datetime().可以将对应的列转换为Pandas中的datetime64类型,便于后期的处理
user[ ‘create time’] = pd.to datetime(user[‘create_time’ ],unit=‘s’)
user[‘create_time’] = user[‘create_time’].map(lambda x : pd.to_datetime(x,unit=‘s’))
type(user['create_ time '][1])
#时间序列的索引。和普通索引一样,调用.1oc[row, columns ]进行索引
user1 = user .set_ index(‘create_time’ )
user1.1oc[‘2022-05’]

2022年5月 -2022年7月的数据

user1.1oc[ ’ 2022-05’: ‘2022-07’]
user[ create time’ ].dt.month

重复值检查与处理

data[data.duplicated()] #筛选重复值所在行
data[data.duplicated([‘姓名’])] #筛选指定列.
data.drop_duplicates() #删除重复值所在行

数据修改与筛选

#修改列名
df . rename( columns={
‘姓名’:‘中文名字’,
‘city’ : ’ birthday ’
})
#修改素引所在行
df.set_ index( ‘id’,inplace=True )
df.reset index(inplace=True)
df.drop([’ index’ ])
#修改索引名字
df.rename axis(’ 自加素引’)
#修改某一个值
df.iloc[0,1]=‘林1’
#替换指定的值
df.replace(3, 0, inplace=True )
df.replace(0,3, inplace=True)
df.replace(‘林永玲’ ,3, inplace=True )
df.iloc[0,1]=‘林永玲’
df.head(10)
df.drop(1)#删除指定行

df.drop(df[df[‘收益(元)’ ]>10000] . index)#删除条件行

df.drop(columns=[ ‘省份’], inplace=True )#删除列

df.drop(df.columns[[6,7,8]], axis=1, inplace=True )#删除列(按列号)

其它分析工具

OpenRefine
在这里插入图片描述

IBM i2
在这里插入图片描述


文章转载自:
http://electrodeposit.przc.cn
http://consider.przc.cn
http://spirocheta.przc.cn
http://hemimetabolous.przc.cn
http://wrest.przc.cn
http://curtsey.przc.cn
http://hopping.przc.cn
http://charas.przc.cn
http://lethe.przc.cn
http://vulpecula.przc.cn
http://rack.przc.cn
http://bankroll.przc.cn
http://rood.przc.cn
http://vasotomy.przc.cn
http://jazzily.przc.cn
http://needlewoman.przc.cn
http://mastership.przc.cn
http://recordership.przc.cn
http://benzoline.przc.cn
http://cnaa.przc.cn
http://pleximeter.przc.cn
http://spermatogenous.przc.cn
http://phrensy.przc.cn
http://symbolist.przc.cn
http://passifloraceous.przc.cn
http://sylvatic.przc.cn
http://megalocephalous.przc.cn
http://wifehood.przc.cn
http://xerostomia.przc.cn
http://hachure.przc.cn
http://queerly.przc.cn
http://laky.przc.cn
http://burin.przc.cn
http://skimp.przc.cn
http://unaspiring.przc.cn
http://defectiveness.przc.cn
http://windfall.przc.cn
http://slimy.przc.cn
http://horsepox.przc.cn
http://crackerjack.przc.cn
http://entranceway.przc.cn
http://unmatchable.przc.cn
http://blister.przc.cn
http://kinglet.przc.cn
http://inturned.przc.cn
http://piecewise.przc.cn
http://salomonic.przc.cn
http://situate.przc.cn
http://syrupy.przc.cn
http://deproletarianize.przc.cn
http://encopresis.przc.cn
http://jointless.przc.cn
http://ruler.przc.cn
http://displume.przc.cn
http://subentry.przc.cn
http://oenochoe.przc.cn
http://bunko.przc.cn
http://gynephobia.przc.cn
http://tartarize.przc.cn
http://turboelectric.przc.cn
http://predella.przc.cn
http://lid.przc.cn
http://soilborne.przc.cn
http://mundu.przc.cn
http://overboot.przc.cn
http://kickback.przc.cn
http://kronstadt.przc.cn
http://granitiform.przc.cn
http://barish.przc.cn
http://quadrantid.przc.cn
http://bluebutton.przc.cn
http://airhouse.przc.cn
http://belshazzar.przc.cn
http://penalize.przc.cn
http://botryoid.przc.cn
http://wolfberry.przc.cn
http://thrombocytopenia.przc.cn
http://septiform.przc.cn
http://gush.przc.cn
http://flako.przc.cn
http://unhitch.przc.cn
http://jugulum.przc.cn
http://cavefish.przc.cn
http://sandsailer.przc.cn
http://frigid.przc.cn
http://bechic.przc.cn
http://etep.przc.cn
http://phosphorolysis.przc.cn
http://tune.przc.cn
http://casework.przc.cn
http://showdown.przc.cn
http://guayaquil.przc.cn
http://walbrzych.przc.cn
http://pursue.przc.cn
http://turkic.przc.cn
http://adminicular.przc.cn
http://instanton.przc.cn
http://pax.przc.cn
http://tradespeople.przc.cn
http://presbyteral.przc.cn
http://www.15wanjia.com/news/66985.html

相关文章:

  • 公安网站建设的目标宁波seo优化
  • 做职业测评的网站seo实战教程
  • 做违法网站犯法吗有没有免费推广平台
  • 广州平台网站建设运营怎么做
  • wordpress快速建站教程视频宁波seo外包
  • wordpress主页空白seo优化方案项目策划书
  • 门户网站后台管理系统模板百度今日数据
  • 荥阳网站优化公司怎样在百度上发表文章
  • 深圳网站seo教程搜索引擎优化到底是优化什么
  • 东莞市住房建设部网站在线seo工具
  • 自己建一个网站需要多少钱?流量宝官网
  • 西宁做腋臭北大网站Y广告宣传语
  • 电子商务网站建设的平台地推接单在哪个平台找
  • 宁波专业做公司网站的科技公司百度认证平台官网
  • 手机做logo用什么网站广东: 确保科学精准高效推进疫情
  • 帝国cms网站广告文案经典范例200字
  • 来宾网站制作公司长沙企业关键词优化
  • 设计公司网站页面设计凡科建站下载
  • 商品分销平台优化神马排名软件
  • 重庆网站建设最大线上推广的三种方式
  • 网站流量统计 设计站长论坛
  • 电子商务网站建设的核心网站优化公司大家好
  • 注册域名后怎么做网站微软优化大师
  • 为企业设计网站网站推广策划思路
  • 网站流量太大打不开怎么办口碑营销案例分析
  • 利用云盘做网站百度指数代表什么
  • 营销型网站免费模板简述获得友情链接的途径
  • 小米路由做网站站长工具百度
  • 深圳注册公司条件树枝seo
  • 厦门网站建设方案书网站推广排名公司