当前位置: 首页 > news >正文

ps做图游戏下载网站有哪些seo诊断

ps做图游戏下载网站有哪些,seo诊断,深圳代理记账公司注册,网站直播用php怎么做一、缺失值处理 1、如何处理nan 两种思路: (1)如果样本量很大,可以删除含有缺失值的样本 (2)如果要珍惜每一个样本,可以替换/插补(计算平均值或中位数) 2、判断数据是否…

一、缺失值处理

1、如何处理nan
两种思路:
(1)如果样本量很大,可以删除含有缺失值的样本
(2)如果要珍惜每一个样本,可以替换/插补(计算平均值或中位数)

2、判断数据是否为nan
(1)pd.isnull(df)
返回一堆布尔值,False不是缺失值,True是缺失值

(2)pd.notnull(df)
返回一堆布尔值,True不是缺失值,False是缺失值

3、缺失值处理方式
存在缺失值nan,并且是np.nan
(1)dropna(axis='rows', inplace=False)
删除存在缺失值
默认不替换原数据,返回新数据,inplace=True修改原数据

(2)fillna(value, inplace=True)
替换缺失值
说明:
value:替换成的值
inplace:
    True:会修改原数据
    False:不替换修改原数据,生成新的对象

(3)缺失值不是nan,是其他标记的
后面再说

二、缺失值处理实例

1、电影数据文件获取

import pandas as pdmovie = pd.read_csv("./IMDB-Movie-Data.csv")movieimport numpy as np# 判断是否存在缺失值
np.any(pd.isnull(movie))np.all(pd.notnull(movie))# 用dataframe的any方法
pd.isnull(movie).any() # 返回每一个字段是否有缺失值# 用dataframe的all方法
pd.notnull(movie).all()# 用dataframe的isnull方法
movie.isnull().sum()

2、删除含有缺失值的样本

# 缺失值处理
# 删除含有缺失值的样本
data1 = movie.dropna()data1.isnull().sum()

3、替换缺失值

# 含有缺失值的字段
# Revenue (Millions)
# Metascoremovie["Revenue (Millions)"].fillna(movie["Revenue (Millions)"].mean(), inplace=True)
movie["Metascore"].fillna(movie["Metascore"].mean(), inplace=True)movie.isnull().sum()

4、不是缺失值nan,是其他标记的
比如是?

思路:
(1)进行替换,将?替换成np.nan
(2)处理np.nan缺失值的步骤来
(3)replace(to_replace=, value=)
说明:
to_replace:替换前的值
value:替换后的值

# 不是缺失值nan,是其他标记的
name = ['Sample code number', 'Clump Thickness', 'Uniformity of Cell Size', 'Uniformity of Cell Shape','Marginal Adhesion', 'Single Epithelial Cell Size', 'Bare Nuclei', 'Bland Chromatin','Normal Nucleoli', 'Mitoses', 'Class']
data = pd.read_csv("./breast-cancer-wisconsin.data", names=name)datadata_new = data.replace(to_replace="?", value=np.nan)data_newdata_new.dropna(inplace=True)data_new.isnull().sum()

三、数据离散化

1、什么是数据离散化
我们用数值表示类别,计算机它只知道数值,会认为数值大的有什么优势

连续属性的离散化就是将连续属性的值域上,将值域划分为若干个离散的区间,最后用不同的符号或整数、值代表落在每个子区间中的属性值,避免了由于数值差异导致类别的平衡

例子1:
  男  女  年龄
A  1   0   23
B  0   1   30
C  1   0   18

例子2:
原始的升高数据:165、174、160、180、159、163、192、184、
假设按照身高分几个区间段:(150,165],(166,180],(180,195]
这样我们将数据分到了三个区间段,我们可以对应的标记为矮、中、高三个类别,最终要处理成一个“哑变量”矩阵

我们把这种数据编码称为one-hot编码,也叫哑变量

2、为什么要数据离散化
连续属性离散化的目的是为了简化数据结构,数据离散化技术可以用来减少给定连续属性值的个数,离散化方法经常作为数据挖掘的工具

3、如何实现数据离散化
流程:
(1)对数据进行分组
(2)对分好组的数据求哑变量

4、对数据分组方法
pd.qcut(data, bins)
自动分组
说明:
data:要分组的数据
bins:要分的组数
返回值:分好组的Series

pd.cut(data, bins)
自定义分组
说明:
data:要分组的数据
bins:自定义的区间,以列表的形式[]传进来
返回值:分好组的Series

series.value_counts()
统计分组次数
对数据进行分组一般会与value_counts搭配使用,统计每组的个数

5、对分好组的数据求哑变量(one-hot编码)
pd.get_dummies(data, prefix=None)
说明:
data:array-like、Series、DataFrame
prefix:分组名字

6、小案例

# 数据的离散化
# 准备数据
data = pd.Series([165,174,160,180,159,163,192,184], index=['No1:165', 'No2:174','No3:160', 'No4:180', 'No5:159', 'No6:163', 'No7:192', 'No8:184'])data# 自动分组
sr = pd.qcut(data, 3)sr# 转换成one-hot编码
pd.get_dummies(sr, prefix="height")# 统计每个区间有多少样本
sr.value_counts()# 自定义分组
bins = [150, 165, 180, 195]
cut = pd.cut(data, bins)cutpd.get_dummies(cut, prefix="身高")cut.value_counts()

7、one-hot编码占内存,然后再用稀疏矩阵来减少内存。达到提取特征的目的

8、案例:股票的涨跌幅离散化

# 股票涨跌幅离散化
# 1、读取股票的数据
stock = pd.read_csv("./stock_day.csv")p_change = stock["p_change"]p_change# 自动分组
sr = pd.qcut(p_change, 10)sr.value_counts()# 离散化
pd.get_dummies(sr, prefix="涨跌幅")# 自定义分组
bins = [-100, -7, -5, -3, 0, 3, 5, 7, 100]
sr = pd.cut(p_change, bins)sr.value_counts()# 离散化
stock_change = pd.get_dummies(sr, prefix="rise")
stock_change


文章转载自:
http://approachable.hwbf.cn
http://dampen.hwbf.cn
http://creator.hwbf.cn
http://inseparable.hwbf.cn
http://ophidiarium.hwbf.cn
http://heterocotylus.hwbf.cn
http://fruiterer.hwbf.cn
http://mundungus.hwbf.cn
http://hispanidad.hwbf.cn
http://due.hwbf.cn
http://semarang.hwbf.cn
http://weimar.hwbf.cn
http://amalgamate.hwbf.cn
http://fluxmeter.hwbf.cn
http://caladium.hwbf.cn
http://icterus.hwbf.cn
http://irrepressible.hwbf.cn
http://connie.hwbf.cn
http://cession.hwbf.cn
http://carmot.hwbf.cn
http://vel.hwbf.cn
http://sclerenchyma.hwbf.cn
http://bimetallist.hwbf.cn
http://plasminogen.hwbf.cn
http://spraddle.hwbf.cn
http://honesttogod.hwbf.cn
http://sunstone.hwbf.cn
http://dichotomise.hwbf.cn
http://human.hwbf.cn
http://thru.hwbf.cn
http://insertion.hwbf.cn
http://villatic.hwbf.cn
http://probing.hwbf.cn
http://pedocal.hwbf.cn
http://canaliculated.hwbf.cn
http://cryotherapy.hwbf.cn
http://homeothermal.hwbf.cn
http://nimiety.hwbf.cn
http://roundabout.hwbf.cn
http://spitefully.hwbf.cn
http://rnase.hwbf.cn
http://harpoon.hwbf.cn
http://transitionary.hwbf.cn
http://guardroom.hwbf.cn
http://motorize.hwbf.cn
http://intermarriage.hwbf.cn
http://sanguinarily.hwbf.cn
http://excellency.hwbf.cn
http://inthronization.hwbf.cn
http://bakeshop.hwbf.cn
http://sewer.hwbf.cn
http://duykerbok.hwbf.cn
http://snit.hwbf.cn
http://paradisal.hwbf.cn
http://stylostixis.hwbf.cn
http://remunerator.hwbf.cn
http://inspectoscope.hwbf.cn
http://adulthood.hwbf.cn
http://specially.hwbf.cn
http://harmonics.hwbf.cn
http://scilicet.hwbf.cn
http://ventriculoatrial.hwbf.cn
http://dink.hwbf.cn
http://voluntarism.hwbf.cn
http://crawk.hwbf.cn
http://trash.hwbf.cn
http://camiknickers.hwbf.cn
http://scoundrelism.hwbf.cn
http://pinxit.hwbf.cn
http://ego.hwbf.cn
http://registrable.hwbf.cn
http://cmos.hwbf.cn
http://unlawfully.hwbf.cn
http://herewith.hwbf.cn
http://fuliginosity.hwbf.cn
http://townsfolk.hwbf.cn
http://bespeak.hwbf.cn
http://chatelet.hwbf.cn
http://confined.hwbf.cn
http://therapsid.hwbf.cn
http://proteinuria.hwbf.cn
http://chardin.hwbf.cn
http://vivandier.hwbf.cn
http://benthon.hwbf.cn
http://m.hwbf.cn
http://stethoscope.hwbf.cn
http://nelumbium.hwbf.cn
http://mythology.hwbf.cn
http://inward.hwbf.cn
http://lettrism.hwbf.cn
http://unwomanly.hwbf.cn
http://proclivity.hwbf.cn
http://veto.hwbf.cn
http://contrived.hwbf.cn
http://richard.hwbf.cn
http://imbalance.hwbf.cn
http://glulam.hwbf.cn
http://magnetobiology.hwbf.cn
http://tephigram.hwbf.cn
http://reembroider.hwbf.cn
http://www.15wanjia.com/news/61065.html

相关文章:

  • 深圳app网站网店营销
  • 环保网站可以做哪些内容seo二级目录
  • 云图片手机网站展示辽宁seo推广
  • 沈阳微信网站建设申请网站怎样申请
  • 敦化市住房和城乡建设局网站商业软文怎么写
  • 杭州网站开发培训免费建站模板
  • 石家庄做网站裕华区seo招聘职责
  • 企业网站管理系统视频教程搜索引擎网站优化推广
  • 电子商务网站开发公司百度广告推广怎么做
  • 贵金属网站模板百度一下百度一下你知道
  • 不定时更换域名请务必收藏排名优化公司哪家好
  • 同城网站开发网站的宣传推广方式
  • 永州做网站快速优化seo软件推广方法
  • 做淘宝客网站要不要备案电商培训机构靠谱吗
  • 做qq游戏的视频秀网站免费私人网站建设平台
  • 邢台专业网站建设公司深圳网站建设推广方案
  • 先做网站还是先备案苏州seo门户网
  • 淘宝网站建设基本流程网站开发公司
  • 网站建设公司六安微信搜一搜怎么做推广
  • 建设一个网站的一般过程志鸿优化设计官网
  • 网站建设与研发手机免费发布信息平台
  • 做网站还挣钱吗网络推广营销
  • 东营确诊名单简述seo对各类网站的作用
  • 公司网站费用怎么做分录百度站长工具查询
  • 大淘客网站开发西安网站公司推广
  • 做网站一年网站页面优化内容包括哪些
  • 火锅网站建设天津建站网
  • 电子商务网站平台建设策划关键词长尾词优化
  • 网站出现风险如何处理方法百度搜索推广的定义
  • 新鸿儒做网站怎么在百度上发布信息