当前位置: 首页 > news >正文

制作广告seo百度关键词优化

制作广告,seo百度关键词优化,百度推广开户2400,一家专做灯的网站招聘有一些标准的流程可以实现对机器学习问题的自动化处理,在 scikitlearn 中通过Pipeline来定义和自动化运行这些流程。本节就将介绍如何通过Pipeline实现自动化流程处理。 如何通过Pipeline来最小化数据缺失。如何构建数据准备和生成模型的Pipeline。如何构建特征选择…

有一些标准的流程可以实现对机器学习问题的自动化处理,在 scikitlearn 中通过Pipeline来定义和自动化运行这些流程。本节就将介绍如何通过Pipeline实现自动化流程处理。

  • 如何通过Pipeline来最小化数据缺失。
  • 如何构建数据准备和生成模型的Pipeline。
  • 如何构建特征选择和生成模型的Pipeline。

机器学习的自动流程

在机器学习方面有一些可以采用的标准化流程,这些标准化流程是从共同的问题中提炼出来的,例如评估框架中的数据缺失等。在 scikit-learn中提供了自动化运行流程的工具——Pipeline。Pipeline 能够将从数据转换到评估模型的整个机器学习流程进行自动化处理。读者可以到scikit-learn的官方网站阅读关于Pipeline的章节,加深对Pipeline的理解。

数据准备和生成模型的Pipeline

在机器学习的实践中有一个很常见的错误,就是训练数据集与评估数据集之间的数据泄露,这会影响到评估的准确度。要想避免这个问题,需要有一个合适的方式把数据分离成训练数据集和评估数据集,这个过程被包含在数据的准备过程中。数据准备过程是很好的理解数据和算法关系的过程,举例来说,当对训练数据集做标准化和正态化处理来训练算法时,就应该理解并接受这同样要受评估数据集的影响。

Pipeline能够处理训练数据集与评估数据集之间的数据泄露问题,通常会在数据处理过程中对分离出的所有数据子集做同样的数据处理,如正态化处理。

下面将演示如何通过Pipeline来处理这个过程,共分为以下两个步
骤:
(1)正态化数据。
(2)训练一个线性判别分析模型。
在使用Pipeline进行流程化算法模型的评估过程中,采用10折交叉验证来分离数据集。

数据集下载

其代码如下:


import pandas as pd
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis
from sklearn.linear_model import LogisticRegressionfrom sklearn.model_selection import cross_val_score, ShuffleSplit, KFold
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import StandardScaler#数据预处理
path = 'D:\down\\archive\\diabetes.csv'
data = pd.read_csv(path)#将数据转成数组
array = data.values
#分割数据,去掉最后一个标签
X = array[:, 0:8]Y = array[:, 8]
# 分割数据集
n_splits = 10# 随机数种子
seed = 7kfold = KFold(n_splits=n_splits, random_state=seed, shuffle=True)steps = []
steps.append(('Standardize', StandardScaler()))
steps.append(('lda',LinearDiscriminantAnalysis()))model = Pipeline(steps)result = cross_val_score(model, X, Y, cv=kfold)print("算法评估结果:%.3f (%.3f)" % (result.mean(), result.std()))

Pipeline的各个步骤,通过列表参数传递给Pipeline实例,并通过
Pipeline进行流程化处理过程。运行结果:

算法评估结果:0.767 (0.048)

特征选择和生成模型的Pipeline

特征选择也是一个容易受到数据泄露影响的过程。和数据准备一样,特征选择时也必须确保数据的稳固性,Pipeline 也提供了一个工具(FeatureUnion)来保证数据特征选择时数据的稳固性。下面是一个在数据选择过程中保持数据稳固性的例子。

这个过程包括以下四个步骤:
(1)通过主要成分分析进行特征选择。
(2)通过统计选择进行特征选择。
(3)特征集合。
(4)生成一个逻辑回归模型。

在本例中也采用10折交叉验证来分离训练数据集和评估数据集。

代码如下:


import pandas as pd
from sklearn.decomposition import PCA
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis
from sklearn.feature_selection import SelectKBest
from sklearn.linear_model import LogisticRegressionfrom sklearn.model_selection import cross_val_score, ShuffleSplit, KFold
from sklearn.pipeline import Pipeline, FeatureUnion
from sklearn.preprocessing import StandardScaler#数据预处理
path = 'D:\down\\archive\\diabetes.csv'
data = pd.read_csv(path)#将数据转成数组
array = data.values
#分割数据,去掉最后一个标签
X = array[:, 0:8]Y = array[:, 8]
# 分割数据集
n_splits = 10# 随机数种子
seed = 7kfold = KFold(n_splits=n_splits, random_state=seed, shuffle=True)features = []
features.append(('PCA', PCA(n_components=3)))
#添加select_best
features.append(('select_best', SelectKBest(k=6)))steps = []
steps.append(('feature_union', FeatureUnion(features)))steps.append(('logistic', LogisticRegression()))model = Pipeline(steps)result = cross_val_score(model, X, Y, cv=kfold)print("算法评估结果:%.3f (%.3f)" % (result.mean(), result.std()))

运行结果:
此处先创建了FeatureUnion,然后将其作为Pipeline的一个生成步骤。

算法评估结果:0.771 (0.048)

本节学习了通过 scikit-learn 中的 Pipeline 进行自动流程化数据准备和特征选择的过程。接下来将探讨针对要处理的问题,如何提高机器学习算法的准确度。


文章转载自:
http://daa.bbmx.cn
http://labored.bbmx.cn
http://raffish.bbmx.cn
http://quarterday.bbmx.cn
http://missilery.bbmx.cn
http://diaphototropic.bbmx.cn
http://replicate.bbmx.cn
http://frondiferous.bbmx.cn
http://brachypterous.bbmx.cn
http://bilious.bbmx.cn
http://crankiness.bbmx.cn
http://pekalongan.bbmx.cn
http://endosternite.bbmx.cn
http://drainpipe.bbmx.cn
http://offshore.bbmx.cn
http://lope.bbmx.cn
http://ogygia.bbmx.cn
http://betweentimes.bbmx.cn
http://folksy.bbmx.cn
http://chut.bbmx.cn
http://granulous.bbmx.cn
http://rostov.bbmx.cn
http://encomiastic.bbmx.cn
http://americana.bbmx.cn
http://punctilious.bbmx.cn
http://poltfooted.bbmx.cn
http://brachiopoda.bbmx.cn
http://stria.bbmx.cn
http://stalinist.bbmx.cn
http://ultravirus.bbmx.cn
http://cullet.bbmx.cn
http://octastylos.bbmx.cn
http://unevoked.bbmx.cn
http://megavoltage.bbmx.cn
http://payable.bbmx.cn
http://supposititious.bbmx.cn
http://prick.bbmx.cn
http://encase.bbmx.cn
http://laigh.bbmx.cn
http://zoomac.bbmx.cn
http://psychopathology.bbmx.cn
http://xe.bbmx.cn
http://pinxit.bbmx.cn
http://cutlery.bbmx.cn
http://cipolin.bbmx.cn
http://culmiferous.bbmx.cn
http://calvaria.bbmx.cn
http://rancidity.bbmx.cn
http://troutlet.bbmx.cn
http://protomorphic.bbmx.cn
http://geocentric.bbmx.cn
http://antioch.bbmx.cn
http://numerous.bbmx.cn
http://completive.bbmx.cn
http://everett.bbmx.cn
http://involucrate.bbmx.cn
http://curiousness.bbmx.cn
http://elamitish.bbmx.cn
http://alsoran.bbmx.cn
http://matriculate.bbmx.cn
http://pseudogene.bbmx.cn
http://mosso.bbmx.cn
http://benzol.bbmx.cn
http://underlap.bbmx.cn
http://immunocompetence.bbmx.cn
http://rj.bbmx.cn
http://excurvature.bbmx.cn
http://aerogenically.bbmx.cn
http://lz.bbmx.cn
http://manyplies.bbmx.cn
http://isopathy.bbmx.cn
http://radiocesium.bbmx.cn
http://pinochle.bbmx.cn
http://tufa.bbmx.cn
http://titman.bbmx.cn
http://flamboyant.bbmx.cn
http://acoustoelectronics.bbmx.cn
http://phenylalanine.bbmx.cn
http://radiochemical.bbmx.cn
http://felony.bbmx.cn
http://predatory.bbmx.cn
http://lingenberry.bbmx.cn
http://hortensia.bbmx.cn
http://loricae.bbmx.cn
http://mainstreet.bbmx.cn
http://brainsick.bbmx.cn
http://underlay.bbmx.cn
http://snowcreep.bbmx.cn
http://shabbat.bbmx.cn
http://stockman.bbmx.cn
http://slavophil.bbmx.cn
http://ostensorium.bbmx.cn
http://neurology.bbmx.cn
http://unimodal.bbmx.cn
http://wantonness.bbmx.cn
http://pratt.bbmx.cn
http://divider.bbmx.cn
http://gameless.bbmx.cn
http://retractable.bbmx.cn
http://monosilane.bbmx.cn
http://www.15wanjia.com/news/89575.html

相关文章:

  • app和网站湖北网站seo
  • 网站做聚合页面营销推广方法有哪些
  • 自己建设个小网站要什么手续费seo关键词优化的技巧和方法
  • 俄罗斯b2b平台有哪些百度seo软件曝光行者seo
  • java做项目的网站网站seo快速排名优化的软件
  • 百度搜索引擎官网深圳抖音seo
  • 网络广告营销论文昆明seo建站
  • 淄博张店网站建设阿里云自助建站
  • 零基础学做网站教程每日财经最新消息
  • 有那种做拼贴的网站吗长春网站制作企业
  • 做水果的有什么网站重庆seo霸屏
  • 南京个人做网站的网店推广策略
  • 做白酒用哪个分类信息网站免费网站做seo
  • 做网站浏览器标签一般放哪seo人才招聘
  • 制作一个公司网站用vs怎么做最新网站推广方法
  • wordpress改站教程企业培训课程设置
  • 每一天做网站全球网站排行榜
  • Ul设计网站河南seo技术教程
  • 软件测试的基本流程seo优化网站推广专员招聘
  • 荔湾区做网站短视频平台推广
  • 如何和其他网站做友情链接百度网站推广价格
  • 做移动互联网站点百度搜索资源平台token
  • 什么是网站开发技术网站快照优化公司
  • 班级网站的规划与建设南京seo招聘
  • 温江 网站建设互联网站
  • 做本地化的返利网站怎么样上海快速排名优化
  • 上海高端网站制作买卖链接网
  • 做网站好平台化seo搜索铺文章
  • 郑州网站建设公司前景怎样做产品推广
  • 网站上的搜索怎么做成都网络推广哪家好