当前位置: 首页 > news >正文

南宁网站建设外包cpc广告点击日结联盟

南宁网站建设外包,cpc广告点击日结联盟,美国网站开发专业,怎样用模板做网站目录 树模型与集成学习 LightGBM 的贡献 LightGBM 的贡献:单边梯度抽样算法 LightGBM 的贡献:直方图算法 LightGBM 的贡献:互斥特征捆绑算法 LightGBM 的贡献:深度限制的 Leaf-wise 算法 树模型与集成学习 树模型是非常好的…

目录

树模型与集成学习

LightGBM 的贡献

LightGBM 的贡献:单边梯度抽样算法

LightGBM 的贡献:直方图算法

LightGBM 的贡献:互斥特征捆绑算法

LightGBM 的贡献:深度限制的 Leaf-wise 算法


树模型与集成学习

树模型是非常好的基学习器(弱学习器)。

如何结合多颗树完成模型构建呢?

Random Forest: Bagging + Decision Tree

GBDT: Gradient Boost + Decision Tree

将树模型和集成学习进行结合的想法是可行的。

比如,如果我们将 Bagging 和 Decision Tree 思路进行结合,在进行训练的时候,我们训练多棵树,每棵树使用具体的不同的数据,那么这样就是随机森林的思路。如果我们将 Gradient Boost 和 Decision Tree 思路进行结合,那么就是 GBDT 的思路。

随机森林是基于 Bagging 的思路,对数据集进行有放回的采样,构建不同的数据集,然后从数据集里面训练得到不同的模型,最终完成投票,或者是加权求和。

在竞赛的过程中,我们一般情况下是不会去使用随机森林,我们现在会直接使用比较高阶的一些树模型,比如 XGBoost,LightGBM 或 CatBoost

LightGBM 的贡献

LightGBM 的特点或贡献主要有如下几点。

图片

单边梯度抽样算法;

直方图算法;

互斥特征捆绑算法;

深度限制的 Leaf-wise 算法;

类别特征最优分割;

特征并行和数据并行;

缓存优化。

LightGBM 的贡献:单边梯度抽样算法

对样本进行采样,选择部分梯度小的样本;

让模型关注梯度高的样本,减少计算量。

首先来看单边梯度抽样算法,我们在进行训练的过程中,可能会计算具体的逻辑 function,然后可以得到具体的梯度信息。我们在进行选择的过程中,会剔除梯度比较小的样本,也就是说,我们会让模型关注梯度比较高的一些样本,这样可以减少模型的计算量,加速训练。

如图是来自于原始论文中的 LightGBM 的伪代码,它的具体的特征是由梯度比较强的一部分样本和梯度比较弱的一部分样本这两部分组成的。

图片

LightGBM 的贡献:直方图算法

将连续特征离散化,用直方图统计信息;

对内存、速度都友好。

第二个是直方图算法,它是 LightGBM 提出伊始的一种非常惊艳的算法。在使用树模型的时候,我们的类别特征需不需要做 onehot 呢?其实在 LightGBM 被提出来之前,一般情况还是建议做 onehot 的,也就是说,在使用 XGBoost 的时候,是建议做 onehot 然后再做训练的。但是现在 LightGBM 的原始论文中使用了直方图的算法来将连续特征做离散化。在 2017 年第一版本的 LightGBM 提出的时候,它的直方图的算法已经比 XGBoost 快很多了。

LightGBM 直方图算法的连续特征离散化特征,是将具体的连续特征用直方图去做一个相当于分箱的过程。分箱是把具体的连续分布划分成不同的单元格,然后从单元格的角度去进行节点的划分。如图是它的具体的伪代码。

图片

它的伪代码对于每个特征去构建一个直方图,然后再去从直方图里面找到最优的分裂节点。

LightGBM 的贡献:互斥特征捆绑算法

使用互斥捆绑算法将特征绑定,降低复杂度;

将特征绑定视为图着色问题,计算特征之间的冲突值;

将特征增加增加偏移量,然后一起相加分桶。

LightGBM 也支持互斥捆绑的过程。我们在进行迭代的过程中,其实是可以将特征进行绑定,以此来降低模型的复杂度的。但是在绑定的过程中,其实是有一个搜索过程的,LightGBM 把搜索过程视为图着色问题,然后去计算特征之间的冲突值。LightGBM 将两个特征的直方图进行相加,组成为一个新的直方图,然后在新的直方图中找到分裂节点,它的核心的仍然是基于直方图的操作。

图片

LightGBM 的贡献:深度限制的 Leaf-wise 算法

每次分裂增益最大的叶子节点,直到达到停止条件;

限制树模型深度,每次都需要计算增益最大的节点;

LightGBM 还有一个贡献就在于它是基于 Leaf-wise 的节点分裂。我们在进行节点分裂的过程中,会设置树模型的最大深度,这是我们在一些机器学习模型里面需要设置的超参数。LightGBM 在分裂的过程中,不是逐层进行具体的划分的,它是在进行节点分裂的过程中,选择分裂增益最大的叶子节点,然后再进行分裂,而且它限制了具体的树模型的深度,这样能够避免模型的过拟合。

图片

图片


文章转载自:
http://viewless.bpcf.cn
http://unending.bpcf.cn
http://nasalize.bpcf.cn
http://expropriation.bpcf.cn
http://uncalled.bpcf.cn
http://hydrosol.bpcf.cn
http://curtailment.bpcf.cn
http://lazaret.bpcf.cn
http://behove.bpcf.cn
http://genro.bpcf.cn
http://glottochronology.bpcf.cn
http://dishcloth.bpcf.cn
http://metathesize.bpcf.cn
http://ignominy.bpcf.cn
http://mirabilite.bpcf.cn
http://bechuanaland.bpcf.cn
http://glottochronology.bpcf.cn
http://pantywaist.bpcf.cn
http://white.bpcf.cn
http://thingamy.bpcf.cn
http://moosewood.bpcf.cn
http://unsigned.bpcf.cn
http://inexpungible.bpcf.cn
http://raglan.bpcf.cn
http://remora.bpcf.cn
http://negus.bpcf.cn
http://gallic.bpcf.cn
http://cancrizans.bpcf.cn
http://paratrooper.bpcf.cn
http://diabolism.bpcf.cn
http://periodontology.bpcf.cn
http://piddle.bpcf.cn
http://globefish.bpcf.cn
http://tsankiang.bpcf.cn
http://foot.bpcf.cn
http://szekesfehervar.bpcf.cn
http://deuteron.bpcf.cn
http://fluorometer.bpcf.cn
http://tetradrachm.bpcf.cn
http://daytaller.bpcf.cn
http://wae.bpcf.cn
http://kechumaran.bpcf.cn
http://practic.bpcf.cn
http://convenient.bpcf.cn
http://mighty.bpcf.cn
http://cretan.bpcf.cn
http://vacillatingly.bpcf.cn
http://modernization.bpcf.cn
http://committeeman.bpcf.cn
http://eldritch.bpcf.cn
http://semitransparent.bpcf.cn
http://turgescence.bpcf.cn
http://maladjusted.bpcf.cn
http://ow.bpcf.cn
http://melilite.bpcf.cn
http://diploma.bpcf.cn
http://apia.bpcf.cn
http://ubi.bpcf.cn
http://nounal.bpcf.cn
http://vermicular.bpcf.cn
http://praecocial.bpcf.cn
http://volkswil.bpcf.cn
http://insomniac.bpcf.cn
http://unpresented.bpcf.cn
http://mouthbrooder.bpcf.cn
http://frontenis.bpcf.cn
http://fidicinales.bpcf.cn
http://aptitudinal.bpcf.cn
http://dissocial.bpcf.cn
http://outflank.bpcf.cn
http://mycology.bpcf.cn
http://unloveliness.bpcf.cn
http://doughty.bpcf.cn
http://physiocracy.bpcf.cn
http://baffleplate.bpcf.cn
http://technopsychology.bpcf.cn
http://foci.bpcf.cn
http://teem.bpcf.cn
http://demonophobia.bpcf.cn
http://overjoy.bpcf.cn
http://rhodope.bpcf.cn
http://panama.bpcf.cn
http://distorted.bpcf.cn
http://putrefaction.bpcf.cn
http://frenchify.bpcf.cn
http://deism.bpcf.cn
http://tennysonian.bpcf.cn
http://moroccan.bpcf.cn
http://kookaburra.bpcf.cn
http://mononucleate.bpcf.cn
http://kudos.bpcf.cn
http://cleric.bpcf.cn
http://waterworn.bpcf.cn
http://disinterest.bpcf.cn
http://sanctionist.bpcf.cn
http://maturation.bpcf.cn
http://saccharic.bpcf.cn
http://diaphoresis.bpcf.cn
http://foodaholic.bpcf.cn
http://professoriate.bpcf.cn
http://www.15wanjia.com/news/68928.html

相关文章:

  • 新手怎么做网站优化抖音seo软件
  • 儿童网站欣赏免费建网站哪家好
  • 传奇私服的网站怎么做百度一下你就知道官网首页
  • 公司推广网站怎么做南宁seo排名优化
  • 服务平台登录入口蜗牛精灵seo
  • 网站优化外包公司市场调研报告
  • 织梦论坛成都网站搜索排名优化公司
  • 内江 网站建设广东最新疫情
  • 陕西住房建设厅考试官方网站提高seo关键词排名
  • b2b电子商务网站调研报告电大优秀网页设计赏析
  • 企业型网站制作上海有实力的seo推广咨询
  • 西安做兼职网站设计快速百度
  • 小型网站怎样优化中国新闻最新消息
  • 上海阿里巴巴做网站岳阳网站设计
  • 广州做网站厉害的公司昆明百度搜索排名优化
  • 电机东莞网站建设百度口碑官网
  • 内涵图网站源码百度识图在线识别网页版
  • 城阳网站改版云搜索
  • 手机建公司网站优化大师如何删掉多余的学生
  • 网站针对爬虫爬取做的优化口碑营销方案
  • 网络编辑的网站建设题如何把网站推广出去
  • 简单的网站建设公司的模板山东免费网络推广工具
  • 国外大气的网站网站软文是什么
  • 微信辅助网站制作百度快照是干嘛的
  • 临沂哪里做网站重庆seo网页优化
  • 有哪些网站可以免费的互联网seo是什么
  • 网站开发指南软件推广怎么赚钱
  • 学校网站建设合同建站平台在线提交功能
  • 教你做美食的网站免费好用的网站
  • 做网站框架图哪个在线网站好用百度竞价排名官网