当前位置: 首页 > news >正文

聊城大型门户网站建设哪里可以接广告

聊城大型门户网站建设,哪里可以接广告,做京东电脑端首页链接的网站,怎么做网站广告联盟最近做项目遇到的数据集中,有许多高维类别特征。catboost是可以直接指定categorical_columns的【直接进行ordered TS编码】,但是XGboost和随机森林甚至决策树都没有这个接口。但是在学习决策树的时候(无论是ID3、C4.5还是CART)&am…

最近做项目遇到的数据集中,有许多高维类别特征。catboost是可以直接指定categorical_columns的【直接进行ordered TS编码】,但是XGboost和随机森林甚至决策树都没有这个接口。但是在学习决策树的时候(无论是ID3、C4.5还是CART),肯定都知道决策树可以直接天然处理离散特征,那难道sklearn的决策树可以自己判断哪些特征是离散or连续?
在这里插入图片描述

决策树怎么处理连续特征

首先要明确,分类树和回归树,只是看label值是类别型还是连续型,和特征中是离散还是连续没有关系。并不是说CART回归树不能使用离散的特征,只是CART回归树里并不使用gini系数来计算增益。【补充题外话:CART作为一个二叉树,每次分列并不会和ID3一样消耗这一列特征,只是消耗了该特征的一个分界点
关于特征为连续属性时CART决策树如何处理:二分法——先从小到大依次排序,然后依次划分,进行判定。具体可以参考这篇博客。
在这里插入图片描述

sklearn里的决策树怎么处理类别特征的

答案是——不处理。在sklearn实现的CART树中,是用同一种方式去处理离散与连续的特征的,即:把离散的特征也都当做连续的处理了,只能处理连续特征 和 做编码成数字的离散特征
在这里插入图片描述
在这里插入图片描述
可以看这个问题,我的理解是sklearn为了速度对CART的原来算法做了一定的改进,不再按照原来的方法处理离散特征,而是都统一成连续特征来处理了【所以没有categorical_columns接口】。
其实理论上来说,XGB是可以用离散变量的,毕竟增益只和结点上的样本有关,特征只是决定树的结构:
在这里插入图片描述

解决方案

如果想使用DT、RF、XGB,离散特征需要人为进行处理。可以看这个博客,对类别特征进行编码。如果类别不是很多,可以考虑用one-hot(尽管决策树不太欢迎onehot),类别特征太多的,就要考虑用target encoding或者catboost encoding等编码方式来处理了。
另一方面,一些实际应用的结果表明,在特征维度很大的情况下,直接把每个特征编码成数字然后当做数值特征来用,其实效果并不会比严格按照categorical来使用差很多,或许可以考虑直接用LabelEncoder直接对高维类别特征进行编码,转化为数值特征。
或者考虑换LGBM、CatBoost

http://www.15wanjia.com/news/54759.html

相关文章:

  • 做汽车保养的网站上百度q3财报2022
  • 五百亿网站建设网站开发公司
  • 电商网站开发文档网站推广引流
  • 北京公司网站建设费用产品seo怎么优化
  • 泰州网站建设服务好360免费建站系统
  • 做网站怎么注册域名网络服务商电话
  • 网站建设和app哪个好百度联盟广告点击一次收益
  • 武汉建设工程价格信息网搜索引擎优化的具体操作
  • 网站 如何备案百度收录怎么做
  • 北京网站开发怎么做郑州网站建设专业乐云seo
  • W做网站怎么建立企业网站免费的
  • 外贸网站推广教程微信运营方案
  • 策划网站做营销推广山东今日热搜
  • 燕郊做网站找谁成都网站制作费用
  • 建站宝盒下载湖南seo推广多少钱
  • 门户网站推荐企业网站营销的优缺点
  • 深圳餐饮公司网站制作设计素材网站
  • 怎么制作属于自己的网站设计网站都有哪些
  • ipad怎么制作网站免费舆情监测平台
  • 简单大气网站模板百度提交入口网址是什么
  • 招聘网站开发需要多长时间seo网站培训班
  • app下载地址优化百度seo技术搜索引擎
  • 建设网站编程语言培训学校机构有哪些
  • 优秀设计师的个人网站网络营销培训机构
  • 网站ftp密码怎么修改cps广告是什么意思
  • 南宁网站建设哪家公体验营销是什么
  • C语言做网站需要创建窗口吗厦门seo顾问
  • 专业的中小型网站建设网络热词缩写
  • 市北区网站建设中国站长之家域名查询
  • 新建的网站必须要备案吗企业营销策略分析论文