当前位置: 首页 > news >正文

厦门建设局领导百度seo教程网

厦门建设局领导,百度seo教程网,网站开发合同,网站页面相关产品链接怎么做手写数字的数据集结构为(42000, 784),用KNN跑一次半小时,得到准确率在96.6%上下,用随机森林跑一次12秒,准确率在93.8%,虽然KNN效果好,但由于数据量太大,KNN计算太缓慢,所以我们不得不选用随机森林。我们使用了各种技术对手写数据集进行特征选择,最后使用嵌入 法Select…

手写数字的数据集结构为(42000, 784),用KNN跑一次半小时,得到准确率在96.6%上下,用随机森林跑一次12秒,准确率在93.8%,虽然KNN效果好,但由于数据量太大,KNN计算太缓慢,所以我们不得不选用随机森林。我们使用了各种技术对手写数据集进行特征选择,最后使用嵌入
法SelectFromModel选出了324个特征,将随机森林的效果也调到了96%以上。但是,因为数据量依然巨大,还是有300多个特征。今天,我们就来试着用PCA处理一下这个数据,看看效果如何。

1. 导入需要的模块和库
 

from sklearn.decomposition import PCA
from sklearn.ensemble import RandomForestClassifier as RFC
from sklearn.model_selection import cross_val_score
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np

2. 导入数据,探索数据
 

data = pd.read_csv(r"C:\work\learnbetter\micro-class\week 3 Preprocessing\digit 
recognizor.csv")
X = data.iloc[:,1:]
y = data.iloc[:,0]
X.shape

3. 画累计方差贡献率曲线,找最佳降维后维度的范围
 

http://www.15wanjia.com/news/11817.html

相关文章:

  • 网站开发代做磁力猫最好磁力搜索引擎
  • 做网站用那个浏览器软文编辑器
  • 摄影师个人网站怎么做seo在线优化网站
  • 看动漫是怎么做视频网站灰色推广
  • 前端做网站的步骤广告软文小故事200字
  • 公司网站申请书青岛网站seo服务
  • 哪里有机械加工活seo独立站
  • 深圳 网站建设社群营销
  • 网站建设作业教程百度一下官网首页
  • 开源项目网站怎么做 带视频新手电商运营从哪开始学
  • 做网站的点子杭州网站优化方案
  • wordpress评论不能用山西网站seo
  • 企业建网站的好处烟台seo快速排名
  • 云虚拟主机怎么建网站seo前景
  • dnf做任务解除制裁网站电子商务主要学什么内容
  • 网站名称与备案名称不一致网络营销岗位描述的内容
  • 网站开发客户需求百度爱采购推广平台
  • 海南的房产网站建设关键词完整版免费听
  • nas做视频网站平台推广是做什么的
  • 网站顶端flash如何快速搭建网站
  • 深圳外贸公司推荐新网seo关键词优化教程
  • 移动网站建设价格杭州正规引流推广公司
  • 永康门业微网站建设制作网站需要什么技术
  • 青岛网站建设 新视点上海网站排名优化怎么做
  • 手机网站可以做英文版本吗怎么创建网站快捷方式到桌面
  • 金华网站建设哪里好太原seo排名优化公司
  • 石景山区建设委员会网站seo关键词优化哪个平台好
  • 人民日报客户端视界北京seo招聘网
  • 如何网站做专题刷粉网站推广便宜
  • 免费推广网站入口2022seo招聘职责