当前位置: 首页 > news >正文

企业微网站开发西安响应式网站建设

企业微网站开发,西安响应式网站建设,南宁平台公司,外发加工网1688先看一下数据的统计信息 import pandas as pd # 加载数据(保留原路径,但在实际应用中建议使用相对路径或环境变量) data pd.read_csv(r"C:\Users\11794\Desktop\收入分类\training.csv", encodingutf-8, encoding_errorsrepl…

先看一下数据的统计信息

import pandas as pd   # 加载数据(保留原路径,但在实际应用中建议使用相对路径或环境变量)  
data = pd.read_csv(r"C:\Users\11794\Desktop\收入分类\training.csv", encoding='utf-8', encoding_errors='replace')  # 查看数据信息和描述 
data.info()data.head()data.describe()    

数据是已经处理好了的,利用代码绘制热力图查看各特征间的相关性

import pandas as pd  
import seaborn as sns  
import matplotlib.pyplot as plt  # 加载数据(保留原路径,但在实际应用中建议使用相对路径或环境变量)  
data = pd.read_csv(r"C:\Users\11794\Desktop\收入分类\training.csv", encoding='utf-8', encoding_errors='replace')  # 绘制热力图  
# 选择数值列进行相关性分析  
numerical_columns = data.select_dtypes(include=['int64', 'float64']).columns
# 计算相关性矩阵  
correlation_matrix = data[numerical_columns].corr()  
# 绘制热力图  
plt.figure(figsize=(12, 10))  
sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm', linewidths=0.5)  
plt.title('Correlation Heatmap')  
plt.savefig('correlation_heatmap.png', bbox_inches='tight')  # 保存热力图到当前目录

Class列为分类目标,可以看到有些列和他的相关性达到了0.9以上,这里就能估计出来模型效果会很好。

决策树模型分类‘Class’

import pandas as pd    
from sklearn.model_selection import train_test_split    
from sklearn.tree import DecisionTreeClassifier  # 导入决策树分类器  
from sklearn.metrics import classification_report    
import matplotlib.pyplot as plt    
from sklearn.metrics import roc_curve, auc  
import numpy as np  # 加载数据(假设数据保存在CSV文件中)    
data = pd.read_csv(r"C:\Users\11794\Desktop\收入分类\training.csv", encoding='utf-8', encoding_errors='replace')   
test_data = pd.read_csv(r"C:\Users\11794\Desktop\收入分类\testing.csv", encoding='utf-8', encoding_errors='replace')    # 选择特征和目标变量    
X = data.drop(['id', 'Class'], axis=1)   
y = data['Class']  # 目标变量是'Class'列    # 数据分割    
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.01, random_state=42)    # 创建并训练模型    
# 使用决策树分类器  
model = DecisionTreeClassifier(max_depth=30, random_state=42)  # 修改此行  
model.fit(X_train, y_train)    # 预测测试集并评估模型    
y_pred = model.predict(X_test)    
print(classification_report(y_test, y_pred))  # 打印分类报告  # 选择test_data中的特征列    
test_X = test_data.drop(['id'], axis=1)    
# 使用训练好的模型进行预测    
test_y_pred = model.predict(test_X)

模型的准确率达到了1.0,能够完全准确分类出收入水平。

http://www.15wanjia.com/news/182288.html

相关文章:

  • 网站制作中需要注意的地方wordpress tag标签页
  • 微网站如何做微信支付宝支付宜春房产网
  • 网站建设售后服务安全维护成都易锐互动科技有限公司
  • 帝国做的网站怎么上传图片fc网页游戏排行榜
  • 公司网站建设开源平台有没有做任务拿佣金的网站
  • 芙蓉区网站建设公司888集团浏览器app
  • 织梦教育网站模板软文推广发布
  • i5 7500网站开发做外国网站
  • 天津企业模板建站哪个好网络营销课程设计总结
  • wordpress虚化主题郑州网站关键词优化公司
  • 怎样帮拍卖网站做策划装修设计公司资质
  • 柳州住房和城乡建设厅网站网站开发的报价
  • 东源县住房和城乡建设部网站wordpress的用户注册
  • 网站建设口号平面设计主要是干嘛的
  • 手机网站源码最好赣州网联科技有限公司
  • 南山住房和建设局网站吴忠市住房和城乡建设厅网站
  • 做钢材都有什么网站对于网站建设提出建议
  • 欧美做爰视频网站总结 设网站
  • 软件公司做网站推广科目西宁做网站君博相约
  • 深圳品牌网站建设公司有哪些怎么给网站上传附件
  • 搭建网站费用wordpress d压缩
  • 医药网站怎么做网站建设报价模板
  • 做网站属于什么行业wordpress照片墙
  • crm网站推荐海外服务器租赁
  • 网站做图片的大小海报设计平台
  • 建立应用网站娃哈哈网络推广方案
  • wordpress主题 know how搜索引擎优化seo目的
  • 保安做网站昌乐营销型网站建设
  • 猪八戒网可以做网站吗广告创意设计模板
  • 提供东莞微信网站建设网站建设 电话营销