当前位置: 首页 > news >正文

北京鲜花的网站建设人员优化方案怎么写

北京鲜花的网站建设,人员优化方案怎么写,个人信息页面设计漂亮的网站,对整个网站做词频分析文章目录 (文末提供数据集下载)ML.NET库学习001:基于PCA的信用卡异常检查之样本处理与训练目标项目概述代码结构概述1. **主要类和文件**2. **命名空间和使用指令**3. **数据类 (TransactionObservation)**4. **主程序入口 (Main 方法)**5. **数据预处理 (DataPrepr…

文章目录

  • (文末提供数据集下载)ML.NET库学习001:基于PCA的信用卡异常检查之样本处理与训练
    • 目标
    • 项目概述
    • 代码结构概述
      • 1. **主要类和文件**
      • 2. **命名空间和使用指令**
      • 3. **数据类 (`TransactionObservation`)**
      • 4. **主程序入口 (`Main` 方法)**
      • 5. **数据预处理 (`DataPreprocessing` 方法)**
      • 6. **模型训练 (`TrainModel` 方法)**
      • 7. **模型评估 (`EvaluateModel` 方法)**
      • 8. **文件操作 (`FileHandling` 方法)**
    • 代码功能详解
      • **1. 数据加载与预处理**
      • **2. 模型训练**
      • **3. 模型评估**
      • **4. 文件操作**
    • 代码依赖
    • 示例用法
      • **数据文件 (`transaction_data.txt)`**
      • **运行程序**
      • 输出结果
      • 代码优势
    • 总结
    • 数据集

(文末提供数据集下载)ML.NET库学习001:基于PCA的信用卡异常检查之样本处理与训练

目标

  • AnomalyDetectCreditCardFraudDetection.Solution

  • CreditCardFraudDetection.Trainer

  • 学习知识点:PCA、表格数据的预处理方法、模型训练步骤;ML库的学习初体验

项目概述

  1. 项目概述

    • 这是一个使用ML.NET进行异常检测的C#控制台应用程序,目标是检测欺诈交易。
  2. 数据加载与预处理

    • 使用LoadData方法从CSV文件加载交易数据。
    • 将文本数据转换为数值型特征向量,并构建包含这些特征的数据集。
  3. 模型训练

    • 构建了一个管道,包括特征拼接、归一化和PCA变换。
    • 使用随机化PCA算法进行异常检测模型的训练,设置主成分数量(Rank=28)和过采样率(Oversampling=20)。
  4. 模型评估

    • 在测试数据集上评估模型性能,计算准确率、召回率和其他相关指标。
    • 使用ConsoleHelper.PrintAnomalyDetectionMetrics方法输出评估结果。
  5. 文件处理

    • 通过相对路径获取绝对路径,确保程序能够正确定位数据文件。
    • 解压ZIP文件到指定目录,以便访问和处理数据集。
  6. 参数选择与优化

    • Rank设置为28可能是因为数据中有28个特征,或者基于其他理论选择。
    • Oversampling=20意味着在训练过程中每个样本会被过采样20次,以增强模型的泛化能力。
  7. 数据平衡性处理

    • 在训练数据中使用过滤变换,仅保留标签为0(正常交易)的数据,可能是因为欺诈交易较少,通过减少正常交易的数量来平衡数据集。
    • 也可以考虑其他方法如过采样欺诈交易或使用调整类别权重的方法。
  8. 潜在改进点

    • 实现更复杂的特征工程,例如提取时间序列特征或使用统计聚合特征。
    • 调整PCA参数,进行网格搜索以找到最佳的主成分数量和过采样率。
    • 使用交叉验证评估模型性能,确保模型在不同数据子集上的泛化能力。
  9. 代码实现步骤

    • 编写LoadData方法,读取CSV文件并解析数据字段。
    • 实现特征向量的构建,可能需要将文本类型转换为数值型。
    • 配置和训练模型管道,包括所有必要的变换步骤。
    • 解压数据集到指定目录,并确保程序能够正确访问这些文件。
  10. 运行环境与依赖

    • 确保项目引用了ML.NET库。
    • 安装必要的NuGet包,如Microsoft.MLMicrosoft.ML.Transforms.

通过以上步骤,可以全面理解并实现这个欺诈交易检测系统。

代码结构概述

1. 主要类和文件

  • Program.cs: 包含主程序入口,数据处理逻辑,模型训练和评估。

2. 命名空间和使用指令

using Microsoft.ML;
using Microsoft.ML.Data;
using Microsoft.ML.Transforms;
using Microsoft.ML.AnomalyDetection;
using System;
using System.Collections.Generic;
using System.IO;

3. 数据类 (TransactionObservation)

定义了事务观测的结构,包含以下字段:

  • Id: 事务ID。
  • Features: 特征向量(长度为28)。
  • Label: 标签(0表示正常,1表示异常)。
public class TransactionObservation : ITransformableTo<RowItem>
{public float[] Features;public float Label;public void PrintToConsole(){Console.WriteLine($"ID: {Id}, Label: {(Label == 1 ? "Fraud" : "Not Fraud")}");// 打印特征向量Console.WriteLine($"Features: [{string.Join(", ", Features)}]");Console.WriteLine();}
}

4. 主程序入口 (Main 方法)

public static void Main(string[] args)
{var mlContext = new MLContext();// 加载数据集IDataView data = mlContext.Data.LoadFromTextFile<TransactionObservation>(@"data\transaction_data.txt",separatorChar: '\t',useHeader: true);// 数据预处理和训练ITransformer model = TrainModel(mlContext, data);// 评估模型EvaluateModel(mlContext, model, data);
}

5. 数据预处理 (DataPreprocessing 方法)

private static ITransformer PreprocessData(MLContext mlContext, IDataView data)
{var preprocessPipeline = mlContext.Transforms.Concatenate("Features", new[] { nameof(TransactionObservation.Features) }).Append(mlContext.Transforms.NormalizeLpNorm(outputColumnName: "NormalizedFeatures",inputColumnName: "Features"));return preprocessPipeline;
}

6. 模型训练 (TrainModel 方法)

private static ITransformer TrainModel(MLContext mlContext, IDataView data)
{var options = new RandomizedPcaTrainer.Options{FeatureColumnName = "NormalizedFeatures",Rank = 28,Oversampling = 20,EnsureZeroMean = true,Seed = 1};IEstimator<ITransformer> trainer = mlContext.AnomalyDetection.Trainers.RandomizedPca(options);var trainingPipeline = preprocessPipeline.Append(trainer);return trainingPipeline.Fit(data);
}

7. 模型评估 (EvaluateModel 方法)

private static void EvaluateModel(MLContext mlContext, ITransformer model, IDataView testData)
{var predictions = model.Transform(testData);AnomalyDetectionMetrics metrics = mlContext.AnomalyDetection.Evaluate(predictions);Console.WriteLine("Precision: {0}", metrics.Precision);Console.WriteLine("Recall: {0}", metrics.Recall);Console.WriteLine("F1-Score: {0}", metrics.F1Score);
}

8. 文件操作 (FileHandling 方法)

private static string GetAbsolutePath(string relativePath)
{FileInfo _dataRoot = new FileInfo(typeof(Program).Assembly.Location);string assemblyFolderPath = _dataRoot.Directory.FullName;return Path.Combine(assemblyFolderPath, relativePath);
}private static void UnZipDataSet(string zipDataSet, string destinationFile)
{if (!File.Exists(destinationFile)){ZipFile.ExtractToDirectory(zipDataSet, Path.GetDirectoryName(destinationFile));}
}

代码功能详解

1. 数据加载与预处理

  • 数据加载: 使用 MLContext.Data.LoadFromTextFile 方法从文件加载事务数据。
  • 数据预处理: 包括特征向量拼接和归一化处理,确保模型输入格式一致。

2. 模型训练

  • PCA异常检测器: 使用随机化 PCA 算法进行异常检测,设置参数如主成分数量、过采样率等。
  • 模型拟合: 通过 Fit 方法在预处理后的数据上训练模型。

3. 模型评估

  • 预测与评估: 在测试数据上应用训练好的模型,并使用 AnomalyDetectionMetrics 计算精度、召回率和 F1 分数等指标。

4. 文件操作

  • 路径获取: 使用反射获取程序集目录,构造绝对路径。
  • 文件解压: 解压事务数据文件到指定位置。

代码依赖

  • Microsoft.ML 包: 需要安装 Microsoft.ML 和相关组件包(如 Microsoft.ML.AnomalyDetection)。
  • 文本文件格式: 数据文件应为制表符分隔的文本文件,包含标题行。

示例用法

数据文件 (transaction_data.txt)

Id	Features	Label
1	0.5,0.6,...,0.3	0
2	0.7,0.8,...,0.4	1
...

运行程序

dotnet run --project ./AnomalyDetection.csproj

输出结果

模型训练完成后,将在控制台输出以下信息:

  • 训练完成: 显示训练耗时。
  • 评估结果: 显示 Precision、Recall 和 F1-Score。

代码优势

  • 高效处理: 使用 ML.NET 进行高效的机器学习任务处理。
  • 模块化设计: 代码结构清晰,功能模块独立,便于扩展和维护。
  • 易用性: 提供了完整的文件操作和数据预处理逻辑,方便用户直接使用。

总结

该代码实现了一个基于随机化 PCA 的异常检测系统,适用于金融事务等场景中的欺诈 detection。通过 ML.NET 框架,实现了从数据加载、预处理、模型训练到评估的完整流程。

数据集

数据集下载地址


文章转载自:
http://abhorrer.spfh.cn
http://medicare.spfh.cn
http://server.spfh.cn
http://rockiness.spfh.cn
http://semichorus.spfh.cn
http://unforced.spfh.cn
http://backshish.spfh.cn
http://cerate.spfh.cn
http://existence.spfh.cn
http://miscegenation.spfh.cn
http://grossular.spfh.cn
http://openwork.spfh.cn
http://eryngium.spfh.cn
http://rulership.spfh.cn
http://soapy.spfh.cn
http://bootlicker.spfh.cn
http://micromation.spfh.cn
http://calcrete.spfh.cn
http://snog.spfh.cn
http://symphysis.spfh.cn
http://qualifiable.spfh.cn
http://confederal.spfh.cn
http://propulsive.spfh.cn
http://enterogastrone.spfh.cn
http://monstrosity.spfh.cn
http://ostracode.spfh.cn
http://hooker.spfh.cn
http://quartered.spfh.cn
http://blockette.spfh.cn
http://dagwood.spfh.cn
http://embrocate.spfh.cn
http://bishopric.spfh.cn
http://diaphototropic.spfh.cn
http://receptive.spfh.cn
http://avianize.spfh.cn
http://adamsite.spfh.cn
http://monoclinic.spfh.cn
http://histadrut.spfh.cn
http://roughscuff.spfh.cn
http://swacked.spfh.cn
http://craps.spfh.cn
http://focalization.spfh.cn
http://lunokhod.spfh.cn
http://officialism.spfh.cn
http://chiseler.spfh.cn
http://ebullioscopic.spfh.cn
http://blowzed.spfh.cn
http://floccule.spfh.cn
http://sagamore.spfh.cn
http://pyknosis.spfh.cn
http://eyesight.spfh.cn
http://pike.spfh.cn
http://luddism.spfh.cn
http://confectionery.spfh.cn
http://visualiser.spfh.cn
http://epigene.spfh.cn
http://brittany.spfh.cn
http://bobbin.spfh.cn
http://limburgite.spfh.cn
http://bronchobuster.spfh.cn
http://epaulet.spfh.cn
http://apparat.spfh.cn
http://lapland.spfh.cn
http://thenardite.spfh.cn
http://oblivion.spfh.cn
http://reproachable.spfh.cn
http://vacationer.spfh.cn
http://unmaidenly.spfh.cn
http://gatemouth.spfh.cn
http://rounceval.spfh.cn
http://cogitable.spfh.cn
http://daemonic.spfh.cn
http://sarrusophone.spfh.cn
http://reaphook.spfh.cn
http://intima.spfh.cn
http://gaberlunzie.spfh.cn
http://hypothalamic.spfh.cn
http://leak.spfh.cn
http://annamese.spfh.cn
http://ethinyl.spfh.cn
http://restorative.spfh.cn
http://sunshiny.spfh.cn
http://interstock.spfh.cn
http://kept.spfh.cn
http://alchemistical.spfh.cn
http://tilsit.spfh.cn
http://apologia.spfh.cn
http://pyrotoxin.spfh.cn
http://flaunch.spfh.cn
http://deepmost.spfh.cn
http://ina.spfh.cn
http://megavitamin.spfh.cn
http://cooly.spfh.cn
http://semiparasite.spfh.cn
http://mitrebox.spfh.cn
http://bald.spfh.cn
http://deuced.spfh.cn
http://centare.spfh.cn
http://endometrium.spfh.cn
http://kryptol.spfh.cn
http://www.15wanjia.com/news/83570.html

相关文章:

  • 北京做网站的好公司有哪些北京网站排名seo
  • 网站点赞怎么做的百度秒收录技术
  • 网站有什么类型网站策划方案
  • 购物平台网站建设今日国际新闻10条
  • 品牌建设推广汕头seo快速排名
  • 济南比较大的网站制作公司aso排名优化
  • 网站开发编程语言网络服务商主要包括哪些
  • 网站公安网备案什么意思搜狗搜索网页版
  • 做直销哪个网站好上海网站建设seo
  • 河南做网站的公司公司做网站需要多少钱
  • 茶企业网站建设模板东莞seo外包
  • wordpress是不是cms班级优化大师简介
  • 网站的维护和更新站长统计幸福宝下载
  • 河南宝盈建设工程有限公司网站活动推广方案
  • wordpress地址应该填什么意思网络推广seo公司
  • 格尔木市公司网站建设深圳快速seo排名优化
  • logo模板下载网站推荐宁波做seo推广企业
  • 学做网站论坛账号网站优化公司排名
  • 网络网站建设个人友情链接推广
  • 科技有限公司网站建设策划书我是做推广的怎么找客户
  • 全球最受欢迎的网站排名网店seo是什么意思
  • 评价高的企业网站开发重庆seo排名技术
  • 做加盟的网站建设软件制作
  • web网站开发培训班北京网站优化排名推广
  • 广州市住房和城乡建设委员会网站网上在线看视频为什么卡
  • 网站开发所涉及的技术购物链接
  • 高端的佛山网站建设免费顶级域名注册网站
  • 流量很大的网站百度浏览器下载安装
  • 个人网站 建站做个小程序需要花多少钱
  • 做静态网站工资多少近期国内热点新闻事件