当前位置: 首页 > news >正文

建立购物网站搭建网站步骤

建立购物网站,搭建网站步骤,简历个人主页,网站如何做IPV6支持介绍用于机器学习的 Fashion-MNIST 数据集 为什么要研究数据集? 让我们首先思考一下为什么要花时间研究数据集的问题。数据是深度学习的主要成分,虽然作为神经网络程序员的任务是让我们的神经网络从我们的数据中学习,但我们仍然有责任了解我…

介绍用于机器学习的 Fashion-MNIST 数据集

为什么要研究数据集?

让我们首先思考一下为什么要花时间研究数据集的问题。数据是深度学习的主要成分,虽然作为神经网络程序员的任务是让我们的神经网络从我们的数据中学习,但我们仍然有责任了解我们实际用于训练的数据的性质和历史。

一般来说,计算机程序由两个主要组成部分:代码和数据。在传统编程中,程序员的工作是直接编写软件或代码,但在深度学习和神经网络中,所谓的软件就是网络本身,特别是网络在训练过程中自动出现的权重。

​​在这里插入图片描述

程序员的工作是监督和指导训练过程中的学习。我们可以将其视为一种间接编写软件或代码的方式。通过使用数据和深度学习,神经网络程序员可以生产出能够执行计算的软件,而无需编写明确执行这些计算的代码。

因此,数据在开发软件中的作用正在转变,我们可能会看到软件开发人员的角色也随之转变。

关注数据的考虑因素:

  • 谁创建了数据集?
  • 数据集是如何创建的?
  • 使用了哪些转换?
  • 数据集的意图是什么?
  • 可能的意外后果?
  • 数据集是否有偏见?
  • 数据集是否存在伦理问题?

在实践中,获取和访问数据通常是深度学习中最困难的部分之一,因此在我们了解这个特定数据集时,请记住我们在这里看到的一般概念和想法。

MNIST 数据集是什么?

MNIST 数据集,修改后的国家标准与技术研究院数据库,是一个著名的手写数字数据集,通常用于训练机器学习的图像处理系统。NIST 代表 国家标准与技术研究院

MNIST 中的 M 代表 修改过的,这是因为有一个原始的 NIST 数字数据集被修改成了 MNIST。

在这里插入图片描述

MNIST 因为使用频率高而闻名。它通常出于两个原因而被使用:

  1. 初学者使用它,因为它简单
  2. 研究人员使用它来基准测试(比较)不同的模型

数据集包含 70,000​ 张手写数字图像,具体分为:

  • 60,000​ 张训练图像
  • 10,000​ 张测试图像

这些图像最初是由美国人口普查局员工和美国高中生创建的。

MNIST 被如此广泛地使用,图像识别技术也得到了如此大的改进,以至于数据集被认为太简单了。这就是为什么创建了 Fashion-MNIST 数据集。

Fashion-MNIST 是什么?

Fashion-MNIST,顾名思义,是一个时尚物品的数据集。具体来说,数据集有以下十类时尚物品:

索引标签
0T 恤/上衣
1裤子
2套头衫
3连衣裙
4外套
5凉鞋
6衬衫
7运动鞋
8
9短靴

正如我们在之前的帖子中看到的,这些物品的样本看起来像这样:

在这里插入图片描述

Fashion-MNIST 的起源是什么?

Fashion-MNIST 图像来自哪里?Fashion-MNIST 基于 Zalando 网站上的商品组合。Zalando 是一家总部位于德国的跨国时尚商务公司,成立于 2008 年。

这就是为什么我们在 GitHub URL 中看到 zalandoresearch,Fashion-MNIST 数据集可供下载。

Zalando Research 是公司内部创建数据集的团队。

当我们回顾介绍数据集的论文时,我们会看到更多关于图像收集方式的内容,但首先,让我们回答另一个潜伏的问题。

Fashion 数据集中的 MNIST 是什么意思?

为什么 Fashion-MNIST 中有 MNIST?

Fashion MNIST 数据集之所以在名称中有 MNIST,是因为创建者希望用 Fashion-MNIST 替代 MNIST。

因此,Fashion 数据集被设计成尽可能地模仿原始 MNIST 数据集,同时由于数据比手写图像更复杂,引入了更高的训练难度。

我们将看到 Fashion-MNIST 如何在论文中模仿原始数据集,但我们已经看到的一件事是类别的数量。

  • MNIST - 有 10 个类别(每个数字 0-9 一个)
  • Fashion-MNIST - 有 10 个类别(这是故意的)

让我们来看看这篇论文。

在 arXiv 上阅读 Fashion-MNIST 论文

关于论文的第一件事是,作者来自 Zalando Research(Fashion-MNIST 的起源)。

在阅读了论文的摘要后,我们看到了数据集被命名为 Fashion-MNIST 的原因。

Fashion-MNIST 论文的摘要

我们介绍了 Fashion-MNIST,这是一个新的数据集,包含 70,000 张 28 x 28 灰度图像,涵盖 10 个类别的时尚产品,每个类别 7,000 张图像。训练集有 60,000 张图像,测试集有 10,000 张图像。Fashion-MNIST 旨在作为原始 MNIST 数据集的直接替代品,用于基准测试机器学习算法,因为它具有相同的图像大小、数据格式以及训练和测试拆分的结构。数据集可在 https://github.com/zalandoresearch/fashion-mnist 免费获取。

  • arXiv 论文

数据集被设计成原始 MNIST 的替代品。通过使 Fashion-MNIST 数据集规范与原始 MNIST 规范相匹配,从旧数据集到新数据集的转换可以顺利进行。论文声称,切换数据集所需的唯一更改是从获取 MNIST 数据集的 URL 改为指向 Fashion 数据集。

论文还为我们提供了更多关于 MNIST 如此受欢迎的原因的见解:

“MNIST 如此受欢迎的原因与其大小有关,这使得深度学习研究人员能够快速检查和原型化他们的算法。这也得到了补充,因为所有机器学习库(例如 scikit-learn)和深度学习框架(例如 Tensorflow、PyTorch)都提供了使用 MNIST 的辅助函数和方便的示例。”

  • arXiv 论文

PyTorch 为我们提供了一个名为 torchvision​ 的包,使我们能够轻松地开始使用 MNIST 以及 Fashion-MNIST。

我们将在下一篇文章中使用 torchvision​ 将我们的训练集加载到我们的项目中。

Fashion-MNIST 是如何构建的

与 MNIST 数据集不同,时尚集不是手绘的,但数据集中的图像是 Zalando 网站上的实际图像。

然而,它们已经被转换以更接近 MNIST 规范。这是每个网站图像经历的一般转换过程:

  1. 转换为 PNG
  2. 裁剪
  3. 调整大小
  4. 锐化
  5. 扩展
  6. 反色
  7. 灰度化

要查看此过程的更详细描述,请务必查看论文的第二部分。

使用 torchvision​ 访问 Fashion-MNIST

总之,我们已经看到了 Fashion-MNIST 数据集的起源和历史,尽管该数据集被设计成更具挑战性的计算机视觉问题,但该集合仍然是一个很好的起点。

我们将通过一个名为 torchvision​ 的 PyTorch 视觉库访问 Fashion-MNIST,并构建我们的第一个神经网络,该网络能够准确预测给定输入时尚图像的输出类别。

http://www.15wanjia.com/news/43119.html

相关文章:

  • 如何写代码做网站seo技术306
  • 云南网站seo外包企业邮箱入口
  • wordpress连接济南seo网站排名关键词优化
  • 自助网站系统厦门百度seo
  • 济南做网站推广有哪些公司淘宝代运营
  • 个人网站做重定向图片seo团队
  • 百度口碑seo关键词排名优化品牌
  • 视频网站开发文档正规引流推广公司
  • 中国风网站设计小红书关键词检测
  • 建设网站技术公司谷歌seo详细教学
  • 怎么用dwcs6做网站设计谷歌chrome浏览器
  • 怎么做跨境电商网站网站推广策划书模板
  • delphi intraweb做网站推广商
  • 适合大学生做兼职的网站有哪些域名申请
  • 织梦做网站简单吗seo营销外包
  • 有什么网站学做标书的百度排名服务
  • 怎么做网站用户可以发表文章百度seo优化按年收费
  • 郑州汉狮哪家做网站好专业seo排名优化费用
  • 网站开发工程师助理网站如何优化
  • 建立一个个人介绍的网站种子搜索引擎 磁力天堂
  • 南昌专业网站设计2023年第三波新冠9月
  • 企业免费招聘网站整合营销策划方案
  • 做网站首先必须切割图片吗百度手机助手app安卓版官方下载
  • app与微网站的区别是什么seo 是什么
  • 衣服网站功能怎么制作网站教程
  • 中国疫情最新消息风险区广东知名seo推广多少钱
  • 潍坊seo外包平台新手seo入门教程
  • 空间做网站营销策划的八个步骤
  • 发卡网站搭建教程上海seo优化bwyseo
  • 微信公众号的跳转网站怎么做的网站权重排名