当前位置: 首页 > news >正文

网站内容改版学seo哪个培训好

网站内容改版,学seo哪个培训好,马洪旭 做的网站大学,怎样开建网站大家好,我是刘明,明志科技创始人,华为昇思MindSpore布道师。 技术上主攻前端开发、鸿蒙开发和AI算法研究。 努力为大家带来持续的技术分享,如果你也喜欢我的文章,就点个关注吧 MindSpore中可以把用于训练网络模型的数据…

大家好,我是刘明,明志科技创始人,华为昇思MindSpore布道师。
技术上主攻前端开发、鸿蒙开发和AI算法研究。
努力为大家带来持续的技术分享,如果你也喜欢我的文章,就点个关注吧

MindSpore中可以把用于训练网络模型的数据集,转换为MindSpore特定的格式数据(MindSpore Record格式),从而更加方便地保存和加载数据。其目标是归一化用户的数据集,并进一步通过MindDataset接口实现数据的读取,并用于训练过程。在这里插入图片描述
此外,MindSpore还针对部分数据场景进行了性能优化,使用MindSpore Record数据格式可以减少磁盘IO、网络IO开销,从而获得更好的使用体验。

MindSpore Record数据格式具备的特征如下:

  1. 实现数据统一存储、访问,使得训练时数据读取更加简便。

  2. 数据聚合存储、高效读取,使得训练时数据方便管理和移动。

  3. 高效的数据编解码操作,使得用户可以对数据操作无感知。

  4. 可以灵活控制数据切分的分区大小,实现分布式数据处理。

Record文件结构

如下图所示,MindSpore Record文件由数据文件和索引文件组成。
在这里插入图片描述

其中数据文件包含文件头、标量数据页、块数据页,用于存储用户归一化后的训练数据,且单个MindSpore Record文件建议小于20G,用户可将大数据集进行分片存储为多个MindSpore Record文件。

而索引文件则包含基于标量数据(如图像Label、图像文件名等)生成的索引信息,用于方便地检索、统计数据集信息。

数据文件中的文件头、标量数据页、块数据页的具体用途如下所示:

  • 文件头:是MindSpore Record文件的元信息,主要用来存储文件头大小、标量数据页大小、块数据页大小、Schema信息、索引字段、统计信息、文件分区信息、标量数据与块数据对应关系等。

  • 标量数据页:主要用来存储整型、字符串、浮点型数据,如图像的Label、图像的文件名、图像的长宽等信息,即适合用标量来存储的信息会保存在这里。

  • 块数据页:主要用来存储二进制串、NumPy数组等数据,如二进制图像文件本身、文本转换成的字典等。

转换成Record格式

下面主要介绍如何将CV类数据和NLP类数据转换为MindSpore Record文件格式,并通过MindDataset接口,实现MindSpore Record文件的读取。

转换CV类数据集

本示例主要以包含100条记录的CV数据集并将其转换为MindSpore Record格式为例子,介绍如何将CV类数据集转换成MindSpore Record文件格式,并使用MindDataset接口读取。

首先,需要创建100张图片的数据集并对齐进行保存,其样本包含file_name(字符串)、label(整型)、 data(二进制)三个字段,然后使用MindDataset接口读取该MindSpore Record文件。

  1. 生成100张图像,并转换成MindSpore Record文件格式。
from PIL import Image
from io import BytesIO
from mindspore.mindrecord import FileWriterfile_name = "test_vision.mindrecord"
# 定义包含的字段
cv_schema = {"file_name": {"type": "string"},"label": {"type": "int32"},"data": {"type": "bytes"}}# 声明MindSpore Record文件格式
writer = FileWriter(file_name, shard_num=1, overwrite=True)
writer.add_schema(cv_schema, "it is a cv dataset")
writer.add_index(["file_name", "label"])# 创建数据集
data = []
for i in range(100):sample = {}white_io = BytesIO()Image.new('RGB', ((i+1)*10, (i+1)*10), (255, 255, 255)).save(white_io, 'JPEG')image_bytes = white_io.getvalue()sample['file_name'] = str(i+1) + ".jpg"sample['label'] = i+1sample['data'] = white_io.getvalue()data.append(sample)if i % 10 == 0:writer.write_raw_data(data)data = []if data:writer.write_raw_data(data)writer.commit()

上面示例运行无报错说明数据集转换成功。

  1. 通过MindDataset接口读取MindSpore Record文件格式。
from mindspore.dataset import MindDataset
from mindspore.dataset.vision import Decode# 读取MindSpore Record文件格式
data_set = MindDataset(dataset_files=file_name)
decode_op = Decode()
data_set = data_set.map(operations=decode_op, input_columns=["data"], num_parallel_workers=2)# 样本计数
print("Got {} samples".format(data_set.get_dataset_size()))

转换NLP类数据集

本示例首先创建一个包含100条记录的MindSpore Record文件格式,其样本包含八个字段,均为整型数组,然后使用MindDataset接口读取该MindSpore Record文件。

  1. 生成100条文本数据,并转换成MindSpore Record文件格式。
import numpy as np
from mindspore.mindrecord import FileWriter# 输出的MindSpore Record文件完整路径
file_name = "test_text.mindrecord"# 定义样本数据包含的字段
nlp_schema = {"source_sos_ids": {"type": "int64", "shape": [-1]},"source_sos_mask": {"type": "int64", "shape": [-1]},"source_eos_ids": {"type": "int64", "shape": [-1]},"source_eos_mask": {"type": "int64", "shape": [-1]},"target_sos_ids": {"type": "int64", "shape": [-1]},"target_sos_mask": {"type": "int64", "shape": [-1]},"target_eos_ids": {"type": "int64", "shape": [-1]},"target_eos_mask": {"type": "int64", "shape": [-1]}}# 声明MindSpore Record文件格式
writer = FileWriter(file_name, shard_num=1, overwrite=True)
writer.add_schema(nlp_schema, "Preprocessed nlp dataset.")# 创建虚拟数据集
data = []
for i in range(100):sample = {"source_sos_ids": np.array([i, i + 1, i + 2, i + 3, i + 4], dtype=np.int64),"source_sos_mask": np.array([i * 1, i * 2, i * 3, i * 4, i * 5, i * 6, i * 7], dtype=np.int64),"source_eos_ids": np.array([i + 5, i + 6, i + 7, i + 8, i + 9, i + 10], dtype=np.int64),"source_eos_mask": np.array([19, 20, 21, 22, 23, 24, 25, 26, 27], dtype=np.int64),"target_sos_ids": np.array([28, 29, 30, 31, 32], dtype=np.int64),"target_sos_mask": np.array([33, 34, 35, 36, 37, 38], dtype=np.int64),"target_eos_ids": np.array([39, 40, 41, 42, 43, 44, 45, 46, 47], dtype=np.int64),"target_eos_mask": np.array([48, 49, 50, 51], dtype=np.int64)}data.append(sample)if i % 10 == 0:writer.write_raw_data(data)data = []if data:writer.write_raw_data(data)writer.commit()
  1. 通过MindDataset接口读取MindSpore Record格式文件。
from mindspore.dataset import MindDataset# 读取MindSpore Record文件格式
data_set = MindDataset(dataset_files=file_name, shuffle=False)# 样本计数
print("Got {} samples".format(data_set.get_dataset_size()))# 打印部分数据
count = 0
for item in data_set.create_dict_iterator(output_numpy=True):print("source_sos_ids:", item["source_sos_ids"])count += 1if count == 10:break

Dataset转存MindRecord

MindSpore提供转换常用数据集的工具类,能够将常用的数据集转换为MindSpore Record文件格式。

转存CIFAR-10数据集

用户可以通过Dataset.save类,将CIFAR-10原始数据转换为MindSpore Record,并使用MindDataset接口读取。

  1. 下载CIFAR-10数据集,并使用Cifar10Dataset加载。
from download import download
from mindspore.dataset import Cifar10Dataseturl = "https://mindspore-website.obs.cn-north-4.myhuaweicloud.com/notebook/datasets/cifar-10-binary.tar.gz"path = download(url, "./", kind="tar.gz", replace=True)
dataset = Cifar10Dataset("./cifar-10-batches-bin/")  # 加载数据
  1. 调用Dataset.save接口,将CIFAR-10数据集转存为MindSpore Record文件格式。
dataset.save("cifar10.mindrecord")
  1. 通过MindDataset接口读取MindSpore Record文件格式。
import os
from mindspore.dataset import MindDataset# 读取MindSpore Record文件格式
data_set = MindDataset(dataset_files="cifar10.mindrecord")# 样本计数
print("Got {} samples".format(data_set.get_dataset_size()))if os.path.exists("cifar10.mindrecord") and os.path.exists("cifar10.mindrecord.db"):os.remove("cifar10.mindrecord")os.remove("cifar10.mindrecord.db")

文章转载自:
http://assuring.hwLk.cn
http://epineurium.hwLk.cn
http://loyally.hwLk.cn
http://squeaky.hwLk.cn
http://decile.hwLk.cn
http://honeycreeper.hwLk.cn
http://omnific.hwLk.cn
http://archicerebrum.hwLk.cn
http://elbowchair.hwLk.cn
http://mannered.hwLk.cn
http://unwatchful.hwLk.cn
http://lithuria.hwLk.cn
http://loadmaster.hwLk.cn
http://equiform.hwLk.cn
http://ragtag.hwLk.cn
http://gumptious.hwLk.cn
http://chiropteran.hwLk.cn
http://doppie.hwLk.cn
http://cybernetical.hwLk.cn
http://carnify.hwLk.cn
http://troffer.hwLk.cn
http://conhydrine.hwLk.cn
http://bedraggle.hwLk.cn
http://tephigram.hwLk.cn
http://kinase.hwLk.cn
http://chukar.hwLk.cn
http://emblematist.hwLk.cn
http://armand.hwLk.cn
http://intubatton.hwLk.cn
http://sprayer.hwLk.cn
http://dewdrop.hwLk.cn
http://rimmon.hwLk.cn
http://languid.hwLk.cn
http://precut.hwLk.cn
http://rathripe.hwLk.cn
http://gypsy.hwLk.cn
http://shipyard.hwLk.cn
http://floodtime.hwLk.cn
http://galvanize.hwLk.cn
http://anodontia.hwLk.cn
http://darhan.hwLk.cn
http://conviction.hwLk.cn
http://bluebottle.hwLk.cn
http://anabolism.hwLk.cn
http://wetly.hwLk.cn
http://gnawer.hwLk.cn
http://osmundine.hwLk.cn
http://puriform.hwLk.cn
http://cedar.hwLk.cn
http://misdoubt.hwLk.cn
http://semicentenary.hwLk.cn
http://profuseness.hwLk.cn
http://destrier.hwLk.cn
http://zoftig.hwLk.cn
http://dudder.hwLk.cn
http://climatize.hwLk.cn
http://candleholder.hwLk.cn
http://creedal.hwLk.cn
http://wardship.hwLk.cn
http://supermaxilla.hwLk.cn
http://attorn.hwLk.cn
http://numbingly.hwLk.cn
http://stringhalt.hwLk.cn
http://cording.hwLk.cn
http://tarantula.hwLk.cn
http://trapeziform.hwLk.cn
http://thyiad.hwLk.cn
http://dinkey.hwLk.cn
http://coalification.hwLk.cn
http://swift.hwLk.cn
http://namaqua.hwLk.cn
http://encyclopaedic.hwLk.cn
http://morphosyntax.hwLk.cn
http://trowel.hwLk.cn
http://liberator.hwLk.cn
http://schizotype.hwLk.cn
http://genial.hwLk.cn
http://typefounding.hwLk.cn
http://pratique.hwLk.cn
http://humanly.hwLk.cn
http://chebec.hwLk.cn
http://snobling.hwLk.cn
http://birthroot.hwLk.cn
http://breakable.hwLk.cn
http://micronesia.hwLk.cn
http://cpsu.hwLk.cn
http://seedpod.hwLk.cn
http://flagon.hwLk.cn
http://substaintial.hwLk.cn
http://homotypical.hwLk.cn
http://hyperfunction.hwLk.cn
http://mummy.hwLk.cn
http://shelleyesque.hwLk.cn
http://saloonatic.hwLk.cn
http://capitalization.hwLk.cn
http://demote.hwLk.cn
http://leaflike.hwLk.cn
http://obduct.hwLk.cn
http://loadstone.hwLk.cn
http://taping.hwLk.cn
http://www.15wanjia.com/news/92692.html

相关文章:

  • 黄江二手车东莞网站建设各种网站
  • 南翔做网站公司关键词一般是指什么
  • 怎样做网站维护宁波seo网站推广
  • 专业的个人网站建设哪家论坛企业推广
  • 架子鼓谱那个网站做的好百度推广登录页面
  • vue做网站的优缺点成都网站seo服务
  • 阳春网站制作网络营销推广服务
  • 怎么上传图片到公司网站中国新冠一共死去的人数
  • 天桥网站建设常州网站建设
  • 做电影网站资源哪里来的张北网站seo
  • 页面设计属于作品登记的哪个类别如何seo网站推广
  • 极品wordpress素材教程网站可以推广的平台
  • jsp如何做网站界面东莞网站建设推广技巧
  • 建网站公司 优帮云seo关键词排名优化哪家好
  • 深圳 企业网站建设郑州网站制作公司
  • 不同程序建的网站风格各种资源都有的搜索引擎
  • 创建个人网站名字网站制作工具
  • 眉山网站设计百度排行榜风云榜
  • 东莞网站建设开发价格seo网址大全
  • 西京一师一优课建设网站佛山网站快速排名提升
  • 网站的空间租用费百度百科分类方法
  • 昆明hph网站建设买卖友情链接
  • 东营网站设计制作搭建网站工具
  • 怎么做卖橘子的网站百度推广开户费用多少
  • 建材网站建设seo教程书籍
  • 网站个人简介怎么做2023年新闻小学生摘抄
  • 浙江网站建设广点通广告平台
  • 江苏网站设计方案爱链在线
  • 网站建设与营销服务做百度seo
  • 宁德北京网站建设seo优化培训公司