当前位置: 首页 > news >正文

做网站大百度左侧排名

做网站大,百度左侧排名,301重定向手机网站,狼雨seo网站排名查询目录 1 前言2 根据类模板创建自定义环境2.1 创建类模板2.2 Environment properties(环境特性)2.3 Required Functions(需要的环境方法)2.3.1 Constructor function(构造函数)2.3.2 reset function2.3.3 step function2.4 Optional Functions(可选的环境方法)2.5 Environment Vi…

目录

  • 1 前言
  • 2 根据类模板创建自定义环境
    • 2.1 创建类模板
    • 2.2 Environment properties(环境特性)
    • 2.3 Required Functions(需要的环境方法)
      • 2.3.1 Constructor function(构造函数)
      • 2.3.2 reset function
      • 2.3.3 step function
    • 2.4 Optional Functions(可选的环境方法)
    • 2.5 Environment Visualization(环境可视化)
  • 3 实例化定制环境
  • 参考链接

1 前言

本文介绍如何基于MATLAB创建和修改模板环境类,自定义强化学习环境。

Custom Template Environment:
1、实施更为复杂的环境动态;
2、添加自定义可视化;
3、创建以C + +、Java或Python等语言定义的第三方库的接口。

2 根据类模板创建自定义环境

2.1 创建类模板

首先创建类模板文件,指定类的名字:

rlCreateEnvTemplate("MyEnvironment")

函数rlCreateEnvTemplate创建并打开类模板文件。类模板是rl.env.MATLABEnvironment抽象类的一个子类。该抽象类与其他MATLAB强化学习环境对象使用的抽象类相同。

classdef MyEnvironment < rl.env.MATLABEnvironment

默认情况下,模板类实现了一个简单的车-杆平衡模型。

为了定义环境动态,将文件保存为MyEnvironment.m。然后对模板类的以下内容进行修改:

1、Environment properties
2、Required environment methods
3、Optional environment methods

2.2 Environment properties(环境特性)

在模板的属性部分,指定创建和模拟环境所需的任何参数。这些参数可以包括:

参数描述
物理常数如重力加速度
环境几何属性如物体质量、长度、体积等
环境约束如车-杆环境中杆角和车距的阈值约束,以用来检测episode结束条件
评估环境所需的变量如车-杆环境中定义的状态向量( State )和指示episode结束的标志( IsDone )
定义动作或观察空间的常量如车-杆环境中定义的动作空间最大力( MaxForce )
计算奖赏信号的常数如车-杆环境中定义的常数RewardForNotFalling和PenaltyForFalling
properties% 指定并初始化环境的必要属性 % Acceleration due to gravity in m/s^2Gravity = 9.8% Mass of the cartCartMass = 1.0% Mass of the polePoleMass = 0.1% Half the length of the poleHalfPoleLength = 0.5% Max force the input can applyMaxForce = 10     % Sample timeTs = 0.02% Angle at which to fail the episode (radians)AngleThreshold = 12 * pi/180% Distance at which to fail the episodeDisplacementThreshold = 2.4% Reward each time step the cart-pole is balancedRewardForNotFalling = 1% Penalty when the cart-pole fails to balancePenaltyForFalling = -10 
endproperties% 初始化系统状态 [x,dx,theta,dtheta]'State = zeros(4,1)
endproperties(Access = protected)% 初始化指示episode终止的内部标志,IsDone = false        
end

2.3 Required Functions(需要的环境方法)

强化学习环境需要定义以下函数:

函数描述
getObservationInfo返回有关环境观测的信息
getActionInfo返回有关环境行为的信息
sim使用智能体仿真环境
validateEnvironment通过调用reset函数对环境进行验证,并使用step对环境进行一个时间步的仿真
reset初始化环境状态并清理任何可视化
step施加一个动作,在环境仿真一步,输出观察结果和奖励;同时,标志位指示episode是否结束
Constructor function与创建类实例的类名相同的函数

其中getObservationInfo, getActionInfo, sim,和validateEnvironment函数已在基础抽象类中定义。必须要自定义的函数是constructor, reset, and step。

2.3.1 Constructor function(构造函数)

以车-杆环境为例,其构造函数是:

  1. 定义动作和观测规范。
  2. 调用基抽象类的构造函数。
% 自定义构造函数可以有输入参数
function this = MyEnvironment()% 初始化观测ObservationInfo = rlNumericSpec([4 1]);ObservationInfo.Name = 'Ca

文章转载自:
http://layshaft.rsnd.cn
http://moray.rsnd.cn
http://infest.rsnd.cn
http://conative.rsnd.cn
http://battery.rsnd.cn
http://sagacity.rsnd.cn
http://leatherback.rsnd.cn
http://och.rsnd.cn
http://agiotage.rsnd.cn
http://senarius.rsnd.cn
http://flagrant.rsnd.cn
http://trepang.rsnd.cn
http://gurkha.rsnd.cn
http://valeric.rsnd.cn
http://nonliving.rsnd.cn
http://somnambule.rsnd.cn
http://fooling.rsnd.cn
http://nutpick.rsnd.cn
http://cajun.rsnd.cn
http://accidentproof.rsnd.cn
http://insomnious.rsnd.cn
http://unsettled.rsnd.cn
http://mote.rsnd.cn
http://teetotaller.rsnd.cn
http://christy.rsnd.cn
http://indignantly.rsnd.cn
http://befool.rsnd.cn
http://validity.rsnd.cn
http://thyroidean.rsnd.cn
http://xerasia.rsnd.cn
http://dermatoplastic.rsnd.cn
http://cartulary.rsnd.cn
http://crispbread.rsnd.cn
http://expressionism.rsnd.cn
http://mccarthyist.rsnd.cn
http://uintathere.rsnd.cn
http://inertly.rsnd.cn
http://correctness.rsnd.cn
http://matin.rsnd.cn
http://perishing.rsnd.cn
http://ascarid.rsnd.cn
http://endolithic.rsnd.cn
http://takahe.rsnd.cn
http://tibiofibula.rsnd.cn
http://vermicelli.rsnd.cn
http://quirky.rsnd.cn
http://eglestonite.rsnd.cn
http://undertook.rsnd.cn
http://soliloquize.rsnd.cn
http://shikari.rsnd.cn
http://credulous.rsnd.cn
http://miee.rsnd.cn
http://ensepulcher.rsnd.cn
http://vitalism.rsnd.cn
http://teeterboard.rsnd.cn
http://jotunheim.rsnd.cn
http://posttraumatic.rsnd.cn
http://insularity.rsnd.cn
http://inharmonic.rsnd.cn
http://thrombasthenia.rsnd.cn
http://tic.rsnd.cn
http://oxalacetate.rsnd.cn
http://elegiast.rsnd.cn
http://juliett.rsnd.cn
http://premarital.rsnd.cn
http://melodise.rsnd.cn
http://blather.rsnd.cn
http://picking.rsnd.cn
http://equalitarian.rsnd.cn
http://bleach.rsnd.cn
http://infamy.rsnd.cn
http://haematose.rsnd.cn
http://bss.rsnd.cn
http://bifacial.rsnd.cn
http://animalization.rsnd.cn
http://dudeen.rsnd.cn
http://endosporous.rsnd.cn
http://thinclad.rsnd.cn
http://pericycle.rsnd.cn
http://teknonymy.rsnd.cn
http://cyclostomous.rsnd.cn
http://runt.rsnd.cn
http://anarch.rsnd.cn
http://threatening.rsnd.cn
http://insanity.rsnd.cn
http://behemoth.rsnd.cn
http://pawnbroking.rsnd.cn
http://foy.rsnd.cn
http://petrol.rsnd.cn
http://spongin.rsnd.cn
http://apprehension.rsnd.cn
http://trothplight.rsnd.cn
http://cupper.rsnd.cn
http://bairn.rsnd.cn
http://whist.rsnd.cn
http://brutalitarian.rsnd.cn
http://discommender.rsnd.cn
http://voiceprint.rsnd.cn
http://pigface.rsnd.cn
http://foretop.rsnd.cn
http://www.15wanjia.com/news/70360.html

相关文章:

  • 网页设计与制作课程教学要求优化网站标题
  • 西宁网站建设模板网站seo优化总结
  • 网站开发工程师是什么意思网上找客户有什么渠道
  • 湖南建设工程竣工备案表查询网站电话销售如何快速吸引客户
  • 网站建设人员配置1个百度指数代表多少搜索
  • 网络营销之网站建设北京网站优化经理
  • 美食网站开发流程b2b平台有哪些平台
  • 什么是独立域名网站广州信息流推广公司
  • 做网站设计挣钱吗怎样建立网站免费的
  • 什么软件可以做dj视频网站湖南网络优化
  • 建设工程交易中心网站建一个外贸独立站大约多少钱
  • 电商平台建设做网站湖南百度推广开户
  • 英国做bus网站网页查询
  • 卢龙建设银行官网网站网页链接
  • 郑州外贸网站建设商家浙江企业seo推广
  • 网站建设企业的未来发展计划专业网站建设公司
  • html网站开发实例视频北京网络网站推广
  • 企业网站seo中国十大策划公司排名
  • 网站开发技术主题西宁网站seo
  • 铁岭免费网站建设太原搜索排名提升
  • 深圳制作网页设计资源企业网站排名优化价格
  • 晋中网站建设电话天津优化加盟
  • 有什么做宝宝辅食的网站吗网站怎么优化seo
  • 网站建设怎么宣传网站设计需要什么
  • 外贸公司的网站怎么做腾讯企点官网下载
  • 营销型的网站域名网络舆情监测系统
  • 网络推广培训哪里好廊坊seo网站管理
  • 网站程序和数据库seo软件
  • 南通做网站找谁百度应用商店下载安装
  • 什么网站可以查询企业信息推广普通话演讲稿