当前位置: 首页 > news >正文

农夫山泉vi设计手册外贸网站建设seo

农夫山泉vi设计手册,外贸网站建设seo,在哪里查企业信息最准确,充值网站建设目录 1 前言2 根据类模板创建自定义环境2.1 创建类模板2.2 Environment properties(环境特性)2.3 Required Functions(需要的环境方法)2.3.1 Constructor function(构造函数)2.3.2 reset function2.3.3 step function2.4 Optional Functions(可选的环境方法)2.5 Environment Vi…

目录

  • 1 前言
  • 2 根据类模板创建自定义环境
    • 2.1 创建类模板
    • 2.2 Environment properties(环境特性)
    • 2.3 Required Functions(需要的环境方法)
      • 2.3.1 Constructor function(构造函数)
      • 2.3.2 reset function
      • 2.3.3 step function
    • 2.4 Optional Functions(可选的环境方法)
    • 2.5 Environment Visualization(环境可视化)
  • 3 实例化定制环境
  • 参考链接

1 前言

本文介绍如何基于MATLAB创建和修改模板环境类,自定义强化学习环境。

Custom Template Environment:
1、实施更为复杂的环境动态;
2、添加自定义可视化;
3、创建以C + +、Java或Python等语言定义的第三方库的接口。

2 根据类模板创建自定义环境

2.1 创建类模板

首先创建类模板文件,指定类的名字:

rlCreateEnvTemplate("MyEnvironment")

函数rlCreateEnvTemplate创建并打开类模板文件。类模板是rl.env.MATLABEnvironment抽象类的一个子类。该抽象类与其他MATLAB强化学习环境对象使用的抽象类相同。

classdef MyEnvironment < rl.env.MATLABEnvironment

默认情况下,模板类实现了一个简单的车-杆平衡模型。

为了定义环境动态,将文件保存为MyEnvironment.m。然后对模板类的以下内容进行修改:

1、Environment properties
2、Required environment methods
3、Optional environment methods

2.2 Environment properties(环境特性)

在模板的属性部分,指定创建和模拟环境所需的任何参数。这些参数可以包括:

参数描述
物理常数如重力加速度
环境几何属性如物体质量、长度、体积等
环境约束如车-杆环境中杆角和车距的阈值约束,以用来检测episode结束条件
评估环境所需的变量如车-杆环境中定义的状态向量( State )和指示episode结束的标志( IsDone )
定义动作或观察空间的常量如车-杆环境中定义的动作空间最大力( MaxForce )
计算奖赏信号的常数如车-杆环境中定义的常数RewardForNotFalling和PenaltyForFalling
properties% 指定并初始化环境的必要属性 % Acceleration due to gravity in m/s^2Gravity = 9.8% Mass of the cartCartMass = 1.0% Mass of the polePoleMass = 0.1% Half the length of the poleHalfPoleLength = 0.5% Max force the input can applyMaxForce = 10     % Sample timeTs = 0.02% Angle at which to fail the episode (radians)AngleThreshold = 12 * pi/180% Distance at which to fail the episodeDisplacementThreshold = 2.4% Reward each time step the cart-pole is balancedRewardForNotFalling = 1% Penalty when the cart-pole fails to balancePenaltyForFalling = -10 
endproperties% 初始化系统状态 [x,dx,theta,dtheta]'State = zeros(4,1)
endproperties(Access = protected)% 初始化指示episode终止的内部标志,IsDone = false        
end

2.3 Required Functions(需要的环境方法)

强化学习环境需要定义以下函数:

函数描述
getObservationInfo返回有关环境观测的信息
getActionInfo返回有关环境行为的信息
sim使用智能体仿真环境
validateEnvironment通过调用reset函数对环境进行验证,并使用step对环境进行一个时间步的仿真
reset初始化环境状态并清理任何可视化
step施加一个动作,在环境仿真一步,输出观察结果和奖励;同时,标志位指示episode是否结束
Constructor function与创建类实例的类名相同的函数

其中getObservationInfo, getActionInfo, sim,和validateEnvironment函数已在基础抽象类中定义。必须要自定义的函数是constructor, reset, and step。

2.3.1 Constructor function(构造函数)

以车-杆环境为例,其构造函数是:

  1. 定义动作和观测规范。
  2. 调用基抽象类的构造函数。
% 自定义构造函数可以有输入参数
function this = MyEnvironment()% 初始化观测ObservationInfo = rlNumericSpec([4 1]);ObservationInfo.Name = 'Ca
http://www.15wanjia.com/news/178210.html

相关文章:

  • 网站 抄袭自己做网站服务器
  • 用织梦建手机网站手工包网站建设策划书
  • 网站开发需要了解的知识怎么创建一个属于自己的平台
  • 网站制作说明书商城开发建设
  • 推动品牌建设的网站制作游戏的软件有哪些
  • 视频上传网站建设标题关键词优化报价
  • .net做的学校网站wordpress 3 小工具运行php
  • 牛二网站建设udacity 网站开发
  • 建设企业银行官方网站全网推广营销
  • 网站的基本要素网站建设验收单
  • 公司网站主页怎么做安徽经工建设集团网站
  • 什么是网站主办者网页界面分析及设计布局
  • 网站代码怎么写邢台市做网站电话
  • 网站推广计划怎么做工信部网站备案通知
  • 网站开发方案服装网站简介造价咨询公司加盟分公司
  • 网站需求说明网站表单及商品列表详情模板
  • 没有服务器怎么做网站广西医院响应式网站建设方案
  • 企业网站带后台成都旅游公司
  • 网站js代码不显示织梦网站数据下载
  • 直播类网站开发wordpress 标题截断
  • 网站百度地图导航代码生成公司做网站算什么费用
  • 怎么把网站列入黑名单备案 网站名称怎么写
  • 微信商城和微网站个人网站可以做商城吗
  • wordpress 电台网站wordpress coolcode
  • 能下短视频网站做牙华夏网站建设
  • 一个空间怎么放多个网站吗手机上干点啥能挣零花钱
  • 交易网站建设需要学什么软件微信小程序传奇怎么制作
  • 网站的排名和什么因素有关系江苏建设部网站
  • 重庆市城市建设规划官方网站wordpress网站编辑
  • 外贸网站怎样做做网站卖广告挣几百万