帮助中心 广告联系

成都百姓网-人才网,招聘网,二手房网,房产网,租房网,教育网,新闻网,信息网,信息港-成都在线

热门关键词:

TensorFlow应用实战-17-Qlearning实现迷宫小游戏

来源:原创/投稿/转载 发布时间:2019-08-26

  Q是Quality的首字母,表示质量/优劣,表示给它打一个分。

  总共有12个状态,s1到s12.对于每一个状态会有四个动作。对于每个状态下的每个动作会有一个Q的值。

  用Tkinter 来模拟gym的环境构建。我们用到的方法名和用法都和gym是类似的。

  定义它的动作空间: action_space 上下左右四个。 up downaction的数目。 title: 生成的游戏窗口的titlegeometry 几何形状。第一维是一宽度乘以每个单元的像素值,第二维是高乘以每个单元像素值。

  输出的Action可以是一个连续的值,Value-Based输出是不连续的。

责任编辑:admin

本网转载作品的目的在于传递更多信息,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。如涉及作品内容、版权等问题,请联系我们进行修改或删除!