RSS
热门关键字:  数据挖掘  数据仓库  商业智能  人工智能  搜索引擎

主動式學習

来源: 作者:unkonwn 时间:2004-12-09 点击:

一个被动式的学习策略,可以看成固定不变的策略,在这种情况下,我们不需考虑那个下一个动作该做什么?反之,主动式的学习策略必需考虑下一步要怎么做,它们执行的结果可是是什么?当获得某些鼓励后,会对它们造成什么样的影响?底下除了简介什么是主动式的学习外,还另外探讨主动式学习在未知环境的表现。 数据挖掘实验室

主动式学习就是指个体要决定做一件事,通常会先评估看看要怎么做才是最好的,这可以是一个推理或是其经验,从许多可行的方案中找到一个最好的方式。而做了之后,会再衡量这么做是值得吗?值多少?以做为下次再做同一件事,或是做相关决定的参考。 数据挖掘实验室

·  在未知环境中,什么都不知道,我们要如何自动地去学习呢?一般来说,应该就是先做做看,看看这一次做的结果如何,再逐步修正自己的方式,经由一次次的做做看,所得的结果,我们慢慢的自我评估归纳,在心里面给定每一次做的方式不同的评估值,这代表那一个方式是较佳的。

·  而在每一件事做完后,就可以把所以方式做一个完整的评估,或许亦可以从中得到那个方式,其实应该是应用在那一个方面的。我们将介绍一个有名的例子,主动式 ADP 反应元

数据挖掘研究院

·  这里我们将设计一个主动式 ADP 反应元,这个反应元藉由自己所做动作的结果来学习一个环境的模式 M,和使用这个模式去计算可用涵数 U,而我们计算的方式是用动态规划的算法。

·  左图是这个 主动式 ADP 反应元的执行程序,首先,我们先将一个我们已经做过的事而得到的效能值加进到 percepts 这个串行,刚开始时,我们都还没有习学之前,这个串行当然是空的。 数据挖掘研究院

·  然后再将这个效能值经由一个评估报酬的涵数来给报酬,并加入到状态报酬表中下去考虑。此时就根据现在的状态决定下一个步骤。

·  此时,我们还要把这次的结果,评估其可用的程度,以供下次再做的参考。

数据挖掘研究院

·  整个流程的应用,就是主动式学习的最佳说明,最初,自己先去搜集数据,再仔细考虑后,决定去如何处理;而之后,再看看自己做的如何,再记起来,也就是学习起来了。 数据挖掘研究院

  •  主动式学习的一个重要课题就是如何选择下一个步骤。这有两个方向可以考虑,举个例子,在现实的生活中,常常会在是否是维持现在满意的生活方式,还是要去不可知的未来去探索一个更新更好的生活中去考虑。底下就介绍一个经常用来探索的方式 数据挖掘研究院

    ·  我们现在先考虑两种去探索的可能方式,一个叫做「wacky」的方法,它是随机的去选取,最终它会探索到整个环境;而另一个叫做「greedy」的方法,它每次都是选用现在最大的可用状况。但这两种方式各有缺点,所以我们需要一个介于这两者之间的方法:一个反应元应该在一开始不知所措的环境中使用较「wacky」的方式,而当有一个正确模式可寻时,就要用「greedy」的方式来做。

     

     
  • 最新评论共有 0 位网友发表了评论
    发表评论
    评论内容:不能超过250字,需审核,请自觉遵守互联网相关政策法规。
    匿名?