设为首页收藏本站 关注微博 关注微信

全球新闻在线

全球新闻在线 首页 科技新闻 技术解析 查看内容

当机器人有了好奇心会怎样样?

2021-5-20 14:25| 发布者: wdb| 查看: 34| 评论: 0|原作者: [db:作者]|来自: [db:来源]

摘要: 当机器人有了好奇心会怎样样?,更多国内科技资讯关注我们。

  在一场对于人力智能的转折中,计算机科学家对机器发展编程,使其变得具备好奇心——能本人探寻四周环境而且为了学习而学习。这类新方法可使机器人比此刻学习得更快。有朝一日,他们甚而可能在造成假设和推进已知科学前进进行方面超过人类科学家。

  “进行好奇心是智能的焦点难题。”在美国布朗大学掌管智能机器人实验室的计算机科学家George Konidaris推荐说,“当你不确定你的机器人将来要做甚么时,使其具备好奇心将来会十分有效。”

  好几年以来,科学家一直在开发针对好奇心的算法,但复制人类的求知欲是个困难。例如,许多数方法不行估价智能机器人在瞧见某个事物前预测其能否有趣方面存留的差距。(人类有时能经过封面判断一本书能否有趣)

  日前在英国伦敦google深度思维企业就职的计算机科学家Todd Hester期望做得更好。“咱在寻觅使计算机愈加聪明地学习而且像人类一样发展探寻的方法。”Hester显示,“非是探寻全部事宜,还不是随便发展探寻,却是尝试着愈加聪明地做少许事宜。”

  为这,Hester和得克萨斯大学计算机科学家Peter Stone开发了一个名为TEXPLORE-VENIR、依赖于强化学习技艺的新算法。在强化学习中,程序会尝试少许事宜。假如一种举动使其离某个终归指标(例如迷宫的尽头)更近一步,它会收到一种小小的奖励而且更有可能在将来再一次尝试这一操作。深度思维企业应用强化学习,使程序经过随机试验掌握雅达利游戏和围棋游戏的玩法。只是,和其它具备好奇心的算法一样,TEXPLORE-VENIR同样设计了一种内在指标。假如它了解了少许新事物,就会奖励本人,即使这点常识并没有使其离终归指标更近一步。

  随着TEXPLORE-VENIR不停学习而且建立起对于全球的模子,它会因发觉了和之前看到的事物不一样的消息而奖励本人。例如,在一幅地图上发觉遥远的位置,或许在烹调用的程序上发觉具备异国情调的食谱。“他们是十足不同的学习和探寻类别。”Konidaris显示,“对他们发展平衡真的很要紧。咱喜爱这篇文章的位置在于它同一时间做到了两点。”

  Hester和Stone在两个情景中测试了它们的方法。起首是一种含有一圈4个房间的虚拟迷宫,房间则由锁着的门接连起来。机器人(仅是一种计算机程序)不得不寻到钥匙,将其捡起来,接下来应用它开启门上的锁。每经过一扇门,机器人会得到10分,而且具有3000步来得到更高的得分。假如探讨人士先让机器人仅在TEXPLORE-VENIR的指导下摸索1000步,它在3000步的测试阶段会平均得到约55分。假如机器人应用其它开发好奇心的算法发展此类探寻,它在测试阶段的得分从0到35分不等,除了应用一个被称为R-Max的算法。后者也能让机器人得到约55分。在另一种不同的设定中,机器人不得不同一时间探寻和穿过门。TEXPLORE-VENIR得到了约70分,R-Max得到了约35分,其它算法得到的分数则不到5分。探讨人士在6月出版的《人力智能》杂志上汇报了这一结果。

  随后,探讨人士应用实体机器人测试了它们的算法。这是一种被称为Nao的人形玩具。在3项单独的任务中,半米高的机器人须要击打铙钹、用手将粉色胶带举到面前或许按下脚上的按键,从而得到分数。在每项任务中,它有200步来得到分数,但此前会有400步来摸索。这要么是随机发展的,要么应用TEXPLORE-VENIR。每种方法平均展开了13次试验。相较于随机摸索,在应用TEXPLORE-VENIR发展探寻后,Nao在寻到粉色胶带上做得更好,而且在13次试验中,有7次按下了按键。但在随机探寻后,无一次按下。经过本身和四周环境展开半构造化的试验,TEXPLORE-VENIR做好了充分准备执行被分配的任务,就像婴儿在学习爬此前舞动本人的四肢一样。

  在做家务、设置高效的制造过程或许为疾病寻求治疗方案时,具备好奇心的机器人会体现出灵活的举止。Hester显示,下一步将应用深度神经网站,即以大脑构造为模子的算法更好地确定要探寻的新范畴。而这顺便也能使Hester的探寻更进一步:“咱们是否生产像儿童一样学习的机器人呢?” (宗华编译)

来自:华夏科学报

编辑:童妙 实习编辑 曾映雪