Openai用了五个Lstm加ppo训练的【dota2吧】_百度贴吧

11月02日漏签0天

dota2吧关注：6,408,293贴子：177,106,825

17回复贴，共1页

<返回dota2吧

Openai用了五个Lstm加ppo训练的

只看楼主收藏回复

多智能体之间通信和历史信息全靠lstm，state和action全部编码好了。唯一的难点是动作空间太大，有十七万种动作，对于这个问题，他们用了action embedding和ls***向量做内积，对action打分，然后过滤出高分动作。算法上没做大的创新，nature或者science估计不够，发篇nips应该是差不多了。

送TA礼物

来自iPhone客户端1楼2019-04-19 20:24回复

前段时间刚做了个alphastar openai five技术总结汇报

来自iPhone客户端3楼2019-04-19 20:25

不感兴趣

开通SVIP免广告

看了一段时间的感受是他们多智能体协同的问题是真的训练的非常好，ai之间配合很牛逼。但是全局策略训练的并不是多么优秀。能打败人类职业选手，第一是靠极其牛逼的配合，这点人类做不到，其次靠的是极其快速的反应，虽然Openai说反应速度限制了，但是我感觉人类还是做不到。

来自iPhone客户端4楼2019-04-19 20:28

收起回复

求个相关的paper看一下

IP属地:澳大利亚

来自iPhone客户端5楼2019-04-19 20:29

收起回复

不是，不就是引用几个库调几个参数吗？

IP属地:广东

来自Android客户端6楼2019-04-19 20:30

收起回复

相比alphastar来说算法上还是弱了很多

来自iPhone客户端7楼2019-04-19 20:33

有openai相关的资料吗？最近在研究ai，对这个挺感兴趣

IP属地:中国香港

来自Android客户端9楼2019-04-19 20:38

收起回复

10楼2019-04-19 21:09

不感兴趣

开通SVIP免广告

ppo

IP属地:美国

来自iPhone客户端12楼2019-04-19 21:10

d吧真是卧虎藏龙

IP属地:辽宁

来自Android客户端13楼2019-04-19 21:28

难道不是各种ga算法优化吗

IP属地:美国

来自iPhone客户端14楼2019-04-19 22:26

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频！

贴吧热议榜

17回复贴，共1页

<返回dota2吧

发表回复

发贴请遵守贴吧协议及“七条底线”贴吧投诉

内容:

使用签名档查看全部

发表

保存至快速回贴