[挖坑]图像识别与神经网络在魔塔游戏中的简单实验

share

早苗厨:机械zg会梦到电子雨天放晴吗
发布于 2021-04-24 13:07:34

小猪硕士:AI拆塔是最优解吧,如果只是为了通关AI就太慢了 发布于 2021-04-24 12:26:04

貪玩壞小孩:魔塔的场景其实跟alpha go有点类似,都是2D棋盘式的过程,一些技能传送类的策略可以参考策略游戏(如星际)的ai,现在游戏AI的开源项目很多,可以先套下试试。 发布于 2021-04-24 11:26:24

花葬列nice:搞出来了顺便写篇论文发到一区 发布于 2021-04-24 00:10:34

我是pre:毕竟魔塔是一个NP/NPC问题
期待神经网络的结果 发布于 2021-04-24 00:09:34

莹烛之灬:题主哪个学校的? 发布于 2021-04-23 23:16:24

游戏狂人693:真大佬来了,支持 发布于 2021-04-23 20:43:34

牧童短笛2014:我最近就在考虑魔塔如何才能刷,如何才能做成开放世界,魔塔的未来肯定要摆脱这个固定模板的宿命。目前魔塔的蓝海作者们已经在发挥他们的才能和创意了,已经再做尝试了,而我也相信魔塔游戏的未来一定会比今天更高,从事魔塔创作的可爱作者们能够不再用爱发电,而是能够评借自己的创作获得他人的尊重,喜爱和在现世生存必不可少的财富。如果魔塔生成技术有所突破和成就,使得构建一个完整开放世界存在可能,魔塔就会迎来新生。
--2021年春节前献上祝福 发布于 2021-04-23 20:00:34

牧童短笛2014:传统RPG和角色扮演类游戏相比于魔塔的优势就在于推广难度低,玩家上手快,任何段位的玩家都能感受到爽点。其核心要义就是可以刷,可以肝,可以通过刷装备,刷等级,刷技能,从而吊打boss。如果是网游还可以氪金和靠运气。但魔塔本身的框架决定了玩家刷不了,即使是现在的境界塔,你高等级了,是找不到低等级的怪刷经验的。你只会碰到更高等级的怪。 发布于 2021-04-23 19:59:04

牧童短笛2014:可是想要推广就必须降低游戏门槛,但门槛一旦降低,红海拆塔的乐趣这些低门槛的玩家就完全无法体会到了,只能说鱼与熊掌不可兼得。 发布于 2021-04-23 19:58:04

牧童短笛2014:不过比较尴尬的是,即使AI辅助魔塔生成未来有如此高的应用价值,但是由于服务的对象群体太小,商业价值太低。也就是说,花费时间和精力做这个事不会有财富上的回报。只能沦为业余兴趣研究课题,而无法成为商业项目。这就导致了,从事人数少,时间不可控,质量不可控等一系列问题。要解决这个问题,除非有人(神)能把魔塔这种小众硬核游戏推广至全国玩家甚至全球玩家。 发布于 2021-04-23 19:54:24

牧童短笛2014:训练数据的话,利用塔吧目前的作品就已经够用了,可是数据结构的设计,数据的录入和清洗是难题,至于算法和工具的选择,并没有那么难,只是不断试验,调优的体力活。 发布于 2021-04-23 19:52:14

牧童短笛2014:相比较于求解魔塔这个课题,我更感兴趣的是魔塔生成的研究方向,未来应用定位在辅助作者造塔过程。比如:自动设置怪物强度和数据,自动绘制地图,自动排布怪物,这样减少作者造塔过程中固定的体力活,使得作者关注剧情和游戏体验本身,这样能显著提高生产力,加快造塔进度。目前魔塔制作的困难和瓶颈就在于造塔速度太慢,即时作者很肝,保证质量的情况下,1天10张图已经是顶天了,而且大部分作者没有那么多时间,所以鸽成了常态。 发布于 2021-04-23 19:50:54

牧童短笛2014:其实求解魔塔的应用前景并不高,最多给出是否有解和理论最高分。因为魔塔游戏的快乐就是不停优化拆塔,如果应用算法去拆塔就毫无乐趣,魔塔本身娱乐价值就会失去。 发布于 2021-04-23 19:49:24

牧童短笛2014:如果是迷宫自动求解和自动生成,目前有很成熟的解决方案。魔塔求解问题比迷宫复杂度高,可能最有用的具体应用是用来判断魔塔是否有解 发布于 2021-04-23 19:48:14

119456abc:这是对一个特定塔训练一个模型还是要对所有某模板的塔都成立?如果是后者的话,建议先不要考虑max了,先做出“输入一个塔,输出该塔能否通关”的功能就好了。 发布于 2021-04-23 19:43:24

lalamodiy:你们为什么要用AI拆塔 发布于 2021-04-23 19:39:34

Godel_Rosser:支持,大佬tql
希望lz有空给我这种渣渣出个相关工具的科普教学什么的。。或将为魔塔吧开创新纪元 发布于 2021-04-23 19:31:04

五峰山上五峰人:即使不考虑破飞炸,路径规划过程中在考虑攻防,血量,魔防,金币经验买属性的情况下还要考虑钥匙与门,夹击阻击领域,有些塔还要考虑毒网血网和衰弱等恶心人的要素(还可能有用楼传改变位置等操作),更别提还有些塔有比较复杂的技能设定,加点等等,这个问题大概率本来就是NP难的,即便用神经网络找到了有效算法,也并不一定是多项式时间的,也就是说在高层塔或者一些复杂塔中,找到的这个算法也极有可能是不太具有实际的可操作性的。
现存的一些设计算法的方法可能只能够处理一些纯转换塔,或者是金币经验塔,只能作为学术研究探讨一下,但既然是纯转换,只要提取出塔的结构,用dp可能就可以做了。 发布于 2021-04-23 19:29:34

354569187q:有人私信我说, “在跳出局部最优之后甚至可以在此基础之上采用强化学习策略” 这个不明白是什么意思,在此简单回答一下。
强化学习可以简单的理解为 试错 (trail and error) ,就是平时我们拆塔时经常用的SL膜法
强化学习(reinforcement learning) 指的是神经网络在与环境(魔塔)的连续互动中(SL试错)中学习到的最优行为策略的问题,属于机器学习问题。
而魔塔游戏本身就是一个神经网络与魔塔的互动(人脑拆塔),该互动为基于马尔科夫决策过程(Markov decision process),神经网络观测到的是与魔塔互动的数据阵列。因此强化学习的本质就是学习最优的序贯决策过程。
神经网络与魔塔的互动我用一个简单的示意图说明一下。

在每一步t中,神经网络从魔塔中得到一个状态S_t 与一个奖励 R_t ,根据学习策略采取一个动作a_t(如打怪吃宝石)。魔塔根据动作a_t,产生下一步t+1的状态S_(t+1)与奖励R_(t+1)。
而跳出局部最优的目标不是奖励最大化,而是长期积累奖励最大化,以达到学习最优策略的目的。
简单转换塔中强化学习的马尔科夫决策过程可以由<S, A, P, R, D>一个五维空间组成。
S是有限状态(State)空间
A是有限动作(Action)空间
P是传递概率函数(transition probability) P(s'|s,a)=P(s_(t+1)|s_t=s,a_t=a)
R是奖励函数(Reward function) R(s,a)=E(r_(t+1)|s_t=s,a_t=a)
D是平权系数 D∈[0,1]
价值函数由于还没建模,设为U-π(s)=E[r_t,D*r_(t+1),...|s_t=s]
由于魔塔游戏具有马尔可夫性,故给定一个神经网络策略π,神经网络与魔塔的互动行为就已确定。强化学习的目标就是在所有可能策略中选择价值函数较大的策略π*,不断优化已有策略。D表示未来奖励权重发生变化,需做一定的平权处理。 发布于 2021-04-23 19:27:34

l13722968804:这学期刚学的人工智能,对神经网络,遗传算法这些有了一定了解,大佬加油 发布于 2021-04-23 19:20:44

辉钨实况:大佬牛逼只会爆搜的菜鸡前排支持 发布于 2021-04-23 19:14:14

龙神乖:如果训练出的神经网络能适用于某些特殊道具就好了,我还挺想知道像是阻截跳鞋炸弹这类机制在其中是如何被衡量的 发布于 2021-04-23 19:11:14

龙神乖:dd,题主有成果了记得更新 发布于 2021-04-23 19:10:54

多多良小霰:挺好,大佬等你的表演 发布于 2021-04-23 19:10:44

354569187q:最近塔吧里讨论AI拆塔的声音好像又起来一点了,本人从高中开始就想过这个问题,当时想的是决策树剪枝与最优解问题,也做过一些简单的塔去实验,但是跟想象中的完全不一样,跑出来的也基本是垃圾。。。
后来发现,对于简单的单层塔(无镐无破无飞)用神经网络得到最优解的。大一的时候曾采用简单的梯度下降来跑单层塔,失败于神经结构错误,后来转用拓扑神经网络跑出了结果(非max)。
我想,梯度下降适用于监督学习,我的目标是从一个楼梯口跑到另一个楼梯口,可以尝试。但使用梯度下降目标就会快速地让网络参数“躺平”,这样很容易就掉入"局部最优的陷阱中"。
目前考虑使用进化算法来训练神经网络,并应用于简单的转换塔实验。我偏向于先固定出N个网络结构,通过将这N个网络结构交叉匹配,产生子神经网络。在此基础之上调整联结结构,构造出多个同源神经网络,然后进入环境筛选,选择跑分高的前70%,重复实验。
在这个学习中我采用原始网络创造联结网络,再通过联结网络测试生成子网络,虽然这个优化过程会比拓扑神经网络慢很多很多,但绝不是计算机不能实现的,而且能够有效避免局部最优陷阱,在跳出局部最优之后甚至可以在此基础之上采用强化学习策略。
由于本人最近几个月较忙(拟升学+毕业论文+专利论文),只能先挖个坑在这里,等大活忙完之后,我会一边在实验室学习,一边研究魔塔。 发布于 2021-04-23 18:59:34

更多[挖坑]图像识别与神经网络在魔塔游戏中的简单实验相关问题

问题:[挖坑]图像识别与神经网络在魔塔游戏中的简单实验

回答:不行,低压u加集显,神仙来了也没办法,最低画质的话还不如不玩 详情 >

问题:《魔塔》【发布】魂之归宿(第一章)

回答:你们这个设定不够给力啊, 应该标题为:“当安布雷拉遇到英克雷”~~~估计学院和新维加斯都得炸 详情 >

问题:魔塔2012三大难题解法

回答:战争巨鸮,永远的神 详情 >

问题:《魔塔》关于造塔拆塔的意义以及未来

回答:别飞过去发现没有石油 详情 >

问题:《魔塔》胖老鼠工作室一定没有好好玩过TSW

回答:肯定还会降的,现在降的慢主要是他本来的身价太高了,开包没那么容易出,等下次更新80多三分和80多中投,莫兰特就彻底成娱乐卡了,身价不会超过米切尔的。 详情 >