【中二脑洞向】基于分治论的游戏内价值量化分析
本帖最后由 1999214bdwlt 于 2014-5-8 18:41 编辑本文允许进行转载,但:必须提到原作者;不得用于盈利性目的;允许修改原作品,但必须使用相同的许可证发布;不得造成未经作者许可的授权。
因包括但不限于百度贴吧、新浪微博、腾讯微博等网站或媒体的用户协议中的相关规定,向那些网站或媒体的转载行为会造成未经作者许可的授权,所以禁止向包括但不限于上述网站或媒体进行转载。
文章语法:
1.“()”内的内容为表示方法、补充或简称及含义。
2.“{}”内的内容为示例。
3.英文名称只有两个用途,一是可以少打字,二是装13,所以你们就不要纠结于我的英语到底是体育老师教的还是美术老师教的了。
基础定义:
按照目的对卡进行的分类称为属性(property,简称pr)。
卡可以只具有一个属性,也可以具有多个属性,且二者必具其一。
现实当中,绝大多数情况,卡具有多个属性。
各个属性是有序的。
在一个状态下,不存在选择空间的卡称为单属性卡,某一属性的单属性卡表示为单某属性(single,简称s-)。否则称为复属性卡,某几属性的复属性卡表示为复某属性 某属性 某属性(diverse,简称d-)。
特殊的,任何场合,副属性卡中不存在no的可能,sno和no两个集合相等。
分类:
0:没有使用途径的卡(nothing,简称no){我方没有任何其他卡时,手牌中的一张狮子男巫}
1:能通过某一种或几种途径带来胜利的卡(porpuse,简称po){火星}
2:能阻止对方在你之前胜利的卡(break,简称br){咆哮}
3:能阻止对方的br的卡(anti-break,简称ab){夜摄}
4:能阻止对方ab的卡(anti-anti-break,简称aa){反大愅掵}
以此类推,可以继续无限叠加,简称为依次的数量的“a”
基础量化理论:
游戏王的游戏方式是:根据双方的卡组构成,在可预期和不可预期的时点生成随机数,玩家能够通过生成的随机数以及基于大环境的Nash均衡而对对方的卡组构成进行预判,而进行的博弈。
所以,下文中提到的“基于概率加权”需要根据我方卡组构成,预期的对方卡组构成,游戏中的公开信息,基于各个情况出现的概率进行加权, 以下内容称作BSIV
no的价值的定义:不存在。
spo的价值的定义:一个固定的场合,通过我方已知的信息,基于概率加权的平均值,把从现在到胜利记为1,这些spo预期能为我方带来多少比例的胜利(单位为每次,数字部分记作其倒数(能带来a/b次胜利,记做b/a每次,简称b/a per,最大为1 per))。
{发动倒计时后,对方没有后场,没有其他信息,一张在第一个对方回合的场上的咆哮的价值为稍小于10每次,第三个对方回合则为稍小于7每次}
sbr的价值的定义:一个固定的场合,通过我方已知的信息,基于概率加权的平均值,预期能因我方sbr的阻止而被阻止的对方spo,而预期能因我方存活时间增长,从而预期能使我方得到的spo,把从现在到胜利记为1,这些spo预期能为我方带来多少比例的胜利(单位为每次,数字部分记作其倒数(能带来a/b次胜利,记做b/a每次,简称b/a per,最大为1 per))。
{我方只有一张咆哮,卡组第一张为水泡。后两张为黑洞和火星。对方只有场上一只狮子男巫。双方都只有100lp。狮子男巫攻击时,咆哮的价值就是1每次。}
sab的价值的定义:一个固定的场合,通过我方已知的信息,基于概率加权的平均值,预期能因我方sab的阻止而被阻止的对方的sbr,那些sbr预期能阻止的我方的spo,把从现在到胜利记为1,这些spo预期能为我方带来多少比例的胜利(单位为每次,数字部分记作其倒数(能带来a/b次胜利,记做b/a每次,简称b/a per,最大为1 per))。
{难以叙述情况,不进行场景举例,最相关的常见情况主要以夜摄,旋风,大风暴为关键词}
saa的价值的定义:一个固定的场合,通过我方已知的信息,基于概率加权的平均值,预期能因我方saa的阻止而被阻止的对方的sab,这些sab预期能阻止的我方的sbr,这些sbr预期能阻止的对方的spo,因这些spo的broken而预期能因我方存活时间增长,而预期能使我方得到的spo,把从现在到胜利记为1,这些spo预期能为我方带来多少比例的胜利(单位为每次,数字部分记作其倒数(能带来a/b次胜利,记做b/a每次,简称b/a per,最大为1 per))。
{难以进行叙述,不进行场景举例,最相关的常见情况主要以反大愅掵,星光大道,侵略的泛发感染为关键词}
========BSIV到此为止========
BSIV的局限性:
1,未考虑复属性卡,所以可以说是与现实无关的
2,未考虑cost(因为cost实际上涉及被cost的卡的价值变化)
3,没有给出概率加权的公式,并且在可预期的未来内,作者都是没有给出一个公式的能力的。
进一步的分析:
显然,随着s的anti前缀的增多,价值中的“预期”二字的数量增多了,也就是说,随着我方一层层的s的预期的阻碍,我方的阻碍的稳定性在下降,所以,只考虑s的情况下,BSIV在宏观上存在Nash均衡点,既一个理性人不会进行没有限度的anti,在实际生活中这个理论也是显而易见的,可以看看扩展阅读来体会。
通过价值的定义,我们能得到这样一个结论:在倒计时卡组中,在对方胜利之前,按回合计数,咆哮发动时你的血越少越好,因为这时它会有更大的价值被发挥。
这只是一个基础理论,在现实情况中,是否也这样呢?
答案大家都不想看到:It depends。(我就是爱装13你打我呀~~)
还是以倒计时的为例,有一个妹子这样问我:“对方一个小新打过来了,我发不发埋伏的咆哮? ”
按照BSIV,是应该不发的。
“如果我也知道这一点,故意m2一个夜摄,你不就亏了吗? ”
哪里错了?
1.她手中有夜摄不是已知的信息,只能基于大环境的Nash均衡(与上文的Nash均衡点不是相同的内容,但它们都是Nash均衡,这个Nash均衡在“场外价值”中会说到,现在还没有写)来判断她手中有夜摄的概率,经概率加权后,若不发动咆哮更有价值,你不发动就是对的。
2.咆哮的属性发生了变化,此时BSIV不再适用。它由以br为主变成了以aa为主,因为咆哮相当于是为了你的别的卡挡了一刀。
3.其实到底亏没亏还是需要计算的,在咆哮被破坏后,可以根据你的卡组的构成进行计算,看看咆哮的挡刀能否为你带来更大的收益。
4.没有妹子会这样陪我玩。
理论的扩展:
我们将副属性卡拆分为以下两种类型:
1.A或B{我方场上有召唤僧时手牌的一张火球}
2.A和B{幽闭(既防止了对方的伤害,又能使我方预期造成更多伤害)}
我们称1为A与B相或(OR,简称or),2为A与B相共(AND,简称ad)
我们称一种类型α包含一种情况A为α引用A{cite,简称-c-},每次进行引用时需要给它一个概率。
两种类型可以c s,也可以互相c。
or的价值的定义:那些情况的价值的最大值。
ad的价值的定义:那些情况的价值之和。
这时,我们注意到,这个理论明显是有缺陷的,举个例子: 当我方手上有两张超融合,对方场上两张小新,我方ex一张闪光侠时,我方手牌中的卡的价值显然是被高估的。
换个角度来看,手牌中的两张超融合也可以视为or的一体。
这样,我们进一步完善了这个理论,但最终得出的这个理论是极为冗杂的,而且可能让人认为是投机取巧。
理论的进一步扩展:
游戏内价值完成版0.1:
在整个游戏区域内,通过已知的确定信息、已知概率的信息,将你现在所能进行的操作及你预期能够进行的操作通过or、ad进行表述。然后,将最后的引用结果(均为一个个单属性)的价值通过单属性的价值计算方法计算出来。然后,通过副属性的价值计算方法就可以计算出整个游戏区域内你的价值。 好复杂……要看两三遍才懂 好长先马后看 本帖最后由 1999214bdwlt 于 2014-2-3 12:05 编辑
扩展阅读(转自顾森的blog):
一道智力题:世上最毒的毒Yao
转载请注明出自matrix67 .com
一道智力题:世上 最毒的毒Yao
CC版权协议
故事发生在一个遥远的神秘世界。在那里,人们可以制造出不同等级的毒Yao。这种毒Yao是致命的,唯一的解Yao则是更强的毒Yao。若不幸中毒后,只要及时喝下更强的毒Yao就没事了,否则不管是谁都会在10分钟之内死亡。 一天,恶魔向国王发起挑战,看谁拥有 最毒的毒Yao 。这是一场死亡竞赛,比赛规则很简单:双方各带一瓶毒Yao,先把对方瓶中的毒Yao喝掉一半,然后再把毒Yao换回来,把自己的毒Yao喝完。10分钟后,活下来的人便赢得这次比赛。恶魔藏有世上已知的 最毒的毒Yao 。国王知道,他无论如何也造不出比那更强的毒Yao来,并且也知道比赛时恶魔用的就是他那瓶绝无仅有的毒Yao。国王有办法赢得比赛吗?
答案: 国王有办法赢得比赛。在比赛开始前,国王先制造一个Yao性很弱的毒Yao,把它喝掉,然后拿着一瓶白开水去比赛。比赛时,国王喝掉恶魔手中的牛B毒Yao,反而没事了;恶魔喝的则是白开水。然后,国王喝掉自己的白开水,恶魔喝掉自己的牛B毒Yao;结果呢,即使他还想找解Yao都找不着了……因为他那瓶毒Yao已经是世上最牛B的了。 不知道这个题目火星了没,反正今天我还是头一次见到。
故事并没有结束。我还多想了一些其它的。如果恶魔在国王身边安插了间谍,知道了国王的伎俩,事情就又开始变得有意思起来了。恶魔是可以破解这个伎俩的。一个简单的办法是,在上战场前他也喝点弱毒Yao。这样下来,两个人最终都能活下来,谁也弄不死谁。恶魔还有一个更绝的办法:赛前什么都不喝,比赛时也带着一瓶白开水上去,于是双方在比赛过程中都喝不到半点毒Yao,国王将被他比赛前喝掉的那点毒Yao害死。 呵呵,你猜对了!我接下来确实想说:如果恶魔的“反欺诈”计划又被国王知道了呢?国王有没有一种“反反欺诈”呢?在这种局势下,我们不妨认为,这一折腾下来国王成功地骗恶魔两手空空上战场,于是他赛前喝点弱毒Yao,再带个稍微强点的去就能击垮恶魔了,成功地实现三重圈套。当然,当恶魔意识到这一点后,他又会重新带着无敌毒Yao上战场,整个局势转了一个大圈又回来了。 结论呢就是,这个博弈问题没有Nash均衡点。即使游戏双方都聪明绝顶也无用,递归思维深入到的层数唯一地决定了最终决策,整个游戏就像石头剪子布一样无限循环下去,最后倒还不如随机选择一种决策了事。
……………没脸见人的分割线……………
刚发现标题打错字了。。。应该是分治,不是分制。。。 太长没看点赞右上角拜拜楼主 太长英语简称真烦不如打中文吧楼主你好楼主再见 感觉后半段的分析是不完全信息分时重复博弈,如果是是这样不如直接建立决策树和联合方程求对应解会不会更好一点……不过感觉结果应该会跟国际象棋的博弈分析相仿吧…… 楼主计算机背景出身吧 文章code味算法味重 不失为好的理论帖 但不是想打击积极性的说一句 nw论坛未必每个人都有耐性看完 毒Yao的故事好评。正文没看懂,但是看样子很厉害。 不明觉厉。。。这到底是呃orz 只能看懂nash博弈论那一点点部分。。楼主太吊 额 我觉得K社一个表 一张高价值新卡 就可以把LZ以前推算的东西全部推翻 本帖最后由 jinwenkan2 于 2014-2-3 11:22 编辑
实战完全不能这么分析的。每张牌的价值需要根据现场的状况来进行衡量。比如你场上一波有抗性的大怪,例如征龙,此时你最佳的剩余手牌显然是坑。
当对手铺完场子,而你又解场不能的时候,召唤坑就成了废牌。
每张卡的价值在先后攻的时候都不同。例如水精鳞海皇在龙骑限制的情况下,重装狙击t1上手的价值就有限。
再如光道,太阳交换的强度和你卡组墓地利用价值的比例有关,卡手度和你光道数量有关,但是光道数量和墓地数量和你手牌强度成反比,之所以光道挂征龙就是因为征龙是上手和在墓地强度相差无几的卡片。
当回合卡片利用率决定卡组的强度,卡片的利用率=卡组检索+combo强度+续航+对方回合抗性。从这点来说征龙2.1前上位第一毫无争议。
combo强度=伤害总值+解场能力,当然根据现有情况,你一堆怪总伤害再高,解不了一个神龙骑士=没有。现有combo强度建立在成功出现一个2800攻击力以上的怪物,很多卡组的短板。包括未来的甜点爆发也是如上,出学姐不能出剑王,出剑王不能出学姐。combo赚再多的卡都对对手没有威胁,又依赖通招。
再复杂点,每张卡的强度和所处的卡表环境有关。如果孤火花开3,高星植物简直就是外挂,但是孤火花限制,不能特招=废卡。
雷王在多检索,低攻combo的废2环境,神卡,在直接不需要检索高攻下级或者效果发动型高星特招环境就是废卡。
总之不能简单的评价一张卡的价值。 shengdianqishi 发表于 2014-2-3 03:34 static/image/common/back.gif
感觉后半段的分析是不完全信息分时重复博弈,如果是是这样不如直接建立决策树和联合方程求对应解会不会更好 ...
非常感谢,只是偶然性极强的双方不完全信息博弈很难建立决策树,至少我还没有想出一个足够美观的方法 287441131 发表于 2014-2-3 10:16 static/image/common/back.gif
额 我觉得K社一个表 一张高价值新卡 就可以把LZ以前推算的东西全部推翻
再推一遍就行了 英文简写好难记……除此之外都很好 http://wenku.baidu.com/view/65aab011964bcf84b9d57bf5.html
这篇写的是万智玩家眼里的多层次思考,虽然我不玩万智= =但是这篇文章的内容和那个毒Yao的故事很像。如果LZ愿意在多层次思维往深度里写,这篇文章想必可以做些参考 作为工科在读本科生表示完全看不懂
看到nash均衡的时候已经跪了……默默右上角 1999214bdwlt 发表于 2014-2-2 23:20 static/image/common/back.gif
扩展阅读(转自顾森的blog):
一道智力题:世上最毒的毒Yao
转载请注明出自matrix67 .com
那个反欺诈与反反欺诈就是著名的射门博弈吧
页:
[1]
2