B2BFSC
这是一篇文章,与百科条目有所不同,请读者注意。 文章涉及较多的个人独创研究与作者个人风格,其他编辑者难以修改,故原貌保留。 本文由 gap 撰写。 |
B2BFSC(背靠背自由式连击,Back-to-Back Free Style Combo)是一种专门侧重 B2B 和 FSC 的 SRS 对战方块玩法。
该玩法由 ZZZTOJ v0.12 通过非专家指导(不人为预设消行权重,只调参数)对局训练总结而得,集混乱攻击、抵消、挖掘为一体。
相较 ZZZTOJ v0.8 采取的 4T2FSC 玩法,B2BFSC 更侧重 B2B 的总次数和 FSC 大连击的频率,往往会有更多的 T1。
有一种说法认为,该玩法是理性程度仅次于 c4w 的 Guideline 对战玩法。
B2BFSC 重 T1 的相关原理
B2BFSC 的 T1 权重比 4T2FSC 高。
相较 T2,T1 与 FSC 的相性更好。
T2 的 APL 差在第二行
从攻击当量的角度来看:T2 的第二行攻 2,如果拆成 T1 延长一次连击,只要能上 4–5 连,这个差值就扳回来了。
亦即,将 T2 成功拆成 T1 + 消一得到 FSC 大连击,攻击效率将会更高。
T1 的砖格需求比 T2 小
|
|
|
|
T2 砖格需求大,它必须补满 2 行,很容易出现某些 T 完全不消行的情况,T 的利用率往往比 T1 玩法更低。
而且,为了凑满最后一手,T2 可能会诱导空域分割(形成双空,妨碍 FSC)、构成不良形状、产生重复需求、妨碍挖掘连击。
|
|
|
|
T1 砖格需求小,能把更多的砖格留给消四和 FSC;
砖格需求小,形状调整也就更灵活,T 块使用率更高,能为 FSC 留出合适的打连方案。
T1 直接 +4/5 更少
每当第一消的 T2 改成 T1,B2BFSC 就少送一次 +4/5 垃圾行,对手可直接反打的消四也就更少,其防御难度将会增加。
如果是算力和持久力充足的 AI 对打,它们还能够承受;
如果是人打 B2BFSC 的 AI,人类一方就困难了:一旦不能跟上 T1 + FSC 系垃圾行的算力需求,虚了下来,离死也就不远了。
人类玩家采用 B2BFSC 玩法的要点
- 放宽心态,不要觉得只消 T1 是自己吃亏
- 能用较少的手数自然完成和通路的 T2 不要去病态 T1,该 T2 还是要 T2
- 多使用地表特征形引导的 T2 及其对应的 T1,少使用悬空 T2 等很容易妨碍 FSC 的手法
- 直觉 T2 会有困难的,弄出 T1 的壳子就不要再算了,把算力投入到 FSC 上面
- 相较 T 的单次攻击当量,更重视 T 的利用率,把打爆发的任务交给 FSC
- 降低散消二三的权重,T1 剩余部分瞄准消四和 FSC
- 特别关注 T2 没补满的部分与 FSC 的联系
训练过程
- 创建 64 个 AI 个体,赋予以下规则信息:
- 胜利/失败条件(追加规则:可使用的总方块数为 1000,如果双方都不死,APM 高的一方胜出)
- SRS 方块运动规则
- B2B、T 槽、T-Spin、连击
- 各消行状态的攻击当量
- 根据游戏规则,赋予 AI 相关的落块评分指标:
- 生存指标(中间四列最高砖格所在的行数,方块堆的总砖格数和总边长,死格,空列宽度,挖掘手数,防御当量)
- 攻击指标(B2B、T槽(如果盖上,生存扣分,攻击补分持平),连击,T/I 距离当前方块的手数,暂存区是否为 T/I,消行的种类)
- 有限展开落块计算:
- 优先计算生存指标,套用额外的算法计算攻击指标(评价序列和场地)
- 将场地中的 n 个可以摆放的位置分别求值计算落块评分,取最高分的位置摆放方块
- 把预览块一路展开,每放一块就多展开一层
- n^7 算不完,只挑拣一部分展开,降低算力需求
- 不向这些 AI 提供其他专家指导(不指明侧重 T2 等任意一种攻击),令这 64 个 AI 在 TOJ 环境下随机两两等速对局
- 每个对局节点打 256 局,用 ELO 评分衡量胜负情况,记下第一名的配置,同时也根据人类经验适当修改,清零重打
- 重打时,AI 用仿生学的方法继续动态调整相关配置,寻找自己最优的方法和全局最优的方法,得到新的第一名配置
- 继续重复前两步,利用胜率驱动训练出胜率高的参数配置
- 观察发现,第一名往往是“沙包”(怎么也打不死,但也不太能打死对方),此时适当在攻击指标上添加人为干预,继续对局
- 结果发现,手调过攻击效率参数的 AI 的 ELO 评分先涨到 1750 后跌到 1300,因为它被干预了之后就不会迭代了,在训练过程中逐渐被淘汰
- 最后,总结胜率高的参数配置的做法和特点:
- 消行时,把计算力选往一边倾斜分配(比如生存(FSC)或 B2B)
- 如果方块放下去不知道能否加大攻击,就偏向生存
- 不消行的方块不计算生存,节约算力
- 在合适的时候,放大生存或攻击,负责混合二者
- 单独拎出空列宽度的权重
- 把 T 槽的计算问题转化为纯粹的特征寻找
- T3 次数几乎总是 0
以上特点合在一起执行,得到的就是 B2BFSC 玩法。
这种玩法的计算细节可能存在非常复杂的部分,但有一点是十分明显的:它会大量地故意 T1 节约砖格,争取扩大 FSC。
B2BFSC 与 4T2FSC 的数据比较
二者总体攻防差距不大,但长期的胜负情况和 APP 情况都是 B2BFSC 更胜一筹(比较时间:2020 年 3 月)。
下表数据选自一个最迟文件配置时间为 2020 年 3 月 15 日的 AI 对局:
ZZZTOJ v0.8_02(4T2FSC) | ZZZTOJ v0.12_0315(B2BFSC) | |
胜 | 0 | 1 |
方块数 | 931 | 908 |
PPS | 2.10 | 2.05 |
APM | 116.3 | 119.7 |
攻击当量 | 861 | 886 |
送出垃圾行 | 597 | 630 |
接受垃圾行 | 366 | 341 |
APL | 1.26 | 1.33 |
APP | 0.924 | 0.975 |
最大连击数 | 11 | 12 |
全清次数 | 0 | 1 |
连击攻击当量 | 241 | 315 |
B2B 次数 | 56 | 65 |
T-mini 次数 | 16 | 23 |
T1 次数 | 12 | 45 |
T2 次数 | 64 | 34 |
T3 次数 | 4 | 0 |
消一次数 | 209 | 211 |
消二次数 | 33 | 53 |
消三次数 | 32 | 15 |
消四次数 | 36 | 42 |
但这并不意味着 B2BFSC 玩法就绝对更强。
此处的 ZZZTOJ v0.8 采用的是早期(2016 年 5 月 16 日)的专家指导,消三和 T 槽的权重偏高,可能会为了保留 T2 的 T 槽而放弃 6–8 连部分的 FSC。
B2BFSC 的 AI 在发展的过程中逐渐自然形成了一种“不是 T 块就不软降”的游戏风格,有得有失,对局结果大体上很好。
4T2FSC 的 AI 属专家指导型玩法,如果 AI 作者能赋予它更强的专家指导方案,它的胜负情况和 APP 情况依然有机会继续改善。