Blog Page 1

⚓{0x01} 关于PFNN一些看法

背景在角色动画领域中，骨骼的动画是最重要的一种动画，一般称之为motion。受动物运动的启发，人们将角色动画简化为两步，骨骼的姿势变化(骨骼动画)，以及皮肤受到骨骼的变化而变化(蒙皮)。本文所介绍的这篇文章则是研究如何利用深度学习来生成和控制骨骼动画。生成的骨骼动画的好坏可以由下面几点来评判：动画是否连续动画是否自然第一个点是最基础的，它限定骨骼的姿势变化不能太大，比如角色正在跑步，下一帧的骨骼姿势不应该突然变成非跑步姿势（比如站立）。那么这一点就可以基本上决定了这类生成模型大体都是自回归模型，那么就需要考虑误差累积的问题，减少误差累积有很多方法，有些方法还是场景特点的，在这就不一一介绍。第二个点就比较主观，好在我们在使用深度学习研究时，一般是有数据集的，而数据集大都采自真实世界，我们可以设计一些距离函数来评判生成的动画是否和ground truth足够接近，从而来评判生成的动画是否自然。此外为了加入控制，我们会在自回归的途中对输入进行一定的修改，以达到控制生成的动画。因此大致的流程可以由下图表示在我们所讲的这篇文章中，有两个主要的工作：为动作捕捉数据生成虚拟的地形，这是由于动作捕捉设备只捕捉人体mark点的空间运动，并不会扫描动捕场景的地形，因此需要为虚拟场景生成与动捕数据对应的地形。提出所谓的Phase-Functioned Neural Network，即PFNN来生成自然的locomotion。前者工作属于数据增强的方法，其大致思路是：根据现有的虚拟场景高度图，切割出大量地块，然后将这些地块去fit每个locomotion，选出最匹配的地块，之后再微调这些地块的高度，让其更匹配locomotion。这个方法比较暴力，论文中介绍了三种误差来表示地块和locomotion的匹配程度，这里不再赘述。 PFNN 上图就是PFNN的模型示意图，分成两个部分：生成网络，即左侧的MLP，用于动态调整MLP参数的一个模块——Phase Function。现在我们先来看左半边的网络，即 motion 的生成网络。它的结构比较简单，由三层全连接层组成，隐藏层的输出由 ELU 激活。在讨论网络的输入输出之前，我们先整理一下需求是什么：生成下一帧的 Pose，即关节点的位置，能够有一定的控制，即控制角色的运动方向、运动速度、以及运动的形态（gait），能够适应具有地形的场景，而不是一个平地场景。现在我们可以开始说明输入输出的具体设计网络输入对于第帧的motion生成，输入如下在平面上的路径信息，我们一般通过这几个量来控制角色的运动。这些量也是定义于根节点空间 , 路径位置 , 路径方向 , 步态(gait), 包括走路、慢跑、奔跑、蹲伏走、跳跃。one hot 编码。

2025年5月1日

Blog

Blog

基于tuple的SoA容器实现

⚓{0x08}DeepPhase. 关于Phase的编码器

⚓{0x02} MANN导读

⚓{0x00} 工欲善其事，必先利其器

⚓{0x01} 关于PFNN一些看法