視頻版:https://www.bilibili.com/video/BV15B4y1T7Q7
Mesh和參數化模型
mesh網格模型可以通過頂點,
以及頂點按順序連接形成的面元來建立3D模型,
要生成一個人體的3D mesh,
SMPL是一種常用的參數化方法,
基于23個關節(jié)的人體模型,
輸入和比較少的85個參數,
10(β體型)+72(姿態(tài))+3個參數(相機),
輸出6890個頂點,以及一萬多個面元。

針對手部也有類似的參數化模型比如說Mano,
許多基于深度學習的方法通過學習這些參數來估計姿態(tài),
不過這篇今年六月份的工作沒有使用這些參數,
而是直接估計了關節(jié)點以及mesh模型的431個頂點(人體),
再通過MLP上采樣到原標準的6890個頂點的位置。
METRO掩碼頂點模型
paper:https://arxiv.org/pdf/2012.09760.pdf
github:https://github.com/microsoft/MeshTransformer
該方法相比之前的模型取得了相當大的進步,

Metro的核心思想就是尋找
各個關節(jié)以及頂點之間的依賴關系
這個依賴關系怎么找呢,嗯還是Transformer,
啊我感覺已經說煩了。。。。
不了解的同學建議好好學一學attention,入股不虧。

這里的輸入序列是23個關節(jié)和431個頂點,
位置編碼用的是一個人體mesh模板的3D坐標進行標記。
本來的特征長度是2048維的,加上這個3D坐標就變成了2051維。

損失函數用的都是L1損失,
包括關節(jié)點以及頂點在三維空間的位置損失,
以及關節(jié)點投影到2D的位置損失。
然后通過再通過類似BERT的掩碼語言模型進行訓練,
簡單點理解就是完形填空,
作者稱之為Masked Vertex Modeling 掩碼頂點模型,

如果增加遮掩的頂點數量,表現可以得到提升,
當30%的頂點被遮掉后差不多就飽和了。
