METRO 掩碼頂點模型人體Mesh重建 2021-07-02

視頻版:https://www.bilibili.com/video/BV15B4y1T7Q7

Mesh和參數化模型

mesh網格模型可以通過頂點,
以及頂點按順序連接形成的面元來建立3D模型,
要生成一個人體的3D mesh,
SMPL是一種常用的參數化方法,
基于23個關節(jié)的人體模型,
輸入和比較少的85個參數,
10(β體型)+72(姿態(tài))+3個參數(相機),
輸出6890個頂點,以及一萬多個面元。


SMPL關節(jié)關鍵點回歸

針對手部也有類似的參數化模型比如說Mano,
許多基于深度學習的方法通過學習這些參數來估計姿態(tài),
不過這篇今年六月份的工作沒有使用這些參數,
而是直接估計了關節(jié)點以及mesh模型的431個頂點(人體),
再通過MLP上采樣到原標準的6890個頂點的位置。

METRO掩碼頂點模型

paper:https://arxiv.org/pdf/2012.09760.pdf
github:https://github.com/microsoft/MeshTransformer

該方法相比之前的模型取得了相當大的進步,


對比實驗Mean Per Vertex Error 和 Mean Per Joint Position Error

Metro的核心思想就是尋找
各個關節(jié)以及頂點之間的依賴關系
這個依賴關系怎么找呢,嗯還是Transformer,
啊我感覺已經說煩了。。。。
不了解的同學建議好好學一學attention,入股不虧。


METRO模型結構,Transformer來自NLP領域的論文Attention is all you need

這里的輸入序列是23個關節(jié)和431個頂點,
位置編碼用的是一個人體mesh模板的3D坐標進行標記。
本來的特征長度是2048維的,加上這個3D坐標就變成了2051維。


學習到的關節(jié)和頂點之間的依賴程度

損失函數用的都是L1損失,
包括關節(jié)點以及頂點在三維空間的位置損失,
以及關節(jié)點投影到2D的位置損失。

然后通過再通過類似BERT的掩碼語言模型進行訓練,
簡單點理解就是完形填空,
作者稱之為Masked Vertex Modeling 掩碼頂點模型,


通過實驗驗證,MVM的效果明顯

如果增加遮掩的頂點數量,表現可以得到提升,
當30%的頂點被遮掉后差不多就飽和了。

不同主干網絡的Mean Per Joint Position Error
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容