摘要
- 首次實現(xiàn)依靠單RGB預測3D手勢
- 提出一個人工合成的數(shù)據(jù)集
- 使用深度網(wǎng)絡學習先驗知識,有效處理手勢模糊和遮擋問題
介紹
-
手勢相對于姿態(tài)估計難點:
- 圖片手勢位置相較于整體姿態(tài)更加模糊
- 由于手指具有高靈活性、多樣性,存在嚴重的自-遮擋現(xiàn)象
- 關(guān)于手勢的數(shù)據(jù)集少
-
論文網(wǎng)絡結(jié)構(gòu):
- 語義分割-裁剪手部位置圖像
- 特征點檢測-2D
- 3D手勢識別
關(guān)鍵
-
固定視角
定義Canonical 坐標wc 。對于一個關(guān)節(jié)3D坐標w,使用旋轉(zhuǎn)矩陣R將掌心位置坐標旋轉(zhuǎn)到XoY平面上(使
),旋轉(zhuǎn)后關(guān)節(jié)點坐標為wR 。
-
網(wǎng)絡預測
不預測3D世界坐標,網(wǎng)絡預測輸出wR和旋轉(zhuǎn)矩陣R,再做逆變換得到wc
