Realtime and Robust Hand Tracking from Depth總結(jié)

文章鏈接

摘要

? 本文設(shè)計一個基于深度攝像頭的手勢追蹤系統(tǒng):滿足實時追蹤(CPU 25fps)、高準(zhǔn)確性(<10mm)。提出了幾個新穎的技術(shù):

  1. 使用一系列球體對手部建模,并定義了一個簡單快速且十分有效的損失函數(shù),這對于實時性能至關(guān)重要;
  2. 基于迭代最近點算法(ICP)和粒子群算法(PSO),提出一個混合方法能夠更快的收斂且具有更好的準(zhǔn)確率;
  3. 提出一個新的手指檢測方法用于手勢初始化。

關(guān)鍵

  1. 手部模型
  • 使用48個球,每個手指6個,手掌16個。每個球體有各自的半徑和球心坐標(biāo),其中半徑固定,球心坐標(biāo)即預(yù)測目標(biāo)
  • 考慮到動力學(xué),關(guān)節(jié)之間的角度有一個約束范圍
  1. 損失函數(shù)

    1. 對點云P隨機(jī)下采樣256個點,得到sub(P)

      x(p)為距離p點最近的球,c為其球心坐標(biāo),r為其半徑。
      該項損失約束點盡可能在球面上

    2. c為球心坐標(biāo), j(c)為將球心坐標(biāo)投影到深度圖后的索引,D(j(c))即球心在投影深度圖的深度值。


      ?光心與世界坐標(biāo)系原點重合,光軸為z_c,則深度即點在z軸的坐標(biāo)值。

      所以,c_z為預(yù)測得到的球心的深度,而D(j(c))為根據(jù)球心投影索引j(c)=(u,v)在輸入的深度圖上的深度值。Max(0, D(j(c))-c_z)該項約束球的深度, j(c)索引值超過深度圖,則計算二者距離作為約束

    3. 該項約束兩個球不重合

  2. ICO-PSO局部優(yōu)化

    1. ICP

      尋找一個旋轉(zhuǎn)矩陣R和平移矢量t,使得兩個點云對齊。

      初始化R和t,對A做變換,RA+t 對變換后的A中的每個點,找到B中與該點最近的點計算L_2距離,即

      基于四元數(shù)/SVD求解上式最小值的R和t

      不足

      參數(shù)搜索空間大,容易陷入局部最優(yōu),嚴(yán)重依賴初始化

    2. PSO

      根據(jù)局部信息和全局信息尋找最優(yōu)點

    不足

    搜索空間大,容易過早收斂(估計錯誤全局最優(yōu)值)

    1. ICP-PSO


總結(jié)

? 這篇文章通過Intel的Gesture Camera獲得深度圖像,然后將其轉(zhuǎn)化3D Point cloud。引入Cost Function。 然后檢測手指的位置(使用了2D+ 1D的表示方法),通過檢測到的手指的位置給手勢的初始化形成約束,由此通過ICP-PSO的算法來優(yōu)化Cost Function方程得到最優(yōu)解作為最終的手勢的結(jié)果,與自己定義的48球模型進(jìn)行實時的匹配。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容