創(chuàng )澤機器人 |
CHUANGZE ROBOT |
計算機視覺(jué)的一大研究熱點(diǎn)是人體姿態(tài)估計,還有很多問(wèn)題急需解決,比如遮擋,交互等等。在的CVPR2020里邊也有很多這方面的工作。本文站長(cháng)主要是想談?wù)劵谏疃葘W(xué)習的實(shí)時(shí)多人姿態(tài)估計。
人體姿態(tài)估計要干嘛?
關(guān)于人類(lèi)活動(dòng)規律的研究,必定是計算機視覺(jué)L域首要關(guān)注的內容。其中,人體姿態(tài)估計便是計算機視覺(jué)L域現有的熱點(diǎn)問(wèn)題,其主要任務(wù)是讓機器自動(dòng)地檢測場(chǎng)景中的人“在哪里”和理解人在“干什么”。
隨著(zhù)信息化時(shí)代的迅速發(fā)展,人類(lèi)每時(shí)每刻都在通過(guò)多種多樣的手段和途徑獲得海量的可視化圖像數據,這使得基于自然場(chǎng)景圖像的人姿態(tài)估計研究在現實(shí)生活中擁有很多潛在的應用價(jià)值。圖1展示了自然場(chǎng)景圖像中人體姿態(tài)估計的研究應用。
Fig.1: 自然場(chǎng)景圖像人體姿態(tài)估計的研究應用
在信息化的時(shí)代,視頻監控正在銀行、超市以及公安機關(guān)等關(guān)乎人民財產(chǎn)、人身安全的重要場(chǎng)所發(fā)揮著(zhù)舉足輕重的角色。面對海量的視頻圖像序列,為了及時(shí)地制止現場(chǎng)事故的進(jìn)一步發(fā)生,工作人員需要長(cháng)時(shí)間且精神G度集中地觀(guān)察視頻監控畫(huà)面并對異常事件作出處理。
除了工作人員很難長(cháng)時(shí)間地保持G度警惕外,長(cháng)期投入大量的人力來(lái)監測小概率發(fā)生的事件也不是單位機構提倡的做法。因此,實(shí)現視頻監控的智能化成為一種互聯(lián)網(wǎng)時(shí)代的必然趨勢。但是,實(shí)現智能視頻監控的前提條件是讓機器自動(dòng)地識別視頻圖像序列中的人體姿態(tài),從而進(jìn)一步分析視頻圖像中人類(lèi)的行為活動(dòng)。
這就涉及到了我們下面所要說(shuō)的人體行為分析了。
人體行為分析又為那般?
人體行為分析理解成為了近幾年研究的熱點(diǎn)之一。在人體行為分析理解的發(fā)展過(guò)程中,研究人員攻克了很多技術(shù)上的難關(guān),并形成了一些經(jīng)典算法,但仍有很多尚未解決的問(wèn)題。從研究的發(fā)展趨勢來(lái)看,人體行為分析的研究正由采用單一特征、單一傳感器向采用多特征、多傳感器的方向發(fā)展。而人體姿態(tài)估計作為人體行為識別的一個(gè)重要特征,是進(jìn)行人體行為分析的基礎,是人體行為分析L域備受關(guān)注的研究方向之一。
人體姿態(tài)估計是指從圖像中檢測人體各部分的位置并計算其方向和尺度信息。人體行為分析是基于多幀圖像的前后關(guān)系進(jìn)行分析理解,而人體姿態(tài)識別是針對單幀靜態(tài)圖像進(jìn)行處理。正確識別出多幀連續的靜態(tài)圖像的姿態(tài)信息,為實(shí)現正確的行為分析理解提供了可能。因此,人體姿態(tài)估計的準確性與實(shí)時(shí)性直接影響人體行為分析的準確性和實(shí)時(shí)性,確保實(shí)時(shí)準確的姿態(tài)識別是進(jìn)行下一步行為分析的基礎。
現在,我們的人體姿態(tài)估計課題的發(fā)展已越來(lái)越貼近實(shí)際,例如在步態(tài)分析、人機交互以及視頻監控等L域,人體姿態(tài)估計均具有廣泛的應用前景。所以呢,研究人體姿態(tài)估計還是蠻有意思的,好玩 !
當前姿態(tài)估計算法有哪些?
目前主流的人體姿態(tài)估計算法可以劃分為傳統方法和基于深度學(xué)習的方法。
基于傳統方法的人體姿態(tài)估計
傳統方法一般是基于圖結構和形變部件模型,設計2D人體部件檢測器,使用圖模型建立各部件的連通性,并結合人體運動(dòng)學(xué)的相關(guān)約束不斷優(yōu)化圖結構模型來(lái)估計人體姿態(tài)。
其缺點(diǎn)是什么?
First,傳統方法雖然擁有較G的時(shí)間效率,但是由于其提取的特征主要是人工設定的HOG和SHIFT特征,無(wú)法充分利用圖像信息,導致算法受制于圖像中的不同外觀(guān)、視角、遮擋和固有的幾何模糊性。同時(shí),由于部件模型的結構單一,當人體姿態(tài)變化較大時(shí),部件模型不能準確地刻畫(huà)和表達這種形變,同一數據存在多個(gè)可行的解,即姿態(tài)估計的結果不,導致傳統方法適用范圍受到很大限制。
Second,另一方面,傳統方法很多是基于深度圖等數字圖像提取姿態(tài)特征的算法,但是由于采集深度圖像需要使用專(zhuān)業(yè)的采集設備,成本較G,所以很難適用于所有的應用場(chǎng)景,而且采集過(guò)程需要同步多個(gè)視角的深度攝像頭以減小遮擋問(wèn)題帶來(lái)的影響,導致人體姿態(tài)數據的獲取過(guò)程復雜困難。因此這種傳統的基于手工提取特征,并利用部件模型建立特征之間聯(lián)系的方法大多數是昂貴和低效的。
基于深度學(xué)習的人體姿態(tài)估計算法
隨著(zhù)大數據時(shí)代的到來(lái),深度學(xué)習在計算機視覺(jué)L域得到了成功的應用。因此,考慮如何將深度學(xué)習用于解決人體姿態(tài)估計問(wèn)題,是人體姿態(tài)估計L域的學(xué)者們繼圖結構模型后所要探索的另一個(gè)重點(diǎn)。早期利用深度學(xué)習估計人體姿態(tài)的方法,都是通過(guò)深度學(xué)習網(wǎng)絡(luò )直接回歸出輸入圖像中關(guān)節點(diǎn)的坐標。
總結
六階段雙分支網(wǎng)絡(luò )結構在關(guān)節點(diǎn)預測精度上略G于現有傳統的的人體姿態(tài)估計算法。本次站長(cháng)采用的算法利用自底向上的思想,首先預測出所有骨點(diǎn)位置,并將骨點(diǎn)連接形成圖結構,通過(guò)圖優(yōu)化實(shí)現多人體姿態(tài)估計。算法運行效率方面,由于網(wǎng)絡(luò )同時(shí)預測出關(guān)節點(diǎn)位置和關(guān)節點(diǎn)之間的空間關(guān)系,為多人姿態(tài)估計算法提供更加稀疏的二分圖,降低二分圖優(yōu)化復雜度而達到了實(shí)時(shí)的效果。
![]() |
機器人招商 Disinfection Robot 機器人公司 機器人應用 智能醫療 物聯(lián)網(wǎng) 機器人排名 機器人企業(yè) 機器人政策 教育機器人 迎賓機器人 機器人開(kāi)發(fā) 獨角獸 消毒機器人品牌 消毒機器人 合理用藥 地圖 |