軟件所發布最大零售場景目標檢測計數聯合任務數據集——Locount
文章來源: | 發布時間:2020-12-18 | 【打印】 【關閉】
在日常購物時,我們不妨暢想一下未來商超的購物場景:無需結算臺,消費者取下產品的同時,商品識別算法就可以完成自動結算;無需貨架管理員,智能貨架管理技術可以實時動態監測商品數量變化,并自動完成數據分析。實現這種智能化消費方式的核心難點在于解決目標檢測計數聯合任務領域中的遮擋問題。
近日,中國科學院軟件研究所智能軟件研究中心發布了目前為止最大的零售場景目標檢測計數聯合任務數據集——Locount,該數據集經過團隊近2年的廣泛收集及測試研究,共包含190多萬個商品實例標注信息,涵蓋了140種商品類別。其中每個標注框包含了同類商品實例及其數量,與目前已有商品類型數據集相比,具有明顯優勢。
Locount數據集填補了真實生活場景中檢測和計數聯合任務問題的空白,并定義了新的檢測計數任務及新的評價指標,為解決目標檢測領域嚴重遮擋問題提供了重要基礎,該任務的解決在日常生活場景中具有廣闊的應用價值,將帶來智能貨架管理,無人自助結算等智能化消費方式的變革。
該研究發現,現在的目標檢測任務通常使用一個矩形框來預測單個目標的位置,因為傳統目標檢測數據集的遮擋比例較少,尤其缺少多個目標之間嚴重遮擋的情況(例如多個目標重疊比例超過90%)。但在零售場中卻普遍存在這種情況,商超貨架內的商品通常在上下和前后兩個方向上有所重疊。如圖1(c)所示,傳統的表示方法無法適用于商品零售場景,因為同一類別商品重疊擺放會存在嚴重遮擋的現象,在實際使用中也無須精確定位每一個實例目標。
因此,該團隊提出了一種同時進行對象定位和計數的新任務。具體來說,如圖1(d)所示,如果多個目標是相互嚴重遮擋且屬于同一個類別,新的任務為預測出該目標簇中所有目標框合并的最小包圍框及對應的實例數量。
此外,為了評估不同算法在該任務上的性能,團隊還設計了一種新的評價標準,以反映算法出現目標丟失、對同一實例的重復檢測、錯誤檢測、錯誤計數等情況。
當前傳統方法和常見的深度學習網絡還無法很好地解決Locount提出的新挑戰。為了能更好地研究復雜和密集場景下,尤其是目標高度重疊時的檢測和計數問題,團隊希望更多科研人員能夠借助Locount數據集,探索出更準確、高效的任務解決思路和方法。同時,這一數據集也可以為現實場景中長尾分布、少樣本學習等多個潛在的研究方向提供基礎支持。
該研究是基于復雜場景的多商品檢測任務
圖1 (a)傳統目標計數和(b)目標檢測;(c)傳統的檢測標注應用到Locount數據集的呈現形式;(d)我們提出的檢測標注方式在Locount數據集上的呈現方式
圖2 Locount數據集中的商品分類
論文下載地址:
https://isrc.iscas.ac.cn/gitlab/research/locount-dataset/-/blob/master/AAAI2021_CLCNet.pdf
數據集下載地址及密碼:
https://pan.baidu.com/s/13JJAHz2VXD0KewdcemfsXQ#list/path=%2F fyze