人工智慧研究實現了世界領先的人類視覺識別技術

人工智慧正越來越多地被用於幫助人類運營商處理來自央視和其他安全來源的大量影象。人再識別(Reid)是一種人工智慧能夠識別來自不同攝像機或不同場合的同一個人的影象的方法。這有助於在覆蓋大型公共空間(如地下網路)的閉路電視網路中跟蹤嫌疑人。裡德對機器來說是一個挑戰,因為他們必須在不同的光源、姿勢和外觀變化(如衣服)下考慮和區分同一個人。

人工智慧研究實現了世界領先的人類視覺識別技術

人類視覺識別技術

薩里的視覺、語音和訊號處理中心(CVSSP)的專家們將在今年的韓國首爾計算機視覺國際會議上發表論文,詳細介紹了他們是如何開發出一種獨特的系統,即OSNet,它的效能超過了許多已經在使用的流行識別系統。

CVSSP團隊已經表明,osnet能夠深入挖掘來自各種空間尺度的資訊,以幫助準確地進行重新識別——從t恤上的標識等最小的細節到其他更大的因素,比如嫌疑人穿的外套型別。

令人難以置信的是,OSNet只需要220萬個引數,在深度神經網路模型中只需要一個很小的數目,就能超過許多在使用2400萬引數的流行的Resnet 50基礎設施上建立的競爭對手——這表明OSNet可能成為視覺識別技術的標準。如此小的引數大小意味著模型可以部署在“邊緣”,這意味著繁重的計算提升可以在攝像機本身而不是在遠端資料中心進行,從而節省了將大量影片資料從攝像機傳輸到資料伺服器的頻寬。

CVSSP計算機視覺和機器學習傑出教授陶翔說:“利用OSNet,我們開始開發一種工具,可以克服其他設定所面臨的許多人員重新識別問題,但結果遠遠超出了我們的預期。OSNet所達到的Reid精度顯然超過了人類操作員。

“osnet不僅顯示出它在許多重新識別問題上的表現優於對手,而且我們相信它本身就可以作為一種獨立的視覺識別技術使用。”

CVSSP主任阿德里安·希爾頓(Adrian Hilton)教授表示:“這是向教授和他的團隊在實現世界領先的再識別技術方面取得的一項重大成就。他們在osnet上的工作有可能取得突破性進展,並可能幫助塑造未來幾年的視覺識別領域。這是人工智慧和機器感知的一個很好的例子,它將為社會提供更安全的公共空間提供有利技術。”