七、水平框、旋轉框目標檢測標註,支援VOC、DOTA、glVOC等格式

GeoLabel前期版本在製作目標檢測類樣本時偷了個懶,操作方式和資料格式與分割、變化檢測沒什麼區別,也是生成柵格形式標記,再轉成需要的格式,這種格式的問題是目標框不能有重疊,因為柵格無法將同一個畫素標識為兩個類別。

新發布的GeoLabel1。2。7版本(2021年10月30日釋出),對目標檢測類的標註做了重點最佳化,應該比當前市面上見到的工具都要稍微好用一些。

1 總體標註流程

目標檢測

總體標註流程

採用

GeoLabel一貫的標準流程,即“啟動選樣-樣本選點-樣本生成-樣本標註-生成標準格式檔案”,具體參照

本號歷史

博文,此處不詳述。

與以往不同的是,為了支援標註要素有重疊的情況,如機場、車輛等,標註都會有重疊,整體標註模式採用“新建要素”的方式,而不是分割和變化檢測中用到的“切割要素的方式”。(後續根據實際使用情況,考慮分割和變化檢測也採用“新建要素”的方式)

1) 切割要素的方式:即先按照影像範圍生成一個polygon,然後標註均是對這個polygon進行切割,即將這個polygon劃分為好多個polygon,

是全圖標註

。這種方式可以提高標註的規範性,且對全要素分類是最適合的方式,而對於二值分割、變化檢測、目標檢測,不見得是最優的。

七、水平框、旋轉框目標檢測標註,支援VOC、DOTA、glVOC等格式

切割要素方式,全要素標註

2) 新建要素的方式:即在一個空的圖層上進行標註,每畫一個標記都是新建一個獨立的標記要素,

只標註感興趣區域

。這種方式對稀疏的標註、標註要素圖形簡單的情況較為適用,本次更新就是將目標檢測標註從“切割要素”改變為“新建要素”。標註示例如下圖所示:

七、水平框、旋轉框目標檢測標註,支援VOC、DOTA、glVOC等格式

新建要素標註,只標註指定目標

具體流程參照以下影片演示:

影片載入中。。。

2 標註編輯操作

GeoLabel支援水平框、旋轉框、平行四邊形標註,支援要素的平移、縮放和旋轉,基本囊括了四邊形標註涉及的所有操作。

需要注意的是,如果需要標註重疊的目標,需要將“不允許重疊”狀態開關設定為未選中狀態,從而可以支援生成有重疊的要素。

具體看影片演示:

影片載入中。。。

3 對超出影像範圍標記的處理

對於目標檢測拉框,編輯過程中兩個小問題可能會影響標記效率:1)位於影像塊邊緣的要素,如何對準邊緣進行拉框?可能需要放大到一個比較大的比例尺才行。2)對於被切割的目標(如一輛汽車,只有一半在樣本影像塊中),如何進行標註?

對於上述問題,GeoLabel有相應的解決方案。

1) 要素位於影像邊緣的標註

如果要素位於影像邊緣,無需放大影像找到影像的邊緣畫素,只需將框拉出影像範圍,後處理時會自動把多餘的部分切掉。

七、水平框、旋轉框目標檢測標註,支援VOC、DOTA、glVOC等格式

影像邊緣目標標註

2) 目標要素被切割,如何標註

要素被切割主要應該有以下四種形式。

情形1:水平框,超出影像範圍部分,直接切除。

情形2:旋轉框,只有一個點落在影像範圍內,整體拋棄。

情形3:旋轉框,兩個點在影像範圍內,超出影像範圍部分直接切除。

情形4:旋轉框,計算一個最接近於範圍內五邊形的四邊形。

七、水平框、旋轉框目標檢測標註,支援VOC、DOTA、glVOC等格式

目標被切割處理方式

4 生成的標記檔案格式

支援柵格、VOC、DOTA和glVOC格式的輸出。

4.1 VOC格式

儲存在工作空間的VOC目錄下。

1_voc 1024 1024 4 1 檢測目標 0 178。255 164。122 295。558 1 檢測目標 0 425。582 154。228 561。259 1 檢測目標 876。425 237。613 1024 353。504 1 檢測目標 899。065 443。955 1024 622。639 1 檢測目標 598。493 424。169 811。413 637。193 1 檢測目標 376。117 103。35 712。482 274。359 1 檢測目標 720。962 483。527 969。703 684。216 1 檢測目標 34。098 496。247 298。385 722。375 1 檢測目標 88。2952 230。547 296。972 411。112

4.2 DOTA格式

儲存在工作空間的DOTA目錄下。

imagesource:unknowngsd:0。50 178。255 164。122 178。255 164。122 295。558 0 295。558 檢測目標 0 10 425。582 154。228 425。582 154。228 561。259 0 561。259 檢測目標 0 1876。425 237。613 1024 237。613 1024 353。504 876。425 353。504 檢測目標 0 11024 622。639 1024 467。325 938。61 443。955 899。065 588。446 檢測目標 0 1598。493 536。849 699。762 424。169 811。413 524。513 710。144 637。193 檢測目標 0 1540。059 274。359 376。117 240。44 548。539 103。35 712。482 137。269 檢測目標 0 1720。962 483。527 969。703 483。527 969。703 684。216 720。962 684。216 檢測目標 0 134。098 496。247 298。385 496。247 298。385 722。375 34。098 722。375 檢測目標 0 188。2952 368。713 121。723 230。547 296。972 272。946 263。544 411。112 檢測目標 0 1

4.3 glVOC格式

儲存在工作空間的glVOC目錄下,其是

GeoLabel自定義的支援旋轉框的格式,總體結構類似於VOC,直接儲存四個座標點,非常好理解,也很容易轉換成其他格式,並且解析方式與VOC類似。

1_glvoc 1024 1024 4 1 檢測目標 0,178。255 164。122,178。255 164。122,295。558 0,295。558 1 檢測目標 0,425。582 154。228,425。582 154。228,561。259 0,561。259 1 檢測目標 876。425,237。613 1024,237。613 1024,353。504 876。425,353。504 1 檢測目標 1024,622。639 1024,467。325 938。61,443。955 899。065,588。446 1 檢測目標 598。493,536。849 699。762,424。169 811。413,524。513 710。144,637。193 1 檢測目標 540。059,274。359 376。117,240。44 548。539,103。35 712。482,137。269 1 檢測目標 720。962,483。527 969。703,483。527 969。703,684。216 720。962,684。216 1 檢測目標 34。098,496。247 298。385,496。247 298。385,722。375 34。098,722。375 1 檢測目標 88。2952,368。713 121。723,230。547 296。972,272。946 263。544,411。112

4.4 柵格影像格式

柵格標記。

5 其他

在公眾號“智慧的人工”(ID:GeoLabel)中可獲得軟體下載地址、全套影片教程和最新的軟體更新推送。