Abstract
Multi-oriented object를 detection하기 간단하지만 효과적인 프레임워크
Oriented object의 네 꼭지점을 직접적으로 예측하는 것이 아닌, horizontal한 박스를 가지고 gliding offset을 예측하여 oriented object의 꼭지점을 예측함
Oriented object와 horizontal한 박스 사이의 면적 비율을 기반으로 obliquity factor를 측정하여 어떤 박스를 선택할지 결정함
Introduction
Proposed Method
Multi-Oriented Object Representation
Network Architecture
Training Objective
Experiments
- Dataset
- DOTA
- A large-scale and challenging dataset for object detection in aerial images with quadrangle annotations
- HRSC2016
- Ship detection in aerial images
- MSRA-TD500
- Detecting long and oriented texts
- RCTW-17
- Detecting long and oriented texts
- MW-18Mar
- Multi-target horizontal pedestrian tracking dataset
- DOTA
Conclusions & Reviews
Multi-oriented object를 detection하기 간단하지만 효과적인 프레임워크
RPN에서 Anchor를 찾을 때 각도를 고려하지 않았기 때문에 다른 기존 2-stage 방법들보다 속도가 빠름
회전된 객체 탐지 다양한 데이터셋에서 당시 SOTA를 찍음으로써, 자신들이 제안하는 (회전된 객체를 바라보는 representation)방법이 회전된 객체를 찾는 일반적인 태스크에 효과적이라는 것을 보여줌
회전된 객체를 바라보는 일반적인 시선을 다른 시선으로 바라본 것이 새로웠음