AI/Object Detection & Pose Estimation
-
3D human pose estimation in video with temporal convolutions and semi-supervised training 논문 리뷰AI/Object Detection & Pose Estimation 2023. 1. 12. 19:13
3D human pose estimation in video with temporal convolutions and semi-supervised training 논문 리뷰 인턴할 때 읽은 논문인데 이제야 올리네요... ^^ Abstract fully convolutional model을 통해 비디오에서의 3D pose를 추정 label이 없는 비디오 데이터를 활용하기 위한 back projection 방법 소개(semi supervised training) unlabel 비디오에 대해 예측된 2D keypoint 부터 시작하여 3D pose를 예측하고 마지막으로 입력된 2D keypoint를 back project한다. 1. Introduction Dilated convolution을 이용한 tempor..
-
Pose Estimation 관련 참고 블로그AI/Object Detection & Pose Estimation 2021. 11. 21. 19:31
Pose Estimation 관련 https://powerofsummary.tistory.com/67?category=848878 https://powerofsummary.tistory.com/70 https://koreapy.tistory.com/149?category=0 https://koreapy.tistory.com/265?category=0 https://koreapy.tistory.com/271?category=0 https://koreapy.tistory.com/281?category=0 https://koreapy.tistory.com/280?category=0 https://blog.naver.com/shino1025/221607197982 https://koreapy.tistory.co..
-
Feature Pyramid Network for Object DetectionAI/Object Detection & Pose Estimation 2021. 9. 9. 20:53
Object Detection 분야에서 Scale-Invariant 문제 매우 중요. - Variants 는 Scale, Shift, Rotation 등... Shift Variant는 Pooling을 통해 해결. Scale Variant는 CNN을 통해 어느 정도 해결 가능하나 Standard Convolution Filter에선 해결 불가. 예전엔 다양한 크기의 물체를 탐지하기 위해 이미지 자체의 크기를 resize하며 물체 detect했지만 이는 메모리 및 시간 측면에서 비효율적. 이를 해결하기 위한 방법이 FPN. 기존의 방식 (a) Featurized Image Pyramid - 각 레벨에서 독립적으로 특징을 추출하여 객체를 탐지 (b) Single Feature Map - Convolution..
-
Mask R-CNN 흐름 정리 (R-CNN, Fast R-CNN, Faster R-CNN)AI/Object Detection & Pose Estimation 2021. 9. 9. 20:44
Computer Vision 분야에는 Image Classification 외에도 Semantic Segmentation, Classification + Localization, Object Detection, Instance Segmentation와 같은 Task들이 있음 1. Semantic Segmentation a. 이미지의 모든 픽셀에 카테고리를 정함 b. 하지만, 픽셀로 카테고리를 정해서 instance를 구별할 수 없음 2. Classification+Localization a. Single Object Detection b. Single object에 대해서 object의 위치를 bounding box로 찾고 (Localization) + 클래스를 분류하는 문제 (Classification..
-
Cascaded Pyramid Network for Multi-person pose estimationAI/Object Detection & Pose Estimation 2021. 9. 9. 16:17
1. introduction object의 정확한 검출에 악영향을 미치는 경우가 많다. ex. keypoint들끼리 겹쳐있다. 다른 object에 가려서 보이지 않는 키포인트가 있다. 이런 한계를 극복하고 분류하기 어려운 hard keypoint를 잘 검출하기 위해 두개의 stage로 이루어진 CPN을 제안한다. Human Detector + GlobalNet + RefineNet Human Detector: 해당 논문에서 사용한 base object detector는 FPN(Feature Pyramid Network)에서 RoI pooling을 Mask R-CNN의 RoI Align으로 바꾼 것 GlobalNet: 간단한 keypoint들은 잘 localize시키지만 뭉쳐있거나 보이지 않는 키포인트들은..
-
Detectron2 이란? Pytorch 기반의 Object Detection, Segmentation 라이브러리!AI/Object Detection & Pose Estimation 2021. 9. 9. 15:12
https://www.youtube.com/watch?v=EVtMT6Ve0sY https://www.youtube.com/watch?v=q9TVt0T2a1M https://lynnshin.tistory.com/57 Detectron2 로 Mask R-CNN 학습하기 1. 아나콘다 가상환경 세팅 $ conda create -n detectron2 python==3.8 -y $ conda activate detectron2 2. PyTorch 설치 https://pytorch.org/get-started/previous-versions/ 에서 CUDA 버전에 맞는 PyTorch 설.. lynnshin.tistory.com https://github.com/facebookresearch/detectron2/b..
-
Feature Pyramid Network (FPN) 정리AI/Object Detection & Pose Estimation 2021. 9. 1. 00:47
[사족: FPN에서 더 발전된 것이 Cascaded Pyramid Network. 참고했던 그 블로그 글 다시 한 번 읽어보자!] Object Detection 분야에서 Scale-Invariant 는 아주 중요한 과제라고 한다. 예전에는 다양한 크기의 물체를 탐지하기 위해 이미지 자체의 크기를 리사이즈 하면서 물체를 찾았다고 한다. 이런 작업은 메모리 및 시간 측면에서 비효율적이기 때문에 Feature Pyramid Network (FPN) 이라는 방법이 등장하게 되었다. 먼저 FPN이 왜 나왔는지 살펴보기 위해 기존의 방법들 부터 천천히 보고자 한다. (a) Featurized Image Pyramid 이 방법은 각 레벨에서 독립적으로 특징을 추출하여 객체를 탐지하는 방법이다. 연산량과 시간 관점에서..