Projective Geometry
Projective Geometry 우리는 3차원 공간에 살고 있지만, 이미지가 표현하는 것은 2D 위치정보 뿐이다. 우리의 시각 지능은 2차원의 이미지를 3차원 위치 정보로 변환하여 세계를 인식한다. 우리 세계는 Euclid 공간이지만, 2D 이미지에 투영될 때는 Euclid 공간의 특성을 보존하지 않는다. 위 사진을 살펴보면, 만...
Projective Geometry 우리는 3차원 공간에 살고 있지만, 이미지가 표현하는 것은 2D 위치정보 뿐이다. 우리의 시각 지능은 2차원의 이미지를 3차원 위치 정보로 변환하여 세계를 인식한다. 우리 세계는 Euclid 공간이지만, 2D 이미지에 투영될 때는 Euclid 공간의 특성을 보존하지 않는다. 위 사진을 살펴보면, 만...
Optical Flow Optical Flow는 연속된 이미지 시퀀스에서 물체의 움직임을 추정하는 방법이다. 이때 Optical Flow는 Motion Field와는 전혀 다른 개념이다. Motion Field는 물체의 움직임을 나타내는 벡터 필드로, 물체의 속도와 방향을 나타낸다. 반면 Optical Flow는 빛의 흐름을 나타내는 벡터 필드로, ...
Segmentation Segmentation은 이미지에서 서로 다른 객체를 구분하는 작업을 의미한다. 이때, 단순한 Object Detection과 달리 Segmentation은 이미지의 각 픽셀에 대해 객체의 레이블을 할당하는 작업이다. 즉, Segmentation은 이미지의 각 픽셀에 대해 해당 픽셀이 어떤 객체에 속하는지를 판단하는 작업이다....
PCA 어떤 고차원의 정보를 저차원으로 압축할 때, 가장 정보를 잘 보존하는 방법은 무엇일까? 2차원 정보 1차원으로 압축 위 그림은 2차원 데이터를 각각 x축과 y축으로 압축한 것이다. 하지만, 이와 같은 압축이 최적이라고 말하긴 어렵다. 압축했을때의 정보 손실, 즉 각 축에서 데이터포인트까지의 거리를 최소화할 때, 원래 데...
Face Detection Face Detection은 이미지에서 얼굴을 찾는 문제이다. 이 문제는 같은 얼굴을 찾는 Face Recognition 문제와는 다르다. Face Detection을 위해서 HOG와 같은 방법을 사용한다면, 정확한 얼굴을 찾을 수 있더라도, 모든 sliding window에 대해 HOG를 계산해야하기 때문에 계산량이 많고...
Object Recognition 문제는 주어진 이미지가 어떤 Class에 속하는지를 찾는 Classification 문제이다. Classification 문제를 풀기 위해서 Classifier 모델을 이용해야하는데, 다양한 Classifier 모델을 사용할 수 있다. Nearest Neighbor Classifier Nearest Neighbor ...
Canny Edge Detector, SIFT, HOG 등과 같은 다양한 방법을 통해 이미지에서 Edge를 찾을 수 있다. 하지만, Edge를 찾는 것만으로는 원하는 문제를 해결하기 어려운 경우가 있다. 예를 들어, 자율주행 자동차를 설계하기 위해 도로의 경계선을 찾는 경우를 생각해보자. 단순히 Edge를 찾는 것만으로는 계속해서 이어지고 변화하는 ...
이미지에서 어떤 Object의 위치를 찾을 때, 정확히 위치를 찾기 위해서는 Corner를 찾는 것이 중요하다. Flat, Edge, Corner 각각 flat, edge, corner에서 위치변화에 따른 window 내용의 변화(이미지 출처: vincmazet.github.io/bip/detection/corners.html) ...
Correspondence Search 문제는 서로 다른 두 이미지에서 같은 포인트를 찾는 문제이다. 예를 들어, 아래 그림과 같이 왼쪽 이미지와 그를 회전시키고 크기를 조정한 오른쪽 이미지에서 같은 포인트를 찾는 경우를 생각해보자. 왼쪽 이미지와 오른쪽 이미지에서 같은 포인트를 찾는 경우 이와 같은 문제를 해결하기 위해서는 다...
Object detection 문제에서, 어떤 사진에서 특정 템플릿과 유사한 물체를 찾기 위해서는 단순히 템플릿과 해당 사진의 일부를 비교하는 것만으로는 부족하다. 찾고자하는 물체가 사진 안에서 회전하거나, 크기가 변하거나, 조명이 달라지는 등 다양한 변화를 겪을 수 있기 때문이다. 사람 사진과 차 사진간의 유사도와 두 사람 사진...