Document Classification and Clustering
Document Classification Classification 주어진 item이 어떤 카테고리에 속하는지 예측하는 작업. 지도학습(Supervised Learning): 정답 레이블이 있는 학습 데이터로 학습 예시: Naive Bayes, SVM Information Retrieval에서...
Document Classification Classification 주어진 item이 어떤 카테고리에 속하는지 예측하는 작업. 지도학습(Supervised Learning): 정답 레이블이 있는 학습 데이터로 학습 예시: Naive Bayes, SVM Information Retrieval에서...
Information Retrieval(IR) Models Information Retrieval(IR) 모델은 정보 검색 시스템에서 문서와 쿼리 간의 관련성을 평가하고, 검색 결과를 랭킹하는 데 사용되는 다양한 방법론을 의미한다. Relevance 문서와 쿼리 간의 관련성 정의는 사람마다 다를 수 있다. 따라서 검색 시스템을 수리적으로 ...
Text Processing Text Processing는 정보 검색 시스템에서 텍스트 데이터를 처리하고 분석하는 기술. Web Crawling 웹 크롤링(Web Crawling)은 웹 페이지를 자동으로 탐색하고 데이터를 수집하는 과정. WWW Process 브라우저는 웹 페이지(문서)를 요청 DNS 서버는 도메인 ...
Information Retrieval(IR) Information Retrieval(IR, 정보 검색)은 대량의 비구조화된 데이터에서 사용자가 원하는 정보를 찾는 기술. 정보의 구조화, 분석, 저장, 검색과 관련된 학문이다. 주로 텍스트 데이터에 적용되지만, 이미지, 오디오, 비디오 등 다양한 형태의 데이터에도 적용 가능하다. Document 문...
Recommender Systems 추천 시스템(Recommender Systems)은 데이터를 기반으로 사용자에게 개인화된 추천을 제공하는 시스템이다. Goal of Recommender Systems: Relevance: 사용자에게 적합한 아이템을 추천하는 것. Novelty: 사용자에게 새로운 아이템을 추천하...
Projective Transformation(Homography) Homography: Projective Space $\mathbb{P}^2$의 한 점을 다른 Projective Space $\mathbb{P}^2$의 한 점으로 대응시키는 변환이다. 이때, 한 직선 위의 세 점 $\mathbf{x}_1, \mathbf{x}_2, \mathbf{x}...
문제 설명 문제 링크 정렬된 배열이 주어지고, 이 배열이 특정 인덱스에서 회전된 상태로 주어진다. 회전된 배열에서 특정 값을 찾는 문제이다. 배열은 중복되지 않는 정수로 이루어져 있다. 배열의 길이는 1 이상 5000 이하이며, 각 원소는 $-10^4$ 이상 $10^4$ 이하이다. 찾고자 하는 값은 배열에 반드시 존재한다. 배열은 ...
Projective Geometry 우리는 3차원 공간에 살고 있지만, 이미지가 표현하는 것은 2D 위치정보 뿐이다. 우리의 시각 지능은 2차원의 이미지를 3차원 위치 정보로 변환하여 세계를 인식한다. 우리 세계는 Euclid 공간이지만, 2D 이미지에 투영될 때는 Euclid 공간의 특성을 보존하지 않는다. 위 사진을 살펴보면, 만...
Optical Flow Optical Flow는 연속된 이미지 시퀀스에서 물체의 움직임을 추정하는 방법이다. 이때 Optical Flow는 Motion Field와는 전혀 다른 개념이다. Motion Field는 물체의 움직임을 나타내는 벡터 필드로, 물체의 속도와 방향을 나타낸다. 반면 Optical Flow는 빛의 흐름을 나타내는 벡터 필드로, ...
Segmentation Segmentation은 이미지에서 서로 다른 객체를 구분하는 작업을 의미한다. 이때, 단순한 Object Detection과 달리 Segmentation은 이미지의 각 픽셀에 대해 객체의 레이블을 할당하는 작업이다. 즉, Segmentation은 이미지의 각 픽셀에 대해 해당 픽셀이 어떤 객체에 속하는지를 판단하는 작업이다....