코딩하는 해맑은 거북이

[컴퓨터비전] 컴퓨터비전 문제 영역 본문

AI

[컴퓨터비전] 컴퓨터비전 문제 영역

#CJE 2022. 7. 15.
해당 글은 아래의 2가지를 다룬다.
1. 컴퓨터 비전이란?
2. 컴퓨터 비전 문제 영역 19가지

- 컴퓨터 비전 (Computer Vision)

: 인간의 시각과 관련된 부분을 컴퓨터 알고리즘을 이용해서 구현하는 방법을 연구하는 분야.

 

- 컴퓨터비전의 대표적인 문제 : 이미지 분류(Image Classification), Semantic Image Segmentation, 물체 검출(Object Detection) 등

- 컴퓨터 비전 문제를 풀기 위해선 딥러닝의 여러 구조 중 CNN이 많이 사용된다.

 

- 컴퓨터 비전 문제 영역

1) Image Classification

: input image가 어떤 label에 대응되는지 분류(Classification)를 수행하는 문제 영역

ex) 고양이와 강아지 이미지 분류

CIFAR-10 데이터셋 예시

 

2) Face Detection

: 얼굴이 있는 영역의 위치정보를 Bounding-Box로 찾는 문제 영역

 

3) Face Alignment

: 얼굴의 특징 영역(눈, 코, 입)을 포인트(Landmark)로 찾는 문제 영역

 

4) Steering Angle Prediction

: 자동차의 적합한 Steering Angle 조작값을 예측하는 문제 영역

 

5) Super Resolution

: 저해상도 이미지를 input으로 받으면 이를 고해상도 이미지로 변경해주는 문제 영역

 

6) Object Detection

: 물체가 있는 영역의 위치 정보를 Bounding-Box로 찾고 Bounding-Box 내에 존재하는 사물들의 Label을 분류하는 문제 영역

 

 

7) Image Captioning

: 이미지에 대한 설명문을 자동 생성하는 문제 영역

 

8) Neural Style Transfer

: 콘텐츠 이미지에 스타일 이미지를 덧씌운 합성 이미지를 만드는 문제 영역

 

9) Generative Model

: 트레이닝 데이터의 분포를 학습하고 이를 이용해서 새로운 가짜 데이터를 생성하는 문제 영역

 

10) Semantic Image Segmentation

: 이미지의 전체 픽셀에 대한 분류를 수행하는 문제 영역

 

11) Brain Tumor Segmentation

: Semantic Image Segmentation을 이용해서 Brain 이미지 내의 종양(Tumor)이 있는 부분을 자동 분류하는 문제 영역

 

12) Face Recognition

: Face Detection이 진행된 상태에서 해당 Bounding-box 위치에 존재하는 얼굴이 누구인지 신원(Identity)을 식별하는 문제 영역

 

13) Face Verification

: 두개의 얼굴 이미지를 인풋으로 받아서 해당 얼굴 이미지가 동일인물인지 아닌지를 판단하는 문제 영역

 

14) Face Hallucination

: 얼굴 이미지에 대한 Super Resolution을 수행하는 문제 영역

 

15) Text Detection

: 이미지 내에 텍스트가 존재하는 영역의 위치 정보를 Bounding-box로 찾는 문제 영역

 

16) Optical Character Recognition(OCR)

:  Text Detection이 수행된 Bounding-box 내에 존재하는 글자가 어떤 글자인지를 인식하는 문제 영역

 

17) License Plate Detection

: Text Detection과 OCR을 이용해서 차량 번호판을 인식하는 문제 영역

 

 

18) Defect Detection

: 공정 과정상에 불량(Defect)을 검출하는 문제 영역

 

19) Human Pose Estimation

: 인간의 중요 신체 부위를 Keypoint라는 점으로 추정해서 현재 포즈를 예측하는 문제 영역

 

 

 

 

Comments