Search
🟨

컴퓨터가 이미지를 해석하는 방법

카테고리
세부 카테고리
환경
작성 상태
앞선 내용
이어지는 내용
파일
우리는 눈이라는 매체를 통해 객체를 바라보게 됩니다.
하지만 컴퓨터는 인간과는 다른 방법으로 객체를 바라보게 되는데요.
우리가 보는 이 화면, 사진, 동영상은 모두 컴퓨터 화면에서 나오는 빛을 통해 보게 됩니다.
이 빛은 RGB의 적절한 배합을 통해 표현이 되는 것이죠.
이 화면을 이루는 수 많은 픽셀들이 RGB로 표현한 것을 우리가 눈으로 보게 된다는 말인데요
컴퓨터는 이와 같이 이미지를 RGB 값을 통해 인식하게 됩니다.
RGB 값은 red, green, blue가 각각 0~255 사이의 숫자 값을 통해 출력됩니다.
흰색은 이 세개의 값이 모두 (255, 255, 255)인 것이고, 검은색은 (0,0,0)으로 표현이 됩니다.
그렇기 때문에 딥러닝에 있어서 이 3가지 값을 잘 활용하기 위해 channel 이란 표현을 쓰게 되는데
보통 3 channel input이다 라고 하면
다음과 같이 하나의 이미지에 표현된 R, G, B 각각의 값들이 세개로 나뉘어 져서 NN에 입력이 됩니다.
흑백이미지는 어떻게 될까요?
흑백이미지는 보통 1 channel입니다. 단순히 검정-흰색의 조합이기 때문입니다.