우리는 눈이라는 매체를 통해 객체를 바라보게 됩니다.
하지만 컴퓨터는 인간과는 다른 방법으로 객체를 바라보게 되는데요.
우리가 보는 이 화면, 사진, 동영상은 모두 컴퓨터 화면에서 나오는 빛을 통해 보게 됩니다.
이 빛은 RGB의 적절한 배합을 통해 표현이 되는 것이죠.
이 화면을 이루는 수 많은 픽셀들이 RGB로 표현한 것을 우리가 눈으로 보게 된다는 말인데요
컴퓨터는 이와 같이 이미지를 RGB 값을 통해 인식하게 됩니다.
RGB 값은 red, green, blue가 각각 0~255 사이의 숫자 값을 통해 출력됩니다.
흰색은 이 세개의 값이 모두 (255, 255, 255)인 것이고, 검은색은 (0,0,0)으로 표현이 됩니다.
그렇기 때문에 딥러닝에 있어서 이 3가지 값을 잘 활용하기 위해 channel 이란 표현을 쓰게 되는데
보통 3 channel input이다 라고 하면
다음과 같이 하나의 이미지에 표현된 R, G, B 각각의 값들이 세개로 나뉘어 져서 NN에 입력이 됩니다.
흑백이미지는 어떻게 될까요?
흑백이미지는 보통 1 channel입니다. 단순히 검정-흰색의 조합이기 때문입니다.