Search

Visual Perception

링크
Category
Keywords
상위 개념
하위 개념
속성
Subcategory
날짜
Cornea : 각막
Pupil : 동공
Iris : 홍채
Lens : 수정체
Retina : 망막
Fovea : 중심와
Blind spot : 맹점
Optic Nerve : 시신경
5가지 구성 요소가 있다.
1.
Photoreceptors : 광수용체
a.
Rods
b.
Cones
2.
Horizontal cells : 억제 및 제한
3.
Bipolar cells : 연결다리
4.
Amacrine cells : 신경전달물질 생성
5.
Ganglion cell : 신경절

Photoreceptors

Rods : 간상세포

respond to dim light for BW vision
형태와 움직임에 반응한다.
Color Vision에 관여 X

Cones : 원추세포

Color vision 인식가능.
S(blue), M(green), L(red) 세 타입으로 나뉨
망막의 가운데 위치한다.
Spectral response of Cones
Three types of Cones
S : Short wavelength of visible light
M : Middle wavelength ~
L : long wavelength ~
Simultaneous Contrast
배경에 따라 같은 색을 다른 색으로 인지
Perceived Brightness
색의 경계면에서 사람이 느끼는 값의 차이는 더 크게 느껴짐
Brightness addaptation
사람은 밝기 변화가 일어나면 서서히 적응해 나간다.
Optical illusion 착시

Color representation

보통 LMS 색 공간을 이용해서 표현한다.
물론 아닌 경우도 있쥐
TV, camera, display monitor → RGB
publishing industry → CMYK
broadcasting → YIQ
HSI color space : Hue_색, Saturation_명도, Intensity_명도
XYZ, LAB, YUV, YCbCr ...

RGB

빛의 합성

CMYK

Cyan, Magenta, Yellow ( R, G, B)
색의 삼원색에 K(black)이 추가. RGB의 보색이다.
다른 삼색을 섞어서 만든 검정보다 더 순수한 검정임. 이는 섞은 것 보다 잉크값이 싸기도 함
K = min(C, M, Y)
위의 공식은 표현해야하는 색상에서 CMK의 비율이 만약 20:30:50의 비율로 만들 수 있다고 하면
이 비율에서 최소 값인 20을 K(black)으로 대체하고 나머지 비율을 0:10:30으로 혼합하자 이런 너낌

HSI

표면색을 표현하는데 적합하다.
Hue 색상
Color spectrum을 나타낸다.
Saturation 채도
Color의 purity를 나타낸다.
채도가 높으면 Gray, White, Black에서 멀어진 색상이다.
Intensity 명도
Color의 밝기를 나타낸다. 0 : 검정 1 : 흰색
RGB
1
0
0
0
1
0
1
1
0
1
1
1
HSI
0
1
1/3
120
1
1/3
60
1
2/3
x _cos(0/0)은 성립 x
0
1
Loading PDF…

YCbCr

Y : luminance_밝기 정보 → Rod
Y = 0.299*R + 0.587*G + 0.114*B (인간 눈은 green에 가장 민감하기 때문엔 가중치 더)
Cb : blueness 정보 → Cone
Cb = -0.16874*R - 0.33216*G + 0.5*B
Cr : redness 정보 → Cone
Cr = 0.5*R - 0.41869*G - 0.08131*B
밝기 정보를 색 정보에서 분리를 하게 되는데
Y와 CbCr을 감지하는 세포가 다르다보니 Y의 해상도를 낮춰도 Cone은 CbCr은 잘 감지를 할 수가 있음
JEPG, MPEG에서 사용된다.

Image Capture

Photo diode : 0-D sensor, voltage waveform is porportional to light
Scanner : 1-D img sensor
Camera : 2-D img sensor
CCD_Charge Coupled Device
CMOS_Complementary Metal-Oxide Semiconductor
CCD 작동 원리
1.
Converting photon to an electrical charge
2.
moving this charge at the proper time

image acquisition process

디지털 이미지를 만드는데 있어서 사용되는 함수 f(x, y)가 있다고 하면 이는 공간, 너비적으로 디지털화 되어야 하며 0<f(x,y)<0 < f(x, y) < \infin 와 같은 범위를 가진다
또 이 함수는 illumination과 reflectance요소로 표현할 수도 있다.
f(x,y)=I(x,y)r(x,y)f(x, y) = I(x, y) r(x, y) , 0<r(x,y)<10< r(x, y) < 1
3요소 : 빛, 피사체, 눈
I(x, y)의 범위
clear day : 90,000 lm/m^2 (초 9만개)
cloudy day : 10,000 lm/m^2
full moon : 0.1 lm/m^2
office : 1000 lm/m^2
r(x,y)의 범위
black velvet : 0.01
stainless steel : 0.65
flat white wall paint : 0.8
silver plated medal : 0.9
snow : 0.93

Sampling and Quantization

spatial resolution : number of rows and columns
gray level resolution : 0 ≤ f(x,y) ≤ L, L = 2^k-1 (L = 1, 63, 255, 1023)
Image representation
f(x,y) : 2-D still image
f(x,y,z) : 3-D still img
f(x,y,t) : 2-D moving img, video sequence
f(x,y,λ)f(x,y,\lambda) : 2-D color img
그럼 여기서 f()의 의미는 뭘까?
Brightness of the subject
TV camera, scanner
Transmission factor of the subjects, especially body
X-ray, Ultrasonic img
Distance between subject and detector
sonar img, radar
temperature of the subjects
infrared camera
다운 샘플링

Sampling theorem : 표본화 정리

샘플링을 어떻게 하는가에 대한 이론이다.
만약 x(t)가 B hertz 이상의 주파수가 없다면 샘플링은 1/2B의 주파수로 해야지 영상편집이 가능하다.
1024x1024 → 512x512 → 256x256 ..
filtering 안하면 샘플링한 후에 이미지가 이상해질수도..

Digital img storage

이미지의 디지털화 과정에선 행렬의 크기인 M,N이 필요하고 gray level의 이산 값인 L이 필요함.
L은 2의 배수임 L=2kL = 2^k (k=bit)
이런 이미지를 저장하는 데에는 b = M x N x k 만큼의 용량이 필요

Image format

PNM : Portable Animal Format
기본적인 이미지 포맷.
PBM : portable bitmaps - binary img file
PGM : portable gray map - gray-level img
PPM : portable pixel map - color img
PNM file format
PNM header + img data
PNM header :
Magic number - 이미지의 타입, 저장된 방법
Image Width
Image Height
Max - gray scale/ color channel value의 최대값 (PBM에서는 X)
Header는 ASCII 형태로 저장된다.
각 field는 빈칸으로 구분된다.
Image data : ASCII or raw Binary → 영상크기가 작으면 아스키로 저장한다.
#은 comment