Kernel이후 Flatten을 하면 안되는 이유
신경망의 성능 개선
CV(Computer vision)에서 다루는 문제로는 크게 Classification, Localization, Segmentation으로 3가지가 있다
Classficiation(분류) : image를 보고 해당 image의 object가 무엇인지 예측하는 문제
ex) 강아지 image를 보고 강아지인지 맞추는 것
→ AlexNet / VGG / ResNet(ILSVRC challenge model)
Localization/Detection(발견) : image안에 object들이 어디에 있는지 찾아내는 문제
Object가 있는 곳에 bounding box를 그리는 방식으로 표시
→ R-CNN / Fast R-CNN / Faster R-CNN
Segmentation(분할) : Detection보다 더 detatil하게 image의 pixel단위로 찾아내고 분류하는 문제
즉, image를 보고 classification이외에 추가적으로 그 장면을 완벽하게 이해해야 하는 어려운 문제
→ FCN / DeepLab (Google의 Pixel2 phone에 적용 = 사람을 찍을 때 사람을 찾아내 사람 이외의 배경은 흐리게 함)
Semantic Segmentation VS Object Detection
= Object Detection은 image 내에서 object들을 검출한 것을 직사각형의 bounding box로 묶어서 표현
= Semantic Segmentation은 각자 다른 class에 속하는 물체들을 좀 더 정확하게 pixel 단위로 분할해서 표현
==========================================================
Semantic Segmentation VS Instance Segmentation