하이레벨적으로 아직도 헷갈리는 것 같아서 정리해보았다. 즉, Convolution Filter들이 단계별로 복잡한 특징을 뽑아내고, 마지막에 그 특징들을 조합해 ' 컵'. '사람' 과 같은 클래스를 알아맞히는 방법이 어떻게 진행되는거지? 일단 CNN 큰 흐름Input : 이미지를 픽셀 단위로 입력 받음.Feature Extraction : 여러 단계의 Convolution과 Pooling을 거치면서, 이미지 안의 'Features'들 예를 들어, edges, textures, shapes 들을 뽑아냄.Classification : 마지막에 Fully Connected Layer(FC Layer)나 Global Average Pooling 등을 통해 "이 이미지의 최종 feature vector가 어떤 c..

Depth estimation 분야에 대해 좀 자세히 공부해보고 싶어서 survey 부터 찾아보고 있는 중이다.우선 첫 번째로 발견한 survey 논문에 대해서 서술해보려고 한다.자세하게 파고드는 건 처음이라 미숙한 점이 많을 것 같다. (댓글로 지적해주시면 감사하겠습니다ㅜ) Survey 논문이 있긴 있는데 뭔가 인용 횟수도 적고 인증된 느낌의 survey는 아닌 것 같아서 추후에는 이 benchmark 들의 정확도 및 error 줄어드는 이 flow를 따라서 논문을 리뷰하고자 한다.1. Introduction우선 Monocular depth estimation은 잘 설정되지 않은 문제랑 본질적으로 애매모호한 문제가 있다고 한다. 여기서 Monocular depth estimation이란 다음 huggi..