MViT 논문 리뷰 #MViT 리뷰 #AI 최신 논문 #vision 최신 논문 리뷰 (1) 썸네일형 리스트형 [꼼꼼하게 논문 읽기] Multiscale Vision Transformers 1 안녕하세요. WH입니다 오늘 리뷰해볼 논문은 2021 facebook에서 나온 논문인데요 Multiscale Vision transformers라는 논문입니다. 항상 해왔던 것 처럼 Related work까지 다루도록 할게요 Abstract MViT을 출시했다고 말을 하고 있는데요, 22년 구글 논문을 보시면 알겠지만 ( 22년이 더 최신이니까 말이 안맞긴하지만 여튼 ) multiscale을 적용했을 때, 더욱 성능이 좋았다고 했죠? 그럼 이것도 성능이 좋겠습니다만 보도록 하죠. 22년 구글에서 발표한 논문과 다른 점은, 계층 구조를 사용했다는 점이네요. spatial resolution을 감소시키는 반면에 계층적으로 채널을 확장시킨다고 하네요. 이 계층구조는 multiscale의 피라미드 feature.. 이전 1 다음