본문 바로가기

분류 전체보기

(161)
[꼼꼼하게 논문 읽기]Hidden Two-Stream Convolutional Networks for Action Recognition ( 2018 ) 이제 천천히 action recognition으로 한번 가봅시다 optical flow도 확보되었겠다 시작해볼게요 Abstract human actions의 videos를 Analyzing 하는 것은 video frames 중에 temporal relationships를 이해하는 것을 포함하죠. SOTA action recognition approaches는 CNNS을 위한 pre-compute motion imformation을 pre-compute한 traditional optical flow estimation methods 의존하죠. ( 사실 당시까지만 해도 성능이 안나옵니다만 여튼 ) 이런 two-stage approach 는 computationally expensive, storage dem..
[꼼꼼하게 논문 읽기] RAFT: Recurrent All-Pairs Field Transforms for Optical Flow ( 2020 ) 안녕하세요. WH입니다. RAFT 라는 모델에 대한 opticalflow estimation model인데요 2022 기준 SOTA 모델은 RAFT의 변형이 많기에 토대를 이루는 논문을 읽어보도록할게요 Abstract 저자들은 Recurrent All-Pairs Field Transforms (RAFT)를 도입합니다. 이는 optical flow를 위한 새로운 deep network architecture죠. RAFT는 per-pixel features를 추출하고 pixels의 all pairs에 대한 multi-scale 4D correlation volumes를 만들죠. 그리고 반복적으로 flow field를 recurrent unit을 통해 업데이트하는데, 이 unit은 correlation vou..
[꼼꼼하게 논문 읽기] High-Resolution Optical Flow from 1D Attention and Correlation(2021) 결국에 하드웨어 상의 문제로 pwc-net 사용이 안되네요. 하드웨어 api는 볼 방법이 없네요.. 그래서 이번에는 다른 논문을 검토해보고자 합니다. optical flow 필요하긴 한데 찾는게 쉽지가 않네요.. layer 수정도 필요하고 여튼 시작해봅시다. 다음 논문 역시 optical flow 관련 논문이 될것 같습니다. Abstract opitcal flow는 본질적으로 2D search problem이죠. 그리고 그에 따라 computational complexity가 search window에 따라 quadratically하게 증가하고, large displacements matching을 high-resolution에 대해 실현 불가하죠. 이 논문에서는, Transformers로 부터 영감을 ..
[꼼꼼하게 논문 읽기] You Only Watch Once: A Unified CNN Architecturefor Real-Time Spatiotemporal Action Localization ( 2021 ) 참..caffe를 사용해서 pwcnet 학습이 드디어 끝났네요 torch좀 쓰지 꼭 caffe가 필요하다해서.. 진짜 말그대로 개고생했습니다ㅋㅋ 3090에 cudnn8을 쓰기때문에 빌드부터 학습까지 쉽지가 않았네요. 뭐 우선은 끝냈으니까 다시 오랜만에 논문이나 읽어봅시다 오늘은 action recognition에 관한 논문입니다 3D CNN이라..못쓰겠네요..하 Abstract Spatiotemporal action localization은 information의 two sources를 designed architecture에 incorporation 해야 하죠. 두 information이란 (1)이전 frame으로부터 temporal information과 (2)key frame으로터 spatial i..
[꼼꼼하게 논문읽기]PWC-Net: CNNs for Optical Flow Using Pyramid, Warping, and Cost Volume 2018 안녕하세요. WH입니다 오랜만에 글을 쓰네요 이것저것 일이 많아서요 오늘은 optical flow에 관한 논문입니다. 이걸 왜 하냐, optical flow는 spatial information을 얻는 하나의 방법이죠 다음 프로젝트에 필요하기 때문에 정리하게 되었습니다. 원래는 opencv의 opticalflow를 활용하면 되지만 이번 하드웨어는 opencv를 지원하지 않거든요. C++로 구현하느니..모델을 쓰자는 생각에서 시작합니다. 18년 논문이긴 하지만 어쩌겠어요. 하드웨어가 기술을 못따라 가네요..여튼 함께보시죠 Abstract 저자들은 opitcal flow를 위한 compact하지만 effective CNN model인 PWC-Net을 제안합니다. PWC-Net은 간단하면서도 잘 설계된 원칙에..
[ 꼼꼼하게 논문 읽기 ] RepMLP: Re-parameterizing Convolutions into Fully-connected Layers for Image Recognition ( 2022 ) 이번주는 뭔가 너무 정신이 없고 바빠서 이제야 새로운 논문 리뷰를 하네요 무엇을 했냐면, yolov7을 darknet에 구현하고 학습을 돌리느라 정신이 없었어요. 여튼 시작해봅시다 yolov7에는 repConv가 사용되었는데 그 layer를 FClayer로 바꿔준다는 논문 한번 보겠습니다. Abstract 저자들은 RepMLP를 제안합니다. maulti layer perceptron stylen neural network building block for image recognition인데요. RepMLP는 FC layers의 series로 구성되어 있다고 하네요. convolutional layers와 비교해서, FC layers는 long-range dependencies와 positional pat..
[꼼꼼하게 논문 읽기]Person Re-identification in the wild(2017) 안녕하세요. WH입니다. 오늘은 re-identification 관련 논문입니다. re-identification은 tracking에서 object의 id에 관한 개념인데요. 함께 보시죠 Abstract 이 논문은 새로운 large-scale dataset과 raw video frame에서 end-to-end pedestrian detection과 person recognition에 대한 comprehesive baseline을 보여준다네요. 저자들의 baseline은 3 가지 issues를 다룹니다. : detector와 recoginizers의 various combinations에 대한 성능, overrall re-identification 향상을 도와주는 pedestrian detection에 대..
[꼼꼼하게 논문 읽기]FairMOT: On the Fairness of Detection and Re-Identification in Multiple Object Tracking 2 ( 2021 ) 저번 글에 이어 리뷰하도록 할게요 저번 글이 기억나시 않으시면 아래 글을 참조해주세요 2022.07.13 - [AI 논문] - [꼼꼼하게 논문 읽기]FairMOT: On the Fairness of Detection and Re-Identification in Multiple Object Tracking 1 ( 2021 ) [꼼꼼하게 논문 읽기]FairMOT: On the Fairness of Detection and Re-Identification in Multiple Object Tracking 1 ( 2021 ) 안녕하세요. 얼마 전에 review 했던 논문이 있죠? 2022.07.08 - [AI 논문] - [ 꼼꼼하게 논문 읽기 ] Towards Real-Time Multi-Object Track..