본문 바로가기

반응형

AI 논문

(59)
[ 꼼꼼하게 논문 읽기 ] DG-STGCN: Dynamic Spatial-Temporal Modeling for Skeleton-based Action Recognition ( 2022 ) 정말 오랜만에 글을 쓰는 것 같네요. 정말정말 저엉말 바빴어요 배포 기간동안은 성능 검증에, 버그 fix에 고도화에 아주 미쳐버리는줄 알았죠 여튼 오랜만에 뵈어요 새해복 많이 받으시고 시작할게요 Abstract Graph convolution networks 는 skeleton-based action recogntion에 광범위하게 사용되어 왔죠. 저자들은 현존하는 GCN-based approaches가 대게 prescrbed graphical structures에 의존한다는 걸 알았다고 합니다. 그리고 그 사실은 joints간의 복잡한 correlations를 capture하는 유연성에 제한을 걸죠. 저자들은 skeleton-based action recognition을 위한 새로운 framework를..
[ 꼼꼼하게 논문 읽기 ]SimpleRecon:3D Reconstruction Without 3D Convolutions ( 2022 ) 안녕하세요 wh입니다. 말도 안되는 요구를 받았지만 요구를 받으면 해결해봐야지요. 그래서 필요한 논문을 가져왔습니다. Abstract 전통적으로, posed images로 부터 3D indoor scene reconstruction은 두 가지 방식으로 발생했죠: per-image depth estimation인데 이는 depth merging과 surface reconstruction이 뒤따르죠. 최근 family of mehtos는 final 3D volumeric feature space에서 직접 reconstruction을 perform해왔죠. 이 methods가 impressive reconstruction results를 보여주는 반면에, 이들은 expensive 3D convolutional ..
[ 꼼꼼하게 논문 읽기 ] Deformable Convolution Networks ( 2017 ) 논문을 읽은 때는 항상 즐겁죠 적용할 때는 다른 이야기지만요 왜 보냐 아마도 st-gcn 논문을 볼 때 gcn에서 이를 언급했던 것이라 정리 차원에서 봅니다. CenterNet에서도 나왔죠. upsample layer 앞에서 deformable Convolution layer를 썻다고 했으니까요. 그게 뭐길래, 그죠? 시작합니다. Abstract CNNs는 본질적으로 geometric transformations를 model하도록 제한되어 있는데, 이는 their building modules에서 fixed geometric structures 때문이죠. 이 논문에서, 저자들은 새로운 두 가지 modules를 도입하죠. 이 modules는 CNNs의 transformation modeling capabi..
[ 꼼꼼하게 논문 읽기 ] Deep Layer Aggregation ( 2019 ) CenterNet의 backbone 중에는 DLA-34가 있죠. DLA는 backbone의 핵심 아이디어가 설명되었던 논문인데요 한번 봅시다. Abstract visual recognition은 low level에서 high level 까지 rich representations, small 부터 large까지의 scales, fine부터 coarse한 resolutions를 요구하죠. 심지어 CNN에서 feature의 depth를 가지고, 고립된 layer는 충분하지 않죠 : 이런 representations를 compounding 하고 aggregating하는 것은 what and where에 대한 inference를 향상시키죠. Architectural efforts가 network backbones..
[ 꼼꼼하게 논문 읽기 ] Tracking Objects as Points ( 2020 ) 이번 논문은 center net의 확장판 이라고보면 되겠습니다. 오랜만에 보는 tracking 논문이네요 tracking 필요하면 봐야죠. 생각할 게 많네요 시작할게요 Abstract Tracking은 space와 time에 따라 following interest points의 기술이었죠. 이것은 deep networks가 rise로 인해 변했습니다. 요즘, tracking은 object detection에 temporal association으로 뒤이어 나오는 흔희 tracking-by-detection으로 알려진 pipelines로 dominated되죠. 저자들은 simultanesous detection 하고 tracking alrgorithm을 제안하는 데, 이는 SOTA 보다 simpler, f..
[ 꼼꼼하게 논문 읽기 ] Objects as Points ( 2019 ) Centernet 공식 github에 있는 논문이죠 앞에서 다룬 CenterNet 논문도 관련 논문이지만 이 논문은 공식 github에 있는 논문이기 때문에 한번 보도록하죠 Abstract Detection은 objects를 axis-aligned boxes로써 identifies하죠. Most successful object detectors는 potential object locations의 exhaustive list를 enumerate하고 각각을 classify 하죠. 이런 방식은 wasteful하고 inefficient, 하며 additional post-processing을 requires 합니다. 이 논문에서는, 다른 approach를 채택하는데요. object를 single point로써 ..
[ 꼼꼼하게 논문 읽기 ] CenterNet: Keypoint Triplets for Object Detection ( 2019 ) Background 시작하기에 앞서, 왜 갑자기 Detection 논문을 읽는지에 대해, 잠깐 짚고 넘어가려고 합니다. skeleton based model의 큰 문제점은 무엇일까요? 정확도? 속도? 이를 다따지기 전에, single person과 multi person interaction에 대한 action만을 recognize 할 수 있다는 거죠. 그럼 내가 제품을 상용화해야하는데, edge device가 single or multi person만 추론할 수 있다? 음..아무도 안쓰겠죠? 그래서 이를 detection의 two stream 방식으로 system을 구성하기 위해 이 논문을 보게 된거죠. 물론 보기야 봤었지만, 정리를 한다는 것은 제가 프로젝트에 고려하겠다는 말과 같다고 보시면 됩니다...
[ 꼼꼼하게 논문읽기 ]Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition( 2018 ) 이번 논문은 st-gcn이 human pose에 관련되어 나온 논문입니다 봐야할 부분이 있어서 가져왔지만 skip 없이 같이 보도록하죠 Abstract human body skeletons의 Dynamics는 human action recognition에 대한 중요한 정보를 convey하죠. skelethons를 modeling하는데 있어 Conventional approaches는 hand-crafted parts 나 traversal rules를 활용하는 것이죠. 따라서 이는 limited expressive power 의 문제와 generalization의 difficulties의 문제를 야기하죠. 이 논문에서는, ST-GCN이라 불리는 dynamic skeletons의 새로운 model을 제안합니..