[논문] PIFuHD: Multi-Level Pixel-Aligned Implicit Function for High-Resolution 3D Human Digitization
·
Paper Review
https://shunsukesaito.github.io/PIFuHD/https://www.youtube.com/watch?v=uEDqCxvF5ycAbstractimage-based 3D human shape estimation은 Deep Neural Network의 등장으로 급격히 발전했다. 하지만, real world setting에서는 input image의 detail을 살리는데 어려움을 겪는데, 이 논문의 저자들은 이러한 어려움의 원인을 2가지 conflicting requirements에서 찾았다.Accurate predictions require large context, but precise predictions require high resolutionDue to memory limita..
[논문] PIFu: Pixel-Aligned Implicit Function for High-Resolution Clothed Human Digitization
·
Paper Review
https://shunsukesaito.github.io/PIFu/AbstractWhat if PIFu?An implicit representation that locally aligns pixels of 2D images with the global context of their corresponding 3D object→ End-to-End deep learning method for digitizing highly detailed clothed humans that can infer both 3D surface and texture매우 복잡한 shape [hairstyles, clothing …] 뿐만 아니라 이것들의 변화나 변형도 unified way로 digitize할 수 있다PIFu는 사람의 ..
[논문] Deep Reinforcement Learning with Double Q-learning [a.k.a DDQN]
·
Paper Review
AbstractQ-Learning algorithm의 경우 특정 조건에서 action value를 과대평가하는 것으로 알려져 있다.https://arxiv.org/abs/1312.5602 Playing Atari with Deep Reinforcement LearningWe present the first deep learning model to successfully learn control policies directly from high-dimensional sensory input using reinforcement learning. The model is a convolutional neural network, trained with a variant of Q-learning, whose inp..
[논문] Emerging Properties in Self-Supervised Vision Transformers [a.k.a DINO]
·
Paper Review
이전 Posting에서 Vision Transformer에 대해 다룬 적이 있었다.2024.09.11 - [Paper Review] - [논문] Transformer in Computer Vision [논문] Transformer in Computer Vision2024.09.10 - [Paper Review] - [논문] Segmentation이번 posting에서는 NLP에서 성능이 매우 좋다는 것이 증명된 Transformer를 vision task로 가져온 논문 3편에 대해 요약을 할 것이다.ViT [Vision Transformer]https://arxiv.orgphj6724.tistory.com이번 posting에서는 Vision Transformer에 Self-supervised learni..
[논문] Human Pose Estimation
·
Paper Review
What is Pose Estimation?Pose Estimation이라는 말은 컴퓨터가 이미지나 비디오에서 사람의 pose를 예측하는 task를 의미한다. Pose Estimation의 경우 object의 위치를 알아야 하고, 그 object에 대해 estimate를 해야 하기 때문에 localizing과 estimating 과정으로 진행이 된다. 이 분야의 경우 최근에는 사람 뿐 만아니라 동물이나 자동차, 카메라 등 여러 분야에 적용이 되는데 이 review에서는 Human Pose Estimation [HPE]만 다루도록 하겠다.HPE의 종류를 보면 위의 그림과 같다.2D Pose Estimation2D Pose Estimation은 흔히 접할 수 있는 2차원 이미지, 비디오에서 pose esti..
[논문] Transformer in Computer Vision
·
Paper Review
2024.09.10 - [Paper Review] - [논문] Segmentation이번 posting에서는 NLP에서 성능이 매우 좋다는 것이 증명된 Transformer를 vision task로 가져온 논문 3편에 대해 요약을 할 것이다.ViT [Vision Transformer]https://arxiv.org/abs/2010.11929[An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale An Image is Worth 16x16 Words: Transformers for Image Recognition at ScaleWhile the Transformer architecture has become the de-fact..