나의 하루
수지니의 공부 기록 일지

본문 바로가기

논문리뷰

[간단 논문 리뷰]EfficientViT-SAM: Accelerated Segment Anything Model Without Performance Loss 표 설명X축 : gpu 시간 당 이미지 수 Y축 : Zero-Shot COCO mAP 지수현재 EfficientViT-SAM-XL이 가장 높은 수치를 기록했다. 이 논문은 EfficientViT-SAM-XL을 중심으로 기술되었음을 알려드리고 시작한다. SAM(Segmentation Anything Model) 특징(1) SAM의 강력한 Zero-Shot 전이 학습 성능과 다양한 응용 분야SAM은 추가적인 학습 없이도(Zero-Shot) 다양한 비전 작업에서 뛰어난 성능을 보임.(2) 이미지 분할 분야를 포함해 다양한 세분화(Segmentation) 작업을 포함하여 여러 비전 작업에서 활용이미지 복원(Image Restoration) ,이미지 인페인팅(Inpainting, 손상된 이미지 복원) ,이미지 편.. 더보기
Focal Loss for Dense Object Detection(Retinanet paper) 논문 리뷰 사진에서 얻어가야하는 내용Focal Loss는 아주 많은 easy background example가 있는 상황에서 매우 정확한 밀도의 물체 감지기를 훈련할 수 있게 해준다.사진에서 알아가야할 내용RetinaNet을 사용해 최대 40.8 AP까지 달성했다는 것이다.AP의 정의 COCO data 사용시 정확도 Focal loss학습 시 앞/배경 클래스 사이의 심한 불균형을 해결하기 위해 나왔다.cross entropy (CE) loss for binary classificationy ∈ {±1}은 binary classification 를 지정하고 p ∈ [0, 1]은 라벨 y = 1인 클래스에 대한 모델의 추정 확률이다. notational convenience을 위해서define pt:  pt를 구한 후 C.. 더보기
GRCNN: Graph Recognition Convolutional Neural Network for Synthesizing Programs from FlowCharts 논문 정리 Introduction최근 이미지 생성하는대에 있어 코딩과정이 많이 줄었다. 프로그램 합성을 위해선 specification이 필요하다. specification의 역할은 사용자 의도를 정확하게 표현할 수 있으며 연역적 프로그램 합성에 사용된다.사람들의 의도를 정확히 알기위해선 여러개의 프로그램을 사용할 수 있다. GRCNN(Graph  Recognition  Convolutional  Neural Network)flow chart를 input으로 사용CNN으로 이미지를 분석하고 얻은 정보를 프로그램 코드에 적용하기 위해 사용end-to-end network :  convolution feature vector의 계산을 공유하고 에지 및 노드 정보를 동시에 예측한다.특징neural networks 와 다.. 더보기